Subscribe to SOOFTWARE

Stay up to date! Get all the latest & greatest posts delivered straight to your inbox

nlp

A collection of 48 posts

RLHF는 수다쟁이를 만든다?! (Does RLHF Breed Verbose Chatterboxes?!) cover image
nlp, rlhf, 

RLHF는 수다쟁이를 만든다?! (Does RLHF Breed Verbose Chatterboxes?!)

RLHF는 수다쟁이를 만든다?! (Does RLHF Breed Verbose Chatterboxes?!) RLHF(Reinforcement Learning from Human Feedback)는 OpenAI의 ChatGPT…

LLM Paper Abstract - 2023.12 cover image
nlp, 

LLM Paper Abstract - 2023.12

LLM Paper Abstract - 2023.12 LLM…

What is MoE? (Mixture of Experts) cover image
nlp, mixtral, 

What is MoE? (Mixture of Experts)

What it MoE? (Mixture of Experts) 현존 최강 LLM인 GPT-4에서 “MoE (Mixture of Experts)” 방식을 채택하여 사용하고 있다고 알려졌는데요, 최근 AI계의 뜨거운 감자 Mistral AI…

LLM Paper Abstract - 2023.11 cover image
nlp, 

LLM Paper Abstract - 2023.11

LLM Paper Abstract - 2023.11 LLM…

LLM Paper Abstract - 2023.10 cover image
nlp, 

LLM Paper Abstract - 2023.10

LLM Paper Abstract - 2023.10 LLM…

Findings of EMNLP 2023 Accept cover image
nlp, record, 

Findings of EMNLP 2023 Accept

Findings of EMNLP 2023 - Accept 공동 1저자로 참여한 “A Korean News Comments Dataset with Target-Specific Offensiveness Ratings” 논문이 Findings of…

LLaMA2 cover image
nlp, paper, 

LLaMA2

LLaMA2 Meta(전 Facebook)가 이번 7월 18일에 LLaMA2를 공개했습니다. 🎉 LLaMA2 관련 내용이 담긴 논문 과 함께 7B, 13B, 70B 모델을 공개했습니다. 이전 LLaMA와 다르게 LLaMA…

Huggingface PEFT (Parameter-Efficient Fine-Tuning) cover image
huggingface, nlp, lora, 

Huggingface PEFT (Parameter-Efficient Fine-Tuning)

Huggingface PEFT (Parameter-Efficient Fine-Tuning) 허깅페이스에서 나온 PEFT라는 라이브러리인데 LoRA, Prefix Tuning, P-Tuing, Prompt Tuning…

Sooftware Serving - Kernl cover image
nlp, serving, 

Sooftware Serving - Kernl

Sooftware Serving - Kernl ELS-RD (Lefebvre Dalloz Services) 라는 단체에서 Kernl 이라는 좋은 Inference Enginer을 내주었습니다! PyTorch 기반의 Transformer…

Sooftware Serving - Huggingface Optimum cover image
huggingface, nlp, serving, 

Sooftware Serving - Huggingface Optimum

Sooftware Serving - Huggingface Optimum 허깅페이스에서 나온 Transformers의 Extension 라이브러리이다. 목적은 모델 학습 및 인퍼런스를 더욱 빠르게 해주기 위한 라이브러리이다. Exporting…

Sooftware Serving - Terminology cover image
nlp, serving, 

Sooftware Serving - Terminology

Sooftware Serving - Terminology NLP…

Sooftware Serving - Triton Inference Server cover image
nlp, serving, 

Sooftware Serving - Triton Inference Server

Sooftware Serving - Triton Inference Server Triton Inference Server는 인공지능 모델의 인퍼런스를 도와주는 오픈소스 소프트웨어다. 다양한 프레임워크(TensorRT, TensorFlow…

Sooftware NLP - Mecab 설치 & 사용자 정의 사전 추가 cover image
nlp, environment, 

Sooftware NLP - Mecab 설치 & 사용자 정의 사전 추가

Mecab 설치 & 사용자 정의 사전 추가 Mecab은 대표적인 형태소 분석기입니다. 한국어 형태소 분석기로 유명합니다만, Mecab은 본래 일본의 Taku Kudo…

N행시를 지어주는 인공지능이 있다?! TUNiBridge N행시 서비스! cover image
nlp, service, 

N행시를 지어주는 인공지능이 있다?! TUNiBridge N행시 서비스!

N행시를 지어주는 인공지능이 있다?! TUNiBridge N행시 서비스! 한국 사람이라면 누구나 한 번쯤은 N행시를 만들어본 경험이 있을겁니다. 예능에서도 많이 등장하고, 회사에서, 군대에서, 혹은 연인 이름으로 N…

Sooftware NLP - 문장의 개체명을 분석해보자! 개체명 인식, Named Entity Recognition (NER) cover image
nlp, 

Sooftware NLP - 문장의 개체명을 분석해보자! 개체명 인식, Named Entity Recognition (NER)

Sooftware NLP - 문장의 개체명을 분석해보자! Named Entity Recognition (NER) NLP 기술을 이용하면 꽤나 정교한 텍스트 분석이 가능합니다. 텍스트 분석에서 빼놓으면 섭섭한 녀석이 개체명 인식(Named Entity…

Sooftware NLP - 혐오는 이제 그만! St. Patrick cover image
nlp, 

Sooftware NLP - 혐오는 이제 그만! St. Patrick

St. Patrick, the original safety engine by TUNiB, checks if the user text includes any toxic expressions or personal information and provides detailed reports.

Sooftware NLP - 한국어 사전학습 모델 (Korean Pre-trained Language Model) cover image
nlp, 

Sooftware NLP - 한국어 사전학습 모델 (Korean Pre-trained Language Model)

한국어 사전학습 모델 (Korean Pre-trained Language Model) 공개된 한국어 사전학습 모델을 기록합니다. 크게 아래 3개의 모델 계열로 구분했으며, 모델 사이즈는 정확하지 않을 수 있습니다. Encoder Model (BERT…

Sooftware NLP - Huggingface Datasets Methods cover image
nlp, 

Sooftware NLP - Huggingface Datasets Methods

Huggingface Datasets Methods 자주 사용하는 허깅페이스 datasets의 메서드를 정리합니다. load_datasets 허깅페이스 서버에 올라가 있는 데이터셋을 다운 받을 때 사용하는 메서드 save_to_disk…

Sooftware NLP - Decoding Strategy (디코딩 전략) cover image
nlp, 

Sooftware NLP - Decoding Strategy (디코딩 전략)

Decoding Strategy (디코딩 전략) 이번 포스팅에서는 자연어처리 모델의 디코딩 전략에 관해서 다뤄보려고 합니다. 디코딩이란 말처럼 디코딩은 디코더에서 수행하는 작업입니다. 즉, BERT와 같은 인코더 모델에서 사용하는게 아니라 GPT…

Sooftware NLP - Generation with Retrieval cover image
nlp, paper, 

Sooftware NLP - Generation with Retrieval

Generation with Retrieval 이번에 딥마인드에서 RETRO(Retrieval-Enhanced Transformer) 라는 모델을 내놓았습니다. 문서 retrieval + GPT 기반 모델인데, 7B 모델임에도 불구하고 2…

Sooftware NLP - Fine-grained Post-training for Improving Retrieval-based Dialogue Systems Paper Review cover image
nlp, paper, 

Sooftware NLP - Fine-grained Post-training for Improving Retrieval-based Dialogue Systems Paper Review

Fine-grained Post-training for Improving Retrieval-based Dialogue Systems Paper Review Paper: https://aclanthology.org/2021.naacl-main.12…

Sooftware NLP - GPT (Generative Pre-trained Transformer) cover image
nlp, parallelism, large-scale, lm, 

Sooftware NLP - GPT (Generative Pre-trained Transformer)

GPT (Generative Pre-trained Transformer) 1 gpt1 먼저 알아보고, gpt2에 대해 알아보겠습니다. GPT1 Improving Language Understanding by Generative Pre-Training…

Sooftware NLP - Large Scale LM (2) Distributed Programming cover image
nlp, parallelism, large-scale, lm, 

Sooftware NLP - Large Scale LM (2) Distributed Programming

Large Scale LM (2) Distributed Programming (작성중) 이 자료는 [해당 link…

Sooftware NLP - Large Scale LM (1) Background cover image
nlp, parallelism, large-scale, lm, 

Sooftware NLP - Large Scale LM (1) Background

Large Scale LM (1) Background 이 자료는 [해당 link…

Sooftware NLP - DeepSpeed Usage cover image
nlp, parallelism, large-scale, 

Sooftware NLP - DeepSpeed Usage

DeepSpeed Usage…

Sooftware NLP - NLP Metrics cover image
nlp, metric, 

Sooftware NLP - NLP Metrics

NLP Metrics Confusion Matrix Confusion Matrix는 분류 모델을 평가할때 모델이 얼마나 정밀한지, 얼마나 실용적인 분류를 해냈는지, 얼마나 정확한 분류를 해냈는지에 대한 모든 내용을 포함하고 있습니다. Accuracy…

Sooftware NLP - Page Rank란?? cover image
nlp, algorithm, 

Sooftware NLP - Page Rank란??

Page Rank 구글은 무엇을 기준으로 사이트를 보여주는 순서를 정할까요?? 구글에 특정 단어를 검색하면 다음과 같이 여러 사이트 들을 보여주는 것을 알 수 있습니다. 구글은 이런 사이트들에 점수를 부여해주는데, 여기서 부여된 점수들을 Page…

Sooftware NLP - Uniform Length Batching in PyTorch cover image
nlp, 

Sooftware NLP - Uniform Length Batching in PyTorch

Uniform Length Batching in PyTorch 전체 토큰 길이가 비슷한 인풋끼리 배치를 이루어주는 방식 그냥 랜덤하게 배치를 묶어주면 길이가 한 데이터를 제외하고는 평균 길이가 10인데 한 데이터 길이가 10…

Sooftware NLP - Textless NLP cover image
speech, nlp, paper, 

Sooftware NLP - Textless NLP

Textless NLP: Generating expressive speech from raw audio paper / code / pre-train model / blog Name: Generative Spoken Language Model (GSLM…

TUNiB Electra 공개 cover image
huggingface, nlp, record, 

TUNiB Electra 공개

이번에 저희 튜닙에서 공들여 만든 TUNiB Electra 모델을 공개했습니다 !! 🎉 🎉 이번 공개에서는 한-영 bilingual 모델과 한국어 모델을 각각 Small/Base 사이즈로 공개했으며, HuggingFace transformers…

Sooftware NLP - Tokenizer cover image
nlp, 

Sooftware NLP - Tokenizer

Tokenization 문장에서 의미있는 단위로 나누는 작업을 라고 한다. 문자 단위 토큰화 문자 단위로 토큰화를 하는 것이다. 한글 음절 수는 모두 11,172개이므로 알파벳, 숫자, 기호 등을 고려한다고 해도 단어 사전의 크기는 기껏해야 1…

정규표현식 (regex) cover image
nlp, 

정규표현식 (regex)

정규 표현식 정규표현식(regular expression)은 일종의 문자를 표현하는 공식으로, 특정 규칙이 있는 문자열 집합을 추출할 때 자주 사용되는 기법입니다. 주로 Prograaming Language나 Text Editor…

Sooftware NLP - Hugging Face Tokenizers cover image
huggingface, nlp, 

Sooftware NLP - Hugging Face Tokenizers

최근 NLP 토크나이저를 만드는데 가장 많이 사용되는 라이브러와 실제 사용이 가장 많이 되는 라이브러리로의 변환에 대한 코드를 담고 있습니다. 해당 내용은 버젼에서 수행되었습니다. Train 아래 코드는 wordpiece, char-bpe…

Sooftware NLP - Efficient Attention Paper Review cover image
nlp, paper, 

Sooftware NLP - Efficient Attention Paper Review

Efficient Attention: Attention with Linear Complexities Shen Zhuoran et al. Abstract Dot-product attention은 들어오는 인풋 길이에 따라 memory…

Sooftware NLP - Luna: Linear Unified Nested Attention cover image
nlp, paper, 

Sooftware NLP - Luna: Linear Unified Nested Attention

Luna: Linear Unified Nested Attention USC + CMU + Facebook AI 2021.06 code Abstract 트랜스포머의 Multi Headed Self Attention…

Sooftware NLP - P-Tuning Paper Review cover image
nlp, paper, 

Sooftware NLP - P-Tuning Paper Review

GPT Understands, Too Xiao Liu et al. Tsinghua University etc. arXiv pre-print Abstract GPT를 파인튜닝하는 방법은 Narural Language Understanding (NLU…

Sooftware NLP - Longformer Paper Review cover image
nlp, paper, 

Sooftware NLP - Longformer Paper Review

Longformer: The Long-Document Transformer Paper Code Iz Beltagy et al. Introduction 트랜스포머는 긴 시퀀스는 처리하지 못한다는 한계를 가지고 있음 이유는 시퀀스 길이에 O(n^…

Sooftware NLP - Pororo: A Deep Learning based Multilingual Natural Language Processing Library cover image
nlp, toolkit, record, 

Sooftware NLP - Pororo: A Deep Learning based Multilingual Natural Language Processing Library

Pororo: A Deep Learning based Multilingual Natural Language Processing Library Link: https://github.com/kakaobrain/pororo…

Sooftware NLP - Fairseq Hydra cover image
toolkit, nlp, 

Sooftware NLP - Fairseq Hydra

Fairseq’s Hydra Fairseq이 0.10.1로 버젼 업그레이드를 하면서 configuration 관리를 Hydra로 하게됨. Fairseq을 실행시키는 command line…

Sooftware NLP -  Megatron LM Paper Review cover image
nlp, parallelism, paper, 

Sooftware NLP - Megatron LM Paper Review

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism ​ Mohammad Shoeybi et al. 2019. NVIDIA Corp. ​ Summary…

Sooftware NLP - RoBERTa Paper Review cover image
nlp, paper, 

Sooftware NLP - RoBERTa Paper Review

RoBERTa paper / code Abstract BERT를 제대로 학습시키는 법을 제안 BERT는 엄청난 모델이지만, Original BERT 논문에서 하이퍼파라미터에 대한 실험이 제대로 진행되지 않음 BERT…

Sooftware NLP - Electra Paper Review cover image
nlp, paper, 

Sooftware NLP - Electra Paper Review

Below is just about everything you’ll need to style in the theme. Check the source code to see the many embedded elements within paragraphs…

Sooftware NLP - Beam Search (빔서치) cover image
nlp, 

Sooftware NLP - Beam Search (빔서치)

Sooftware NLP - Beam Search (빔서치) 본 포스팅은 “빔서치”에 대한 본질적인 개념보다는 Encoder-Decoder 모델 (Seq2seq…

Sooftware NLP - Attention Mechanism (어텐션 메커니즘) cover image
nlp, 

Sooftware NLP - Attention Mechanism (어텐션 메커니즘)

Sooftware NLP - Attention Mechanism (어텐션 메커니즘) 본 포스팅을 이해하기 위해서는 다음 글에 대한 이해가 선행되는 것이 좋습니다. RNN (Recurrent Neural Network) LSTM & GRU (Long…

Sooftware NLP - Seq2seq (Sequence to sequence) cover image
nlp, 

Sooftware NLP - Seq2seq (Sequence to sequence)

Sooftware NLP - Seq2seq (Sequence to sequence) 본 포스팅을 이해하기 위해서는 다음 글에 대한 이해가 선행되는 것이 좋습니다. RNN (Recurrent Neural Network) LSTM & GRU (Long…

Sooftware NLP - Teacher Forcing (티쳐포싱) cover image
nlp, 

Sooftware NLP - Teacher Forcing (티쳐포싱)

Sooftware NLP - Teacher Forcing (티쳐포싱) 본 포스팅을 이해하기 위해서는 다음 글에 대한 이해가 선행되는 것이 좋습니다. RNN (Recurrent Neural Network) LSTM & GRU (Long Short…

Sooftware NLP - LSTM & GRU cover image
nlp, 

Sooftware NLP - LSTM & GRU

Sooftware NLP - LSTM & GRU 본 포스팅을 이해가기 위해서는 아래 글에 대한 이해가 선행되는 것이 좋습니다. RNN (Recurrent Neural Network) LSTM 등장 배경 RNN…

Sooftware NLP - RNN (Recurrent Neural Network) cover image
nlp, 

Sooftware NLP - RNN (Recurrent Neural Network)

Sooftware NLP - RNN (Recurrent Neural Network) 본 포스팅을 이해하기 위해서는 피드포워드 네트워크에 대한 이해가 선행되는 것이 좋습니다. RNN의 등장 배경 RNN에 대해 알아보기 전에 RNN…