Subscribe to SOOFTWARE

Stay up to date! Get all the latest & greatest posts delivered straight to your inbox

SOOFTWARE

My Learning Journey in AI and Software Engineering

Welcome to sooftware.io cover image
welcome, 

Welcome to sooftware.io

Welcome to sooftware.io 안녕하세요! sooftware.io…

Agentic Context Engineering (ACE) Paper Review cover image
ai, agent, 

Agentic Context Engineering (ACE) Paper Review

Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models Paper Review 흥미로운 최신 AI Agent…

MoE(Mixture of Experts) 기초부터 DeepSeek 혁신까지 cover image
nlp, mixtral, 

MoE(Mixture of Experts) 기초부터 DeepSeek 혁신까지

MoE(Mixture of Experts) 기초부터 DeepSeek 혁신까지 작년 이맘때쯤 DeepSeek-V3가 저비용으로 엄청난 성능을 보이면서 화제가 되었습니다. 그 핵심 기술인 MoE(Mixture of Experts…

Throwback 2025 cover image
record, 

Throwback 2025

Throwback 2025 2020년 회고 글 2021년 회고 글 2023년 회고 글 2024년 회고 글 2025년 회고 글입니다! 202…

BERT는 사실 Diffusion 모델이였다?! cover image
nlp, diffusion, bert, chatgpt, 

BERT는 사실 Diffusion 모델이였다?!

BERT는 사실 Diffusion 모델이였다?! 최근 굉장히 흥미로운 글을 읽게되어 공유합니다. 원문 : link BERT와 Diffusion이 같은 방식이다?! NLP 연구자들에게 BERT는 너무 익숙한 모델입니다. 201…

LangGraph로 구현하는 RAG 시스템 실습 cover image
langchain, langgraph, openai, rag, 

LangGraph로 구현하는 RAG 시스템 실습

LangGraph로 구현하는 Self-Correcting RAG 시스템 이번 실습에서는 LangGraph를 활용하여 스스로 품질을 검증하고 개선하는 고급 RAG…

LangChain으로 구현하는 RAG 시스템 실습 cover image
langchain, rag, ai, llm, python, 

LangChain으로 구현하는 RAG 시스템 실습

LangChain으로 구현하는 RAG 시스템 실습 이번 실습에서는 LangChain을 활용하여 완전한 RAG 시스템을 구축해봅니다. 회사 정보를 담은 JSON 데이터를 기반으로 질문에 답변하는 AI 챗봇을 만들어볼게요!…

Throwback 2024 cover image
record, 

Throwback 2024

Throwback 2024 Throwback 2024 2020년 회고 글 2021년 회고 글 2023년 회고 글 어느덧 4번째 1년 회고글이자, 5년차 회고글입니다! 2024년은 유독 길게 느껴졌습니다. 202…

llama.cpp (On device llm inference tool) cover image
toolkit, llama, parallelism, ondevice, 

llama.cpp (On device llm inference tool)

llama.cpp (On device llm inference tool) 최근에 llama.cpp를 사용해봤는데, 상당히 편리하고 미래에 더 많이 쓰일 툴이라는 생각이 들어서 기록해둔다! llama.cpp란? 대표적인 오픈소스 LLM인 Meta…

[ELK] Elastic Search logstash - Nori 토크나이저 설정 cover image
toolkit, web, chatgpt, 

[ELK] Elastic Search logstash - Nori 토크나이저 설정

Elastic Search logstash - Nori 토크나이저 설정 이번에 회사에서 검색 기능을 구현하면서 Elastic Search를 다루게 됐다. 이 엔진을 다루면서 삽질을 많이 했는데, 다음에는 하지 않도록 기록용으로 남겨둔다. Elastic…

AI Joker 공개 cover image
record, 

AI Joker 공개

AI Joker 공개 이번에 회사에서 작업한 A.I. Joker 모델을 공개했습니다! Joker 모델은 한국어 Hate Speech를 생성하는 모델입니다. 최근 많은 LLM들이 나오고 있는 만큼 해당 모델들의 Safety…

단 30줄로 ChatGPT 웹페이지 만들기 (Streamlit chat_message) cover image
toolkit, web, chatgpt, 

단 30줄로 ChatGPT 웹페이지 만들기 (Streamlit chat_message)

단 30줄로 ChatGPT 웹페이지 만들기 (Streamlit chat_message) Streamlit은 파이썬 기반의 오픈소스 웹 UI 라이브러리입니다. 매우 간단한 코드로 손쉽게 웹페이지를 띄울 수 있어서 간단한 데모나 PoC…

GitHub Follow 500 달성!! cover image
record, 

GitHub Follow 500 달성!!

GitHub Follow 500 달성!! 최근에 깃허브 팔로워 500명을 달성했습니다! 🎉🎉 창업 이후에는 사실 깃허브 활동을 못하고 있었는데도, 꾸준히 팔로워가 늘어서 어느새 50…

Terabyte(TB) 단위 데이터 셔플링 - terashuf cover image
toolkit, environment, 

Terabyte(TB) 단위 데이터 셔플링 - terashuf

Terabyte(TB) 단위 데이터 셔플링 - terashuf 리눅스에서 TB 단위의 데이터를 line 기준으로 셔플링이 필요할 때가 (가끔) 있다. 직접 코딩해서 쓰기에는 메모리, 속도 등을 신경써야해서 생각보다 큰 작업인데, terashuf…

RLHF는 수다쟁이를 만든다?! (Does RLHF Breed Verbose Chatterboxes?!) cover image
nlp, rlhf, 

RLHF는 수다쟁이를 만든다?! (Does RLHF Breed Verbose Chatterboxes?!)

RLHF는 수다쟁이를 만든다?! (Does RLHF Breed Verbose Chatterboxes?!) RLHF(Reinforcement Learning from Human Feedback)는 OpenAI의 ChatGPT…

규칙 없음 (No Rules Rules) cover image
book, review, 

규칙 없음 (No Rules Rules)

규칙 없음 (No Rules Rules) ‘오징어게임’, ‘더 글로리’, ‘종이의 집’ 등으로 알려진 세계 최대 OTT(Over The Top) 플랫폼 ‘넷플릭스’는 이제는 국내에서도 누구나 알만한 서비스가 됐다. 2023년 1…

튜닙, AICA H100 * 8대 GPU 지원 선정 cover image
record, 

튜닙, AICA H100 * 8대 GPU 지원 선정

튜닙, AICA H100 * 8대 GPU 지원 선정 저희 튜닙이 인공지능산업융합사업단(AICA)에서 지원하는 ‘2024년 AI 데이터센터 서비스’ 사업에 선정되면서 1년간 H100 *…

튜닙, 삼성 C-Lab Outside 선정 & 사무실 이사 cover image
record, 

튜닙, 삼성 C-Lab Outside 선정 & 사무실 이사

튜닙, 삼성 C-Lab Outside 선정 & 사무실 이사 저희 튜닙이 삼성 C-Lab Outside에 선정됐습니다! 😄 😄 C-Lab Outside는 삼성전자의 사외 스타트업 육성 프로그램으로, 국내 유망 스타트업을 육성하기 위해 201…

울트라러닝 (Ultra Learning) cover image
book, review, 

울트라러닝 (Ultra Learning)

# 울트라러닝 (Ultra Learning) 읽은지 한 달 정도 지나서 어느새 디테일한 내용은 가물가물하지만, 기억이 더 희미해지기 전에 리뷰를 남겨두려고 한다. 가끔 참 너무하다 싶을 정도로 공부해야될게 너무 많다. 초중고 12년과 대학 교육…

Meta는 왜 LLaMA를 공개할까? cover image
news, 

Meta는 왜 LLaMA를 공개할까?

Meta는 왜 LLaMA를 공개할까? Meta(구 Facebook)은 FAANG(Facebook, Apple, Amazon, Netflix, Google)라는 용어가 있을 정도로 거대 IT 기업 중 하나입니다. Meta는 지금 LLM…

Atomic Habits (아주 작은 습관의 힘) cover image
review, 

Atomic Habits (아주 작은 습관의 힘)

Atomic Habits (아주 작은 습관의 힘) 자기계발 서적중 스테디셀러인 ‘Atomic Habits…

팀장의 관점 cover image
review, 

팀장의 관점

팀장의 관점 김규철님이 쓰신 ‘팀장의 관점’이라는 책을 읽었다. 현재 회사에서 AI…

LLM Paper Abstract - 2023.12 cover image
nlp, 

LLM Paper Abstract - 2023.12

LLM Paper Abstract - 2023.12 LLM…

Throwback 2023 cover image
record, 

Throwback 2023

Throwback 2023 어느덧 2023년이 가고 2024년을 맞이하게 됐습니다. 2020년 회고 글을 작성하고, 매년 회고글을 작성하려고 마음을 먹었는데, 202…

원씽 (THE ONE THING) cover image
book, review, 

원씽 (THE ONE THING)

# 원씽 (THE ONE THING) 원씽(The One Thing)은 2013년에 나온 책이고, 아마존 베스트셀러…

What is MoE? (Mixture of Experts) cover image
nlp, mixtral, 

What is MoE? (Mixture of Experts)

What it MoE? (Mixture of Experts) 현존 최강 LLM인 GPT-4에서 “MoE (Mixture of Experts)” 방식을 채택하여 사용하고 있다고 알려졌는데요, 최근 AI계의 뜨거운 감자 Mistral AI…

당신의 뇌는 최적화를 원한다 cover image
book, review, 

당신의 뇌는 최적화를 원한다

Welcome to the Gemini Era cover image
news, 

Welcome to the Gemini Era

Welcome to the Gemini Era Google이 드디어 OpenAI에 대한 반격을 시작한걸까요? 구글이 ‘Gemini’라는 이름의 초거대 모델을 갑작스럽게 공개했습니다. MMLU 벤치마크에서 GPT-4를 넘으며, 32개 중 3…

LLM Paper Abstract - 2023.11 cover image
nlp, 

LLM Paper Abstract - 2023.11

LLM Paper Abstract - 2023.11 LLM…

Open AI CEO Sam Altman join Microsoft cover image
news, 

Open AI CEO Sam Altman join Microsoft

Open AI CEO Sam Altman join Microsoft 저번 주말부터 오늘(23.11.20)까지 충격적인 소식이 AI 업계를 강타했다. MAU 1억+명의 사용자를 보유한 ChatGPT를 만든 OpenAI의 CEO Sam Altman…

더 마인드 (The Mind) cover image
book, review, 

더 마인드 (The Mind)

# 더 마인드 (The Mind…

부의 추월차선 (The Millionaire Fastlane) cover image
book, review, 

부의 추월차선 (The Millionaire Fastlane)

# 부의 추월차선 (The Millionaire Fastlane…

LLM Paper Abstract - 2023.10 cover image
nlp, 

LLM Paper Abstract - 2023.10

LLM Paper Abstract - 2023.10 LLM…

그들은 왜 최후의 승자가 되지 못했나 cover image
book, review, 

그들은 왜 최후의 승자가 되지 못했나

레버리지 (LEVERAGE) cover image
book, review, 

레버리지 (LEVERAGE)

# 레버리지 (LEVERAGE…

Findings of EMNLP 2023 Accept cover image
nlp, record, 

Findings of EMNLP 2023 Accept

Findings of EMNLP 2023 - Accept 공동 1저자로 참여한 “A Korean News Comments Dataset with Target-Specific Offensiveness Ratings” 논문이 Findings of…

[RECORD] 개인 운동 기록 - 2023.10.11 cover image
record, 

[RECORD] 개인 운동 기록 - 2023.10.11

개인 운동 기록 - 2023.10.11 오랜만의 운동 기록이다. 다행히 운동은 꾸준히 하고 있고, 몸도 많이 좋아졌고 수행능력도 좋아졌다. 운동 시작하기로 마음 먹은지…

자체 LLM으로 제작한 챗봇 서비스, Dearmate cover image
tunib, 

자체 LLM으로 제작한 챗봇 서비스, Dearmate

자체 LLM으로 제작한 챗봇 서비스, Dearmate 최근 제가 하고 있는 일에 대해서 소개드리고 싶어 글을 적게 됐습니다. 저는 튜닙 이라는 자연어처리 테크 스타트업의 공동창업자이자, AI 엔지니어로써 일하고 있습니다. 21년…

LLaMA2 cover image
nlp, paper, 

LLaMA2

LLaMA2 Meta(전 Facebook)가 이번 7월 18일에 LLaMA2를 공개했습니다. 🎉 LLaMA2 관련 내용이 담긴 논문 과 함께 7B, 13B, 70B 모델을 공개했습니다. 이전 LLaMA와 다르게 LLaMA…

GPT-NeoX - DeepSpeed Inference cover image
toolkit, environment, 

GPT-NeoX - DeepSpeed Inference

GPT-NeoX - DeepSpeed Inference DeepSpeed Inference를 사용하면 간단하게 모델 추론 성능을 끌어올릴 수 있다. Tensor Parallel…

Huggingface PEFT (Parameter-Efficient Fine-Tuning) cover image
huggingface, nlp, lora, 

Huggingface PEFT (Parameter-Efficient Fine-Tuning)

Huggingface PEFT (Parameter-Efficient Fine-Tuning) 허깅페이스에서 나온 PEFT라는 라이브러리인데 LoRA, Prefix Tuning, P-Tuing, Prompt Tuning…

Docker - GPU 할당 cover image
toolkit, environment, 

Docker - GPU 할당

Docker - GPU 할당 도커에서 GPU를 할당하는 방법

ast - literal_eval 에러 기록 cover image
toolkit, environment, 

ast - literal_eval 에러 기록

ast - literal_eval 에러 기록 ast의 literal_eval…

Docker - 공유 디렉토리 연결 (mount) cover image
toolkit, environment, 

Docker - 공유 디렉토리 연결 (mount)

Docker - 공유 디렉토리 연결 (mount) 도커를 쓰다보면 코드상에서 뭔가를 저장한다거나 어떤 데이터를 읽어와야 한다던가 하는 상황이 있는데, 이때 공유 디렉토리를 연결해서 run하면 편하다. 나 옵션을 이용하면 쉽게 가능하다.

2022 인공지능 그랜드 챌린지 (정책 지원 AI) 3위 cover image
record, 

2022 인공지능 그랜드 챌린지 (정책 지원 AI) 3위

2022 인공지능 그랜드 챌린지 - 정책지원 3위 2022 인공지능 그랜드 챌린지 (정책 지원 AI)에서…

Sooftware Serving - Kernl cover image
nlp, serving, 

Sooftware Serving - Kernl

Sooftware Serving - Kernl ELS-RD (Lefebvre Dalloz Services) 라는 단체에서 Kernl 이라는 좋은 Inference Enginer을 내주었습니다! PyTorch 기반의 Transformer…

[RECORD] 개인 운동 기록 - 2022.10.30 cover image
record, 

[RECORD] 개인 운동 기록 - 2022.10.30

개인 운동 기록 - 2022.10.30 한 달하고 3주만의 기록이다. 안타깝게도, 수행능력은 이전 기록과 동일한 것 같다. 그래도 좋은 소식은 한 달동안 근육량은 유지한채, 지방만 3kg정도 빠졌다. 1년 반동안 멈췄던 운동을 다시 시작하면서…

Sooftware Serving - Huggingface Optimum cover image
huggingface, nlp, serving, 

Sooftware Serving - Huggingface Optimum

Sooftware Serving - Huggingface Optimum 허깅페이스에서 나온 Transformers의 Extension 라이브러리이다. 목적은 모델 학습 및 인퍼런스를 더욱 빠르게 해주기 위한 라이브러리이다. Exporting…

Sooftware Serving - Terminology cover image
nlp, serving, 

Sooftware Serving - Terminology

Sooftware Serving - Terminology NLP…

Sooftware Serving - Triton Inference Server cover image
nlp, serving, 

Sooftware Serving - Triton Inference Server

Sooftware Serving - Triton Inference Server Triton Inference Server는 인공지능 모델의 인퍼런스를 도와주는 오픈소스 소프트웨어다. 다양한 프레임워크(TensorRT, TensorFlow…

[RECORD] 개인 운동 기록 - 2022.09.07 cover image
record, 

[RECORD] 개인 운동 기록 - 2022.09.07

개인 운동 기록 - 2022.09.07 21살에 해병대 면접에 붙기 위해 팔굽혀펴기를 연습하던 때부터 전역 후 몇년간은 맨몸운동 위주의 운동을 꾸준히 했었는데, 대학교…

2022 AI 온라인 경진대회 장관상 수상 cover image
record, 

2022 AI 온라인 경진대회 장관상 수상

2022 AI 온라인 경진대회 장관상 수상 2022 인공지능 경진대회 - 기계독해 태스크에서 1위를 차지하고, 사업화 부문에서 인정받으며 자연어 부문 1위를 했습니다! 상으로 과학기술정보통신부 장관상을 수상했습니다. 튜닙 소속으로 받은…

Sooftware NLP - Mecab 설치 & 사용자 정의 사전 추가 cover image
nlp, environment, 

Sooftware NLP - Mecab 설치 & 사용자 정의 사전 추가

Mecab 설치 & 사용자 정의 사전 추가 Mecab은 대표적인 형태소 분석기입니다. 한국어 형태소 분석기로 유명합니다만, Mecab은 본래 일본의 Taku Kudo…

N행시를 지어주는 인공지능이 있다?! TUNiBridge N행시 서비스! cover image
nlp, service, 

N행시를 지어주는 인공지능이 있다?! TUNiBridge N행시 서비스!

N행시를 지어주는 인공지능이 있다?! TUNiBridge N행시 서비스! 한국 사람이라면 누구나 한 번쯤은 N행시를 만들어본 경험이 있을겁니다. 예능에서도 많이 등장하고, 회사에서, 군대에서, 혹은 연인 이름으로 N…

Sooftware Coding - 좋은 코딩 습관 (네이밍) cover image
record, 

Sooftware Coding - 좋은 코딩 습관 (네이밍)

Sooftware Coding - 좋은 코딩 습관 (네이밍) 깔끔한 코드를 짜기 위한 제가 생각하는 10가지 습관입니다. ※ 저의 개인적인 주관이 포함된 글입니다. 1. 변수, 클래스명에는 동사를 넣지 않는다 변수, 클래스명은 다음과 같이 count…

Sooftware Pandas - 다중 딕셔너리를 Pandas DataFrame으로! cover image
toolkit, python, 

Sooftware Pandas - 다중 딕셔너리를 Pandas DataFrame으로!

Sooftware Pandas - 다중 딕셔너리를 Pandas DataFrame으로! 가끔 데이터를 요렇게 저렇게 정리하다가보면, 데이터를 멀티인덱싱(Multi-Indexing…

마크다운으로 발표자료 만들기 (Marp for VS Code) cover image
software, 

마크다운으로 발표자료 만들기 (Marp for VS Code)

마크다운으로 발표자료 만들기 (Marp for VS Code) 저는 개인적으로 무언가를 정리할 때 텍스트 레벨에서 모든 편집이 가능한 마크다운(Markdown…

Sooftware NLP - 문장의 개체명을 분석해보자! 개체명 인식, Named Entity Recognition (NER) cover image
nlp, 

Sooftware NLP - 문장의 개체명을 분석해보자! 개체명 인식, Named Entity Recognition (NER)

Sooftware NLP - 문장의 개체명을 분석해보자! Named Entity Recognition (NER) NLP 기술을 이용하면 꽤나 정교한 텍스트 분석이 가능합니다. 텍스트 분석에서 빼놓으면 섭섭한 녀석이 개체명 인식(Named Entity…

Sooftware NLP - 혐오는 이제 그만! St. Patrick cover image
nlp, 

Sooftware NLP - 혐오는 이제 그만! St. Patrick

St. Patrick, the original safety engine by TUNiB, checks if the user text includes any toxic expressions or personal information and provides detailed reports.

Sooftware NLP - 한국어 사전학습 모델 (Korean Pre-trained Language Model) cover image
nlp, 

Sooftware NLP - 한국어 사전학습 모델 (Korean Pre-trained Language Model)

한국어 사전학습 모델 (Korean Pre-trained Language Model) 공개된 한국어 사전학습 모델을 기록합니다. 크게 아래 3개의 모델 계열로 구분했으며, 모델 사이즈는 정확하지 않을 수 있습니다. Encoder Model (BERT…

2022 AI 온라인 경진대회 1위 cover image
record, 

2022 AI 온라인 경진대회 1위

2022 AI 온라인 경진대회 1위 2022 인공지능 경진대회 - 기계독해 태스크에서 1위를 차지했습니다. 🎉 🎉 작년에는 제가 모든 리딩 및 코딩을 담당했는데, 이번에는…

Sooftware NLP - Huggingface Datasets Methods cover image
nlp, 

Sooftware NLP - Huggingface Datasets Methods

Huggingface Datasets Methods 자주 사용하는 허깅페이스 datasets의 메서드를 정리합니다. load_datasets 허깅페이스 서버에 올라가 있는 데이터셋을 다운 받을 때 사용하는 메서드 save_to_disk…

Sooftware NLP - Decoding Strategy (디코딩 전략) cover image
nlp, 

Sooftware NLP - Decoding Strategy (디코딩 전략)

Decoding Strategy (디코딩 전략) 이번 포스팅에서는 자연어처리 모델의 디코딩 전략에 관해서 다뤄보려고 합니다. 디코딩이란 말처럼 디코딩은 디코더에서 수행하는 작업입니다. 즉, BERT와 같은 인코더 모델에서 사용하는게 아니라 GPT…

광주소프트웨어마이스터고등학교 학생들 튜닙 방문 cover image