코스모스

Large Language Model 책 리뷰 - 토큰화와 임베딩

안녕하세요! 지난 글에서 LLM의 핵심인 트랜스포머 아키텍처에 대해 간략히 살펴봤는데요. 이번에는 LLM이 우리가 쓰는 자연어를 어떻게 학습하는지, LLM 학습의 기본이 되는 토큰화와 임베딩에 대한 내용을 정리하고, 책을 읽으며 들었던 몇 가지 의문점과 추가적으로 조사한 내용을 공유하려고 합니다. 1. LLM 학습 과정: 텍스트를 숫자로 ...

대규모 언어 모델(LLM)에 대한 이해

최근 몇 년간 인공지능 분야에서 가장 뜨거운 키워드 중 하나는 바로 대규모 언어 모델일 것입니다. ChatGPT나 Gemini와 같은 LLM은 이미 우리 삶의 다양한 영역에 깊숙이 파고들어 놀라운 능력을 보여주고 있습니다. 이 글에서는 최근 접한 책의 내용을 바탕으로 LLM의 핵심 개념, 특히 트랜스포머 아키텍처와 그 파생 모델들의 작동 원리, 그리고...

RAG란 무엇인가? 검색 기반 생성(Retrieval-Augmented Generation)의 이해

최근 AI와 자연어 처리(NLP) 분야에서는 RAG(Retrieval-Augmented Generation)이 큰 주목을 받고 있습니다. 단순한 질문 응답 시스템을 넘어서, 신뢰성 있는 생성 AI를 구축하기 위한 핵심 기술로 자리잡고 있죠. 이 글에서는 RAG의 개념부터 도입 배경, 동작 방식, 검색기 종류, 그리고 진화된 형태까지 자세하게 설명해보...