'강화 학습 (rl)' 태그의 글 목록

[논문분석] DeepSeek-R1: 강화 학습 활용한 LLM의 추론 능력 향상 연구 분석

📌 DeepSeek-R1: 강화 학습을 활용한 대형 언어 모델의 추론 능력 향상 연구 분석 - 논문: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning📌 강화 학습(RL)만으로 GPT-4급 AI 모델을 만들 수 있을까?1. 서론 (Introduction)최근 대형 언어 모델(LLM, Large Language Model)의 발전 속도는 놀라울 정도로 빠르며, AI가 문제를 해결하는 방식도 점점 더 정교해지고 있다. 특히, 대형 언어 모델을 훈련하는 후속 학습(Post-Training) 과정에서 지도 학습(Supervised Fine-Tuning, SFT) 외에도 강화 학습(Reinforcemen..

AI 최신 동향 및 이슈 2025.01.29

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Dream Factory

강화 학습 (rl) 1

티스토리툴바