그루부기 사파리(IT&Tech)

  • 홈
  • 태그
  • 방명록

DPO 1

LLM 개발 이해를 위한 학습 방법론 접근

LLM 학습 방법론 대규모 LLM을 개발할 때 선택 가능한 방법론들을 아래와 같이 정리했다.학습 방식의 선택은 대규모 언어 모델(LLM) 개발에서 모델 성능, 효율성, 최종 목표 달성 여부를 결정짓는 핵심 요소이다. 잘못된 학습 방식을 선택하는 경우에 비용 및 시간이 막대하게 낭비된다. 예를 들어 전체 모델을 재학습하거나 하는 경우 많은 비용과 시간이 낭비된다. 또한 사전 학습 모델을 사용자 의도나 윤리적 기준에 맞추는 정렬 과정(RLHF, DPO 등)이 부적절한 경우 모델은 유해하거나 부정확한 저품질의 답변을 생성할 수 있다. 특정 도메인이나 작업에 맞춰 연속 사전 학습(CPT)나 미세 조정(Fine-Tuning)을 적절히 적용하지 않으면 모델이 일반적인 지식만 갖춘 채 디테일한 답변을 생성하는 능력이..

IT&Tech 2025.11.23
이전
1
다음
더보기
프로필사진

그루부기 사파리(IT&Tech)

IT 및 기술 관련 뉴스 및 궁금증을 공부하면서 정리하고 있습니다.

  • 분류 전체보기 (68)
    • IT&Tech (68)

Tag

클라우드서버칩셋, 오라클, 결정론적연산, 인터포저적층, 오프체인, LORA, 저전력방사성내성반도체, 동적vs정적스키마, XWorm악성코드, 대형전개식라디에이터, 디지털프로버넌스, LSB, 팔란티어, 레이저냉각기술, 루프히트파이프, 네모트론3슈퍼, 하네스엔지니어링, 제로트러스터, Mamba-Transformer, DCT이산코사인변환, 데이터레이크, 고방열라디에이터, 블록체인, 스카이컴퓨팅, 스테가노그라피, 리니지추적, 정규특이분석RS분석, LatentMoE, 보스톤마라톤테러, 텍스트vs바이너리,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바