그루부기 사파리(IT&Tech)

  • 홈
  • 태그
  • 방명록

2026/04/04 1

인공지능 정렬: 인간 의도를 반영한 지능의 통제

확률적 분포와 가치 체계의 결합 아키텍처인공지능 정렬은 모델의 목적 함수를 인간의 의도 및 가치 체계와 일치시키는 공학적 프로세스다. 핵심 아키텍처는 보상 모델 학습과 근위 정책 최적화(PPO, Proximal Policy Optimization)**를 골자로 하는 인간 피드백 기반 강화학습(RLHF)을 축으로 한다. 트랜스포머 기반의 거대 언어 모델이 생성하는 광범위한 확률 분포 중 유익성, 진실성, 무해성을 기준으로 유효한 영역을 필터링하고 가중치를 미세 조정하는 기술적 기제로 작동한다.구분사전 학습 (Pre-training)미세 조정 (SFT)정렬 (RLHF)목적데이터 분포 학습특정 태스크 수행인간 의도 부합입력대규모 비정형 데이터레이블된 데이터셋인간 선호도 순위결과다음 토큰 예측 성능명령 이행 능..

IT&Tech 2026.04.04
이전
1
다음
더보기
프로필사진

그루부기 사파리(IT&Tech)

IT 및 기술 관련 뉴스 및 궁금증을 공부하면서 정리하고 있습니다.

  • 분류 전체보기 (69) N
    • IT&Tech (69) N

Tag

스테가노그라피, 헌법적AI, 고방열라디에이터, LSB, 오프체인, 하네스엔지니어링, 블록체인, 루프히트파이프, 텍스트vs바이너리, XWorm악성코드, 결정론적연산, 레이저냉각기술, 네모트론3슈퍼, 근위정책최적화, 스카이컴퓨팅, 데이터레이크, Mamba-Transformer, 클라우드서버칩셋, 리니지추적, 대형전개식라디에이터, 저전력방사성내성반도체, 자동화된정렬, 팔란티어, LORA, 동적vs정적스키마, 인터포저적층, 오라클, LatentMoE, AI정렬기술, 제로트러스터,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바