'MFU' 태그의 글 목록

LLM 모델 성능 판단 지표 MFU? TPS?

Model FLOPs Utilization(MFU), Token per Second(TPS) Model FLOPs Utilization(MFU)과 Token per Second(TPS)는 대규모 언어 모델(LLM)과 같은 AI 모델의 성능을 측정하는 핵심 지표이다. MFU는 모델이 이론적으로 낼 수 있는 최대 연산 능력인 FLOPs(Floating-point Operations Per Second) 대비 실제로 얼마나 효율적으로 연산을 수행하고 있는지를 나타내는 비율이다. FLOPs 자체는 모델 크기나 하드웨어의 연산 능력을 나타내지만, MFU는 그 하드웨어를 얼마나 잘 활용하고 있는지를 보여주는 효율성 지표인 것이다. 예를 들어, 100 FLOPs의 연산 능력을 가진 하드웨어에서 모델이 70 FLOP..

IT&Tech 2025.11.22

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

그루부기 사파리(IT&Tech)

MFU 1

티스토리툴바