데이터 구조화의 물리적 경계와 스택 최적화시스템 아키텍처 내에서 데이터 직렬화 방식은 디스크 I/O 병목 현상과 직결된다. CSV와 JSON은 텍스트 기반의 행 지향 구조를 가지며 시스템 간 상호운용성을 보장하지만 대규모 처리에서 파싱 오버헤드를 유발한다. 반면 Parquet는 열 지향 구조로 데이터를 압축하여 분석 쿼리의 스캔 범위를 최소화한다. Avro는 행 지향 바이너리 직렬화를 통해 스키마 진화를 지원하며 네트워크 대역폭 소비를 줄인다. 이들의 물리적 특성을 이해하고 선택하는 과정이 스택 최적화의 첫 단계다.포맷데이터 구조스키마 타입주요 아키텍처 용도CSV행 지향 텍스트없음단순 이기종 시스템 교환JSON계층형 텍스트동적 (읽기 시점)웹 REST API 통신Parquet열 지향 바이너리정적 (쓰기 ..