TIL Seq2SeqTrainer vs AutoAPI

20 Jan 2025 in Til on Til

Seq2SeqTrainer는 시퀀스-투-시퀀스 태스크에 최적화된 고수준 추상화를 제공하며, Auto API는 모든 태스크에 대한 유연한 저수준 제어

1. Trainer_특징

1.1 코드_복잡도_및_훈련_루프

간결한 코드
자동화된 설정
내장된 훈련 루프

1.2 태스크_범위_및_커스터마이징

시퀀스-투-시퀀스 태스크 전용
제한적인 커스터마이징
내장된 분산 및 GPU 지원

1.3 평가_및_로깅

자동화된 평가 지표 (ROUGE, BLEU)
편리한 로깅 기능

2. Auto_API_특징

2.1 코드_복잡도_및_훈련_루프

복잡한 코드
사용자 정의 코드 작성 필요
직접 작성해야 하는 훈련 루프

2.2 태스크_범위_및_커스터마이징

모든 태스크에 적용 가능
완전한 커스터마이징
수동 설정이 필요한 분산 및 GPU 지원

2.3 평가_및_로깅

직접 계산해야 하는 평가 지표
수동 로깅 구현

3. 사용_시나리오

3.1 Seq2SeqTrainer_권장_상황

빠른 시퀀스-투-시퀀스 모델 훈련
번역, 요약 등 특정 태스크
높은 생산성 요구 시

3.2 Auto_API_권장_상황

시퀀스-투-시퀀스 외 다양한 태스크
훈련 과정의 세부 제어 필요 시
커스텀 평가 및 로깅 구현 시