TIL Seq2SeqTrainer vs AutoAPI
in Til on Til
Seq2SeqTrainer는 시퀀스-투-시퀀스 태스크에 최적화된 고수준 추상화를 제공하며, Auto API는 모든 태스크에 대한 유연한 저수준 제어
1. Trainer_특징
1.1 코드_복잡도_및_훈련_루프
간결한 코드
자동화된 설정
내장된 훈련 루프
1.2 태스크_범위_및_커스터마이징
시퀀스-투-시퀀스 태스크 전용
제한적인 커스터마이징
내장된 분산 및 GPU 지원
1.3 평가_및_로깅
자동화된 평가 지표 (ROUGE, BLEU)
편리한 로깅 기능
2. Auto_API_특징
2.1 코드_복잡도_및_훈련_루프
복잡한 코드
사용자 정의 코드 작성 필요
직접 작성해야 하는 훈련 루프
2.2 태스크_범위_및_커스터마이징
모든 태스크에 적용 가능
완전한 커스터마이징
수동 설정이 필요한 분산 및 GPU 지원
2.3 평가_및_로깅
직접 계산해야 하는 평가 지표
수동 로깅 구현
3. 사용_시나리오
3.1 Seq2SeqTrainer_권장_상황
빠른 시퀀스-투-시퀀스 모델 훈련
번역, 요약 등 특정 태스크
높은 생산성 요구 시
3.2 Auto_API_권장_상황
시퀀스-투-시퀀스 외 다양한 태스크
훈련 과정의 세부 제어 필요 시
커스텀 평가 및 로깅 구현 시