TIL Seq2SeqTrainer vs AutoAPI

Seq2SeqTrainer는 시퀀스-투-시퀀스 태스크에 최적화된 고수준 추상화를 제공하며, Auto API는 모든 태스크에 대한 유연한 저수준 제어

1. Trainer_특징

1.1 코드_복잡도_및_훈련_루프

  • 간결한 코드

  • 자동화된 설정

  • 내장된 훈련 루프

1.2 태스크_범위_및_커스터마이징

  • 시퀀스-투-시퀀스 태스크 전용

  • 제한적인 커스터마이징

  • 내장된 분산 및 GPU 지원

1.3 평가_및_로깅

  • 자동화된 평가 지표 (ROUGE, BLEU)

  • 편리한 로깅 기능

2. Auto_API_특징

2.1 코드_복잡도_및_훈련_루프

  • 복잡한 코드

  • 사용자 정의 코드 작성 필요

  • 직접 작성해야 하는 훈련 루프

2.2 태스크_범위_및_커스터마이징

  • 모든 태스크에 적용 가능

  • 완전한 커스터마이징

  • 수동 설정이 필요한 분산 및 GPU 지원

2.3 평가_및_로깅

  • 직접 계산해야 하는 평가 지표

  • 수동 로깅 구현

3. 사용_시나리오

3.1 Seq2SeqTrainer_권장_상황

  • 빠른 시퀀스-투-시퀀스 모델 훈련

  • 번역, 요약 등 특정 태스크

  • 높은 생산성 요구 시

3.2 Auto_API_권장_상황

  • 시퀀스-투-시퀀스 외 다양한 태스크

  • 훈련 과정의 세부 제어 필요 시

  • 커스텀 평가 및 로깅 구현 시