Overfitting 대응 – Dropout, Batch Size, Filter

23 Jul 2025 in Til on Til

Dropout Rate 조절 ⭐⭐⭐

정의: Dropout은 학습 시 뉴런을 임의로 비활성화하여 특정 패턴 의존을 줄이는 정규화 기법.
중요 이유: Dropout 비율을 높이면(random 비활성화) 모델의 복잡도 감소 → 과적합 현상(새로운 데이터 일반화 실패) 완화에 효과적.
핵심 요소:
비율 증가 효과: dropout_rate를 0.2→0.5로 올리면 regularization이 강화됨.
작동 원리: 학습마다 무작위로 뉴런을 off, 앙상블 효과로 모델 일반화 성능 개선.
연결: → Filter 수 감소와 병행 시 구조적 복잡도 조정 가능.

Dropout 증가, Filter 감소 → 모델 복잡도 구조적 축소 → 과적합 저감
Batch Size 증가는 학습 과정의 노이즈/평균값 조정 → 일반화 성능 유동적 변화
전체 흐름: 하이퍼파라미터별 조정은 과적합 완화와 성능 저하(또는 과소적합) 위험 사이 trade-off 필요. 실험적으로 한 번에 하나씩 변경, 검증 데이터 기반으로 판단할 것.
Dropout과 Filter 조정은 네트워크 구조 자체의 regularization 강화를, Batch Size 조정은 학습 프로세스 관점의 일반화 강화를 의미함.
모든 파라미터 조정은 실험적 튜닝과 검증 셋 성능 관찰이 필수적임.