Residual_Learning_and_1x1_Convolution
๐ Residual_Learning_and_1x1_Convolution
ResNet์ ํต์ฌ ๊ฐ๋ ์ธ Residual Learning๊ณผ 1x1 Convolution์ ๊น์ ์ ๊ฒฝ๋ง์ ํจ์จ์ ์ธ ํ์ต์ ๊ฐ๋ฅํ๊ฒ ํ๋ ์ค์ํ ๊ธฐ์ ์ ๋๋ค.
1. Residual Learning (์์ฐจ ํ์ต)
1.1 ํต์ฌ ๊ฐ๋
- ์์ฐจ ํจ์ ํ์ต: ๋คํธ์ํฌ๊ฐ ์ํ๋ ํจ์
H(x)H(x)H(x)
๋ฅผ ์ง์ ํ์ตํ๋ ๋์ , ์ ๋ ฅ
xxx
์ ๋ํ ์์ฐจ
F(x)=H(x)โxF(x) = H(x) - xF(x)=H(x)โx
๋ฅผ ํ์ต.
- Shortcut ์ฐ๊ฒฐ: ์ ๋ ฅ
xxx
๋ฅผ ๋ค์ ๋ ์ด์ด์ ์ง์ ๋ํ์ฌ
H(x)=F(x)+xH(x) = F(x) + xH(x)=F(x)+x
๋ฅผ ๊ตฌ์ฑ.
- ํ์ต ๋์ด๋ ๊ฐ์: โ์ ์ฒด ํจ์โ ๋์ โ์ ๋ ฅ ๋๋น ๋ณด์ ๊ฐโ๋ง ํ์ตํ์ฌ ํ์ต์ด ๋จ์ํ๋๊ณ ๊ธฐ์ธ๊ธฐ ์ ํ๊ฐ ์ฉ์ด.
1.2 ์ฅ์ ๋ฐ ํจ๊ณผ
๊ธฐ์ธ๊ธฐ ์์ค ์ํ: ๊น์ ๋คํธ์ํฌ์์ ๋ฐ์ํ๋ ๊ธฐ์ธ๊ธฐ ์์ค ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ค์.
ํ์ต ํจ์จ์ฑ ์ฆ๋: ๋คํธ์ํฌ๊ฐ ๋ ๊น์ด์ ธ๋ ์์ ์ ์ด๊ณ ๋น ๋ฅด๊ฒ ์๋ ด ๊ฐ๋ฅ.
๊น์ ๋คํธ์ํฌ ๊ตฌ์ถ: ์๋ฐฑ ๊ฐ ์ด์์ ๋ ์ด์ด๋ฅผ ๊ฐ์ง ๋งค์ฐ ๊น์ ์ ๊ฒฝ๋ง ์ค๊ณ ๋ฐ ํ์ต ๊ฐ๋ฅ.
2. 1x1 Convolution (1x1 ์ปจ๋ณผ๋ฃจ์ )
2.1 ์ ์ ๋ฐ ์ญํ
์ฑ๋ ๋ฐฉํฅ ์ฐ์ฐ: 1x1 ํฌ๊ธฐ์ ํํฐ๋ก ๊ณต๊ฐ ์ ๋ณด(Height, Width)๋ ์ ์งํ ์ฑ ์ฑ๋ ๋ฐฉํฅ์ผ๋ก๋ง ์ฐ์ฐ ์ํ.
์ฑ๋ ๊ฐ ์ ํ ๊ฒฐํฉ: ๊ฐ ํฝ์ ์์น์์ ์ฑ๋๋ณ ๊ฐ์คํฉ์ ๊ณ์ฐํ์ฌ ์ฑ๋ ๊ฐ์ ์ ํ ๊ฒฐํฉ ์ํ.
์ฐจ์ ์ถ์/ํ์ฅ: ์ฑ๋ ์๋ฅผ ์ค์ด๊ฑฐ๋ ๋๋ ค ์ฐ์ฐ๋ ๋ฐ ํ๋ผ๋ฏธํฐ ์๋ฅผ ์ต์ ํ.
2.2 Bottleneck Block์์์ ํ์ฉ
๊ตฌ์กฐ: โ1x1 Conv โ 3x3 Conv โ 1x1 Convโ์ ์์๋ก ๊ตฌ์ฑ.
์ฑ๋ ์ถ์: ์ฒซ ๋ฒ์งธ 1x1 Conv๋ก ์ฑ๋์ ์ถ์ํ์ฌ 3x3 Conv์ ์ฐ์ฐ๋ ๊ฐ์.
์ฑ๋ ๋ณต์: ๋ง์ง๋ง 1x1 Conv๋ก ์ฑ๋์ ๋ณต์ํ์ฌ ์ ๋ณด ์์ค ์ต์ํ.
ํจ์จ์ ์ธ ๊น์ด: ์ ์ ํ๋ผ๋ฏธํฐ๋ก ๊น์ ๋คํธ์ํฌ๋ฅผ ๊ตฌ์ถํ์ฌ ์ฐ์ฐ ํจ์จ์ฑ ๋ฐ ํํ๋ ฅ ๋์ ํ๋ณด.
3. ํต์ฌ ๊ฐ๋ ๋น๊ต
3.1 ๋ชฉํ ๋ฐ ๊ธฐ๋ฅ
Residual Learning: ๊น์ ๋คํธ์ํฌ์ ํ์ต ๋์ด๋๋ฅผ ๋ฎ์ถ๊ณ ๊ธฐ์ธ๊ธฐ ์์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐ.
1x1 Convolution: ์ฑ๋ ์ฐจ์ ์กฐ์ ์ ํตํด ์ฐ์ฐ ํจ์จ์ฑ์ ๋์ด๊ณ ๋คํธ์ํฌ์ ํํ๋ ฅ์ ๊ฐํ.
3.2 ResNet์์์ ์๋์ง
Residual Block: 1x1 Conv๋ฅผ ํฌํจํ Bottleneck Block์ด Residual Learning๊ณผ ๊ฒฐํฉ๋์ด ๊น๊ณ ํจ์จ์ ์ธ ResNet ๊ตฌ์กฐ๋ฅผ ํ์ฑ.
ํ์ต ์์ ์ฑ: Residual Learning์ผ๋ก ํ์ต ์์ ์ฑ์ ํ๋ณดํ๊ณ , 1x1 Conv๋ก ์ฐ์ฐ ํจ์จ์ฑ์ ๊ทน๋ํ.
์ฑ๋ฅ ํฅ์: ๋ ๊ธฐ์ ์ ๊ฒฐํฉ์ ํตํด ์ด๋ฏธ์ง ์ธ์ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๋ฐ์ด๋ ์ฑ๋ฅ ๋ฌ์ฑ.