์ง๋ ํ์ต์๋ ๋ํ์ ์ผ๋ก ์ธ๊ฐ์ง๊ฐ ์์ต๋๋ค.
1. ์ ํ ํ๊ท ( Linear Regression ) : 3์ : 60์ , 6์ : 70์ , 9์ : 80์ ์ด๋ผ๋ฉด, 12์์ ๋ช ์ ์ผ๊น?
2. ์ด์ง ๋ถ๋ฅ ( Binary Classification ) : [0, 1], [True, False], [๊ฐ, ๊ณ ์์ด]
3. ๋ค์ค ๋ถ๋ฅ ( Multi classification ) : [A, B, C, D], [๊ฐ, ๊ณ ์์ด, ์ฌ์ด, ๊ณฐ] ...
< Linear Regression >
์ง๋ ํ์ต ์ค ๊ฐ์ฅ ๋ํ๊ฒฉ์ธ ์ ํ ํ๊ท์ ๋ํด ๋จผ์ ์์๋ณด๊ฒ ์ต๋๋ค.
์ ๋ ฅ
X = [1, 2, 3, 4]
์ถ๋ ฅ
Y = [3, 5, 7, 9]
์ด๋ผ๋ฉด ๊ณผ์ฐ X=5์ผ ๋, Y์ ๊ฐ์?
์ฌ๋์ ์ฝ๊ฒ Y์ ๊ฐ์ด 11์์ ๊ธ๋ฐฉ ์ ์ ์์ต๋๋ค.
๊ทธ๋ ๋ค๋ฉด ๊ธฐ๊ณ๋ ์ด๋ป๊ฒ Y์ ๊ฐ์ ์์๋ผ ์ ์์๊น์?
1. ๊ฐ์ค ( hypothesis ) : ์ด๊ธฐ์ ๊ฐ์ ์ ํด์ค๋ค.
๊ธฐ๊ณ๋ ์ฒ์์ ์๋ฌด ๊ฒ๋ ๋ชจ๋ฅด๋ ์ํ์ด๋ฏ๋ก
์ฒ์์ H(x)๋ผ๋ ์ด๊ธฐ ๊ฐ์ค์ ์ธ์ฐ๊ฒ ๋ฉ๋๋ค.
W, b์ ์์์ ๊ฐ์ด ๋ค์ด๊ฐ H(x)์ ๊ฐ์ ์ ํฉ๋๋ค.
H(x)๋ ๊ธฐ๊ณ๊ฐ ์๊ฐํ ๋ต์ธ Y'์ ๋๋ค.
ํ์ง๋ง ๋น์ฐํ ์ฒ์๋ถํฐ ๋ต์ด ๋ ์๋ ์์ต๋๋ค.
2. Cost Fucntion ( = Loss Fucntion ) : ์ ๋ต๊ณผ ์ผ๋ง๋ ํ๋ฆฐ์ง ์๋ ค์ค๋ค.
๊ธฐ๊ณ๊ฐ H(x)๋ผ๋ ๊ฐ์ค์ ์ธ์ ์ผ๋, ์ ๋ต๊ณผ ์ผ๋ง๋ ๊ฐ์์ง ๋น๊ตํฉ๋๋ค.
๋น๊ต๋ฅผ ํ๊ธฐ ์ํด ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด ์ ๊ณฑ์ ํ๊ท (mean Mean of squares) ์ ๋๋ค.
์ ๋ต๊ณผ ์ผ๋ง๋ ๋ค๋ฅธ์ง ์๋ ค๋ฉด |H(x) - Y| ํ๋ฉด ๋๋๋ฐ ์ ์ ๊ณฑ์ ํ์์๊น์?
์ ๊ณฑ์ ํ ์ด์ ๋
1. ํ๋ ธ์ ๋, ํจ๋ํฐ ๊ฐ์ ์ข ๋ ํฌ๊ฒ ํ๊ธฐ์ํด
2. ์ปดํจํฐ ๋ด๋ถ์์ ์ ๋๊ฐ๋ณด๋ค ์ ๊ณฑ์ ์๋๊ฐ ๋ ๋น ๋ฅด๊ธฐ ๋๋ฌธ์ ๋๋ค.
3. Cost์ ๊ฐ์ ์ค์ด๊ธฐ. ์ ๋ต์ ์ต๋ํ ๊ฐ๊น๊ฒ!
2๋ฒ์์ Cost(W, b)๋ฅผ ๊ตฌํ์์ต๋๋ค.
ํ์ต์ Cost( = loss)๋ฅผ ์ค์ด๋ ๊ฒ์ด ๋ชฉํ์ ๋๋ค.
ํ์์ผ๋ก ํํํ๊ฒ ๋๋ฉด, ๋ฌธ์ ํ๊ธฐ -> ์ฑ์ -> ์ค๋ต์ ๋ฆฌ๋ก ๋ณผ ์ ์์ต๋๋ค.
๊ธฐ๊ณ๋ ์ฑ์ ์ ํ์ผ๋, ์ค๋ต์ ๋ฆฌ ( ๊ฐ์ฅ ์ต์ ์ W, b๋ฅผ ๊ตฌํ๊ธฐ )๋ฅผ ํ๋ฉด ๋ฉ๋๋ค.
Cost( = loss)๋ฅผ ์ค์ด๊ธฐ ์ํด ๋ง์ด ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด ๊ฒฝ์ฌ ํ๊ฐ๋ฒ( Gradient Descent ) ์ ๋๋ค.
* ํธ๋ฏธ๋ถ : ๋ค๋ณ์ ํจ์์ ํน์ ๋ณ์๋ฅผ ์ ์ธํ ๋๋จธ์ง ๋ณ์๋ฅผ ์์๋ก ์๊ฐํ์ฌ ๋ฏธ๋ถํ๋ ๊ฒ
Cost(W, b)๋ ์ด์ฐจํจ์ ๋ ๊ฐ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
1. ์ด์ฐจํจ์
โถ W ( = ๊ธฐ์ธ๊ธฐ )์ ๋ํ ์ด์ฐจํจ์
โถ b ( = ์ ํธ )์ ๋ํ ์ด์ฐจํจ์
2. ํธ๋ฏธ๋ถ
โถ W์ ๋ํ ์ด์ฐจํจ์๋ฅผ W์ ๋ํด์ ํธ๋ฏธ๋ถํ ๊ฐ(๊ธฐ์ธ๊ธฐ)์ด 0์ด ๋๋ ์ง์ ์ด ์ ๋ต์ ๋๋ค.
โถ b์ ๋ํ ์ด์ฐจํจ์๋ฅผ b์ ํธ๋ฏธ๋ถ์ ๋ํด์ ํธ๋ฏธ๋ถํ ๊ฐ(๊ธฐ์ธ๊ธฐ)์ด 0์ด ๋๋ ์ง์ ์ด ์ ๋ต์ ๋๋ค.
3. Update
๋ง์ฝ, ๊ธฐ์ธ๊ธฐ๊ฐ 0์ด ๋์ง ์์๋ค๋ฉด, 0์ด ๋ ๋๊น์ง ๊ณ์ํด์ ๋ฐ๋ณตํฉ๋๋ค.
Learning rate๋, ์ต์ ์ w๊ฐ์ ์ฐพ์๊ฐ๊ธฐ์ํด์ ๋น์ฉํจ์๋ฅผ w์ ๋ํด์ ํธ๋ฏธ๋ถํด์ค ๊ฒ์ํ์ต๋ฅ ์ด๋ผ๊ณ ํฉ๋๋ค.
์์ง๊น์ง ์ ๋ต์ ์์ผ๋ฉฐ, Learning rate๋ฅผ ํฌ๊ฒ ํด์ฃผ๋ฉด ์๋์ ๊ทธ๋ฆผ๋ณด๋ค ๋ ๋ง์ด ์์ง์ผ ๊ฒ์ด๋ฉฐ,
์๊ฒ ํด์ฃผ๋ฉด, ์๋์ ๊ทธ๋ฆผ๋ณด๋ค ์กฐ๊ธ ์์ง์ผ ๊ฒ์ ๋๋ค. ๋ง์ ์ฌ๋๋ค์ด 0.0001๋ก ์ฌ์ฉํฉ๋๋ค.
์ ๋ฆฌํ์๋ฉด, ๋ฌธ์ ํ๊ธฐ -> ์ฑ์ -> ์ค๋ต์ ๋ฆฌ๋ก ๋ณผ ์ ์์ต๋๋ค.
์์์ ์ธ ๋ถ๋ถ์์๋ ์ ๊ฐ ์์ธํ ํ์ง ์์ ์ด์ ๋
์ํ์ ์ ๋ชปํ๋ ๊ฒ๋ ์์ง๋ง,
์ด๋ฏธ ๋ง์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ด ์ด๋ฌํ ์์๋ค์ ์ ๊ณตํ๊ณ ์๊ณ , ์ฌ์ฉํ๋ฉด ๋๊ธฐ ๋๋ฌธ์ ๋๋ค.
์ฃผ๋ง๋ค ํฐ ํ๋ฆ์ ์ดํดํ ์ ์๊ฒ๋ ํ๋์ฉ ๊ธ์ ์ฌ๋ฆฌ๋๋ก ํ๊ฒ ์ต๋๋ค.
'๐ Python > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฅ๋ฌ๋] RNN with PyTorch ( RNN ๊ธฐ๋ณธ ๊ตฌ์กฐ, ์ฌ์ฉ ๋ฐฉ๋ฒ ) (3) | 2020.04.28 |
---|---|
[๋ฅ๋ฌ๋] ์ ํํ๊ท (Linear Regression) : Pytorch ๊ตฌํ (2) | 2020.04.14 |
[๋ฅ๋ฌ๋] ํ์ดํ ์น ๊ธฐ๋ณธ step3::๊ตฌ์กฐ 1ํ (0) | 2020.02.06 |
[๋ฅ๋ฌ๋] ํ์ดํ ์น step2:: ์ค์น&์ค๋น (0) | 2020.02.04 |
[๋ฅ๋ฌ๋]์ธ๊ณต์ง๋ฅ ํ์ดํ ์น step1::์ฃผํผํฐ ๋ ธํธ๋ถ ์ค๋น (0) | 2020.02.03 |