์๋ ํ์ธ์.
์ค๋์ ๋ฅ๋ฌ๋์์ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ ReLU๋ฅผ ํตํด ๋น์ ํํจ์์ ์ ํํจ์์ ์ฐจ์ด์ ์ ์์๋ณด๊ฒ ์ต๋๋ค.
๋จธ์ ๋ฌ๋์์ ์ ํํจ์๋ฅผ ํตํด ํ๊ท๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๊ฒ ๋์๊ณ , ๋ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํ๊ธฐ ์ํด ๋น์ ํ ํจ์ Sigmoid, Tanh, ReLU๋ฅผ ๋์ค๊ธฐ ์์ํฉ๋๋ค.
ํ์ฌ๊น์ง ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ReLU๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ ๋น์ฐ์ ๋๊ณ ์์ต๋๋ค.
๋ฐ๋ก, ๋ณธ๋ก ์ผ๋ก ๋ค์ด๊ฐ๊ฒ ์ต๋๋ค.
TesorFlow, Keras, Pytorch๋ฅผ ํตํด ReLU๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ ๊ต์ฅํ ๊ฐ๋จํฉ๋๋ค.
์ ํธ ๋ฐ ์์คํ ์ ๊ฐ๋ ์ ์ด์ผ๊ธฐ๋ก ๊ฐ๋ณด๊ฒ ์ต๋๋ค.
ReLU๋ ์ ๋น์ ํ ํจ์์ผ๊น์?
์ ํ ์์คํ ๊ณผ ๋น์ ํ ์์คํ ์ ์ฐจ์ด
์ ํ์ฑ์ ๊ฐ์ง๊ณ ์์ผ๋ฉด ์ ํ ์์คํ ์ด๊ณ , ๊ทธ ์ธ๋ ๋น์ ํ ์์คํ ์ ๋๋ค.
์ ํ์ฑ์ ๊ฐ์ง๋ ์กฐ๊ฑด์ ๋ฌด์์ผ๊น์?
์ธ ๊ฐ์ง์ ์กฐ๊ฑด์ ์ถฉ์กฑํ๋ฉด ์ ํ์ฑ์ ๊ฐ์ง๋ค๊ณ ์ด์ผ๊ธฐํ ์ ์์ต๋๋ค. ๊ทธ ์ธ์๋ ๋น์ ํ ์์คํ ์ผ๋ก ๋ถ๋ฅํ ์ ์์ต๋๋ค.
1. ์ ํ์ ์ธ ๊ทธ๋ํ
x = 0 ์์ ๊บฝ์ด๋ ๊ตฌ๊ฐ์ ์ ์ธํ๊ณ ์ ๊ตฌ๊ฐ์ด ์ ํ์ฑ์ ๊ฐ์ง์ง๋ง, (x =0) ๋ถ๋ถ ๋๋ฌธ์ ์ ํ์ฑ์ ๊ฐ์ง๋ค๊ณ ํ ์ ์์ต๋๋ค.
๋ถ๋๋ฝ์ง๋ง, ์ ๋ ๊บพ์ด๋ ๋ถ๋ถ์ ์ ์ธํ ์ ๊ตฌ๊ฐ์ด ๋ถ๋ถ ์ ํํํ๋ฅผ ๋์ฐ๋ ์ ํ ํจ์๊ฐ ๋ง์ง ์๋๋ผ๋ ์๊ฐ์ ํด ๊ณต๋ถ๋ฅผ ํด์ ์ฐพ์๋ณด์์ต๋๋ค.
2. ๋์ฐจ์ฑ ( f(ax) = a * f(x) )
ReLU๋ฅผ ๊ฐ๋จํ ์ค๋ช ํ๋ฉด, x๊ฐ 0๋ณด๋ค ์์ผ๋ฉด f(x) = 0, x๊ฐ 0๋ณด๋ค ํฌ๋ฉด f(x) = x ์ ๋๋ค. ์ด๋ฅผ f(x) = max(0, x)๋ผ ํํํ๊ฒ ์ต๋๋ค.
โ a = 3์ผ๋ก ๊ฐ์ ํ๋ฉด,
f(3x) = 3x
3 * f(x) = 3x
f(3x) = 3 * f(x) = 3x
โก a = -3 ์ผ๋ก ๊ฐ์ ํ๋ฉด
f(-3x) = -3x
-3 * f(x) = -3x
f(-3x) = -3 * f(x) = -3x
ReLU๋ ๋์ฐจ์ฑ์ด ์ฑ๋ฆฝํจ์ ์ ์ ์์ต๋๋ค.
3. ๊ฐ์ฐ์ฑ ( f(x1 + x2) = f(x1) + f(x2) )
x1 = -1, x2 = 2 ๋ผ๊ณ ๊ฐ์ ํ๋ฉด,
f(-1+2) = 1
f(-1) = 0,
f(2) =2
f(-1) + f(2) = 2
f(-1+2) != f(-1) + f(2)
ReLU๋ ๊ฐ์ฐ์ฑ์ด ์ฑ๋ฆฝํ์ง ์์์ ์ ์ ์์ต๋๋ค.
ReLU๋ ๋์ฐจ์ฑ์ ์ฑ๋ฆฝํ์ง๋ง, ๊ฐ์ฐ์ฑ์ด ์ฑ๋ฆฝํ์ง ์์ ์ ํ์ฑ์ ๊ฐ์ง์ง ์์ผ๋ฏ๋ก ๋น์ ํ ํจ์์์ ์ ์ ์์์ต๋๋ค.