๐งโ๐ป ๋ชจ๊ฐ์ฝ 7์ฃผ์ฐจ
์ด์ ๊ธ ๐งโ๐ป ๋ชจ๊ฐ์ฝ 6์ฃผ์ฐจ ๋ณด๋ฌ๊ฐ๊ธฐ.
๐ ์ค๋์ ํ ์ผ
- ๐จโ๐ปBinary Classification ์์ , Bank data classifcation ์ค์ต ๊ณ์..
- ๐จโ๐ปiOS ๊ณต๋ถ ๊ณ์..
์ ๋ฒ ์ฃผ์๋ ์ธ๊ณต์ง๋ฅ ํน๊ฐ์ ์๊ฐํ๋ค. ๊ฐ์ ๊ธฐ๊ฐ์ ์ค์ํธํ๋ฅผ ์ด์ฉํ ์์ดํฐ ์ฑ ๊ฐ๋ฐํน๊ฐ๋ ์กํ์์์ง๋ง, ์ค์ํํธ์ iOS๋ ํผ์ ๊ณต๋ถ๊ฐ ๊ฐ๋ฅํ๋ค๋ ํ๋จ ํ์ KAIST ๊ณต๋ ์ฃผ๊ด-2020๋ ์๋ฐ๊ธฐ ๋ฌธ์ ํด๊ฒฐํ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ๊ฐ๋ฐ ๊ต์ก์ ์ ํํ๋ค. ์ปดํจํฐ๊ณตํ๊ณผ ์ ํ ์ ๋ถํฐ ํญ์ ๊ด์ฌ์ด ์์๋ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์์ง๋ง, ๋ง์ฐํ ์ด๋ ต๋ค ์๊ฐํ์ฌ ์ ๋ป ๊ณต๋ถํด๋ณด์ง ๋ชปํ๊ณ ์์๋๋ฐ, ์ด๋ฒ ๊ธฐํ๋ฅผ ํตํด ๊ณต๋ถํด๋ณด๊ฒ ๋์๋ค. ๊ฐ๋ ์์ฃผ์ ์ค๋ช ์ ํตํด Linear Regression, Binary Classification, CNN, RNN, GAN์ ๊ณต๋ถํ์๊ณ , Google์ Colab์ ํตํด TensorFlow์ Keras, ๊ทธ๋ฆฌ๊ณ ๊ฐ์ข ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ ํ์ฉํด ์ค์ตํด๋ณผ ์ ์๋ ์ข์ ๊ธฐํ์๋ค. ํ์ง๋ง ์ญ์ ๊ฐ์๋ฅผ ๋ฃ๋๊ฒ๊ณผ ์๋ฒฝํ ๋ด๊ฒ์ผ๋ก ๋ง๋๋ ๊ฒ์๋ ์ฐจ์ด๊ฐ ์์๊ณ , ๋จ์ ๋ฐฉํ ๊ธฐ๊ฐ ๋์์ iOS์ ๋ฅ๋ฌ๋์ ๋ณํํด ๊ณต๋ถํ๊ธฐ๋ก ๋ง์๋จน์๋ค.
์ด๋ฒ ๋ชจ๊ฐ์ฝ ๋ชจ์์ ๊ต๋ด 2ํ์ํ๊ด์ 99์นดํ์์ ์งํํ์๋ค.
๐จโ๐ป Binary Classification ์์ , Bank data classifcation ์ค์ต ๊ณ์..
Kaggle์์ Bank Marketing Dataset์ ๋ฐ์ ์ค์ตํ๋ค. ์ด์ ์ํ ๋ง์ผํ ์บ ํ์ธ์ ๋ณด๊ณ ๋ค์ ์ํ ๋ง์ผํ ์บ ํ์ธ์ ์์ธกํ๋ ๋ฌธ์ ์ด๋ค. ์ด๋ฏธ ์ด์ ๋ถํฐ ์ค์ต์ ์งํํ๋ ์ํ๋ผ, ๋ฐ์ดํฐ ์ ๋ฆฌ๋ฅผ ๋๋ง์น๊ณ ๋ชจ๋ธ์ ๋ง๋ค์ด ํ์ต์ ์ํค๋ ๋จ๊ณ์ด๋ค.
์ง๊ธ ์ง๋ฉดํ ์ํฉ์ ํ์ตํ์์ ๋ cost์ ๊ณ์ฐ ๊ฒฐ๊ณผ๊ฐ nan (not a number)๋ก ๋์ค๋ ๋ฌธ์ ์ด๋ค.
bias์ ๋ฌธ์ , Yํ๋ ฌ์ ์ฌ์ด์ฆ๋ฌธ์ ๋ฅผ ์์ฌํด๋ดค์ง๋ง, ๋ฌธ์ ๊ฐ ์๋๊ฒ ๊ฐ์๋ค.
Google์ ํตํด ์ฐพ์๋ณด๋ค Tensorflow KR ์์ log ๋ด๋ถ์ ์ด์ํ ์ซ์๊ฐ ๋ค์ด๊ฐ์ ๊ณ์ฐ์ด ์๋ชป ์ด๋ค์ง๋๊ฒ์ด๋ผ๋ ๊ธ์ ๋ฐ๊ฒฌํ๋ค. log ๋ด๋ถ์ ๋ค์ด๊ฐ๋ ์ ์ค ์๋ชป๋ ์๊ฐ ๋ฌด์์ด ์๋ ์๊ฐํด ๋ณด๋ ์ค Weight์ bias๊ฐ ๋ณด์๋ค.Weigt์ bias๋ tf.random_normal()ํจ์๋ฅผ ํตํด ์ด๊ธฐํํ๋๋ฐ, ์ด ๊ฐ์ด ์ด์ํ๊ฒ ๋ค์ด๊ฐ์ nan์ด ๋จ๋๊ฒ์ผ๋ก ์ถ๋ก ํ๊ณ , ์ด๋ฅผ ๋์ ํด์ ์ ๋ฒ์ฃผ ํน๊ฐ์์ ๋ฐฐ์ ๋ Xavier initializer๋ฅผ ์ฌ์ฉํด๋ณด๊ธฐ๋ก ํ๋ค.
์ด๋ฅผ ํตํด cost๊ฐ ์ ์์ ์ผ๋ก ๊ณ์ฐ๋๋๊ฒ์ ํ์ธํ ์ ์์๋ค. ๊ทธ๋ฌ๋ ์ฌ์ ํ cost๋ ๋์๊ณ , ์์ธก๊ฒฐ๊ณผ๋ ์ด์ 47%์์ 50%์ ๋๋ก(..) ๋ค ์ฐ์ด๋ ๊ทธ ์ ๋๋ ๋์ฌ์์ค ์ด์๋ค. ๊ทธ๋์ ์ด๋ฒ์ step์๋ฅผ 10000๋ก ์ฆ๊ฐ์์ผ๋ณด์๋ค.
์ฌ์ ํ cost๋ 0.69๋ก ์๋ ดํ์๊ณ , accuracy๋ 52%๋ฅผ ์ ์งํ๋ค. learning rate๋ฅผ ์ฌ๋ ค๋ณด๊ธฐ๋ ํ์ง๋ง ํจ๊ณผ๊ฐ ์์๋ค. Kaggle์ฌ์ดํธ์์๋ ์ด ๋ฐ์ดํฐ์ ๋ํด์ ์ด๋ ๊ฒ ์ง์ ๋ชจ๋ธ์ ๋ง๋ค์ด ์ ๊ทผํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ง ์์ ๋ ธํธ๋ถ๋ค๋ฐ์ ์์ด์ ์ฐธ๊ณ ํ ๋งํ ๋ ธํธ๋ถ์ด ์์๋ค. learning rate๋ฅผ ์กฐ์ ํด๋ ๋ณํ์ง ์๋๊ฒ์ ๋ณด๋ฉด local optimal์ ๋น ์ง ๊ฒ ๊ฐ์ง๋ ์์๊ณ , ๋ฌด์ธ๊ฐ ๋ฐ์ดํฐ์ ๋ฌธ์ ๊ฐ ์๋ค๋ ์๊ฐ์ด ๋ค์๋ค.
๐จโ๐ป iOS๊ณต๋ถ ๊ณ์..
Bank marketing dataset์ ์ด์ฉํ binary classificastion ์ค์ต์ ๋๋ฌด ํค๋งค์ด๋ ๋ฐ๋์ ์๊ฐ์กฐ์ ์ ์คํจ, iOS๊ณต๋ถ๋ฅผ ํ์ง ๋ชปํ๋ค. ๐ข
~๋ค์ ์ ๊ธ ๐งโ๐ป ๋ชจ๊ฐ์ฝ 8์ฃผ์ฐจ ๋ณด๋ฌ๊ฐ๊ธฐ.~
Comments