๐Ÿง‘โ€๐Ÿ’ป ๋ชจ๊ฐ์ฝ” 7์ฃผ์ฐจ

๐Ÿง‘โ€๐Ÿ’ป ๋ชจ๊ฐ์ฝ” 7์ฃผ์ฐจ

์ด์ „ ๊ธ€ ๐Ÿง‘โ€๐Ÿ’ป ๋ชจ๊ฐ์ฝ” 6์ฃผ์ฐจ ๋ณด๋Ÿฌ๊ฐ€๊ธฐ.

๐Ÿ‘€ ์˜ค๋Š˜์˜ ํ•  ์ผ

  • ๐Ÿ‘จโ€๐Ÿ’ปBinary Classification ์˜ˆ์ œ, Bank data classifcation ์‹ค์Šต ๊ณ„์†..
  • ๐Ÿ‘จโ€๐Ÿ’ปiOS ๊ณต๋ถ€ ๊ณ„์†..

์ €๋ฒˆ ์ฃผ์—๋Š” ์ธ๊ณต์ง€๋Šฅ ํŠน๊ฐ•์„ ์ˆ˜๊ฐ•ํ–ˆ๋‹ค. ๊ฐ™์€ ๊ธฐ๊ฐ„์— ์Šค์œ„ํŠธํ”„๋ฅผ ์ด์šฉํ•œ ์•„์ดํฐ ์•ฑ ๊ฐœ๋ฐœํŠน๊ฐ•๋„ ์žกํ˜€์žˆ์—ˆ์ง€๋งŒ, ์Šค์œ„ํ”„ํŠธ์™€ iOS๋Š” ํ˜ผ์ž ๊ณต๋ถ€๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ํŒ๋‹จ ํ•˜์— KAIST ๊ณต๋™ ์ฃผ๊ด€-2020๋…„ ์ƒ๋ฐ˜๊ธฐ ๋ฌธ์ œ ํ•ด๊ฒฐํ˜• ์ธ๊ณต์ง€๋Šฅ ๊ธฐ์ˆ ๊ฐœ๋ฐœ ๊ต์œก์„ ์„ ํƒํ–ˆ๋‹ค. ์ปดํ“จํ„ฐ๊ณตํ•™๊ณผ ์ž…ํ•™ ์ „๋ถ€ํ„ฐ ํ•ญ์ƒ ๊ด€์‹ฌ์ด ์žˆ์—ˆ๋˜ ์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์˜€์ง€๋งŒ, ๋ง‰์—ฐํžˆ ์–ด๋ ต๋‹ค ์ƒ๊ฐํ•˜์—ฌ ์„ ๋œป ๊ณต๋ถ€ํ•ด๋ณด์ง€ ๋ชปํ•˜๊ณ  ์žˆ์—ˆ๋Š”๋ฐ, ์ด๋ฒˆ ๊ธฐํšŒ๋ฅผ ํ†ตํ•ด ๊ณต๋ถ€ํ•ด๋ณด๊ฒŒ ๋˜์—ˆ๋‹ค. ๊ฐœ๋… ์œ„์ฃผ์˜ ์„ค๋ช…์„ ํ†ตํ•ด Linear Regression, Binary Classification, CNN, RNN, GAN์„ ๊ณต๋ถ€ํ•˜์˜€๊ณ , Google์˜ Colab์„ ํ†ตํ•ด TensorFlow์™€ Keras, ๊ทธ๋ฆฌ๊ณ  ๊ฐ์ข… ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋“ค์„ ํ™œ์šฉํ•ด ์‹ค์Šตํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ์ข‹์€ ๊ธฐํšŒ์˜€๋‹ค. ํ•˜์ง€๋งŒ ์—ญ์‹œ ๊ฐ•์˜๋ฅผ ๋“ฃ๋Š”๊ฒƒ๊ณผ ์™„๋ฒฝํžˆ ๋‚ด๊ฒƒ์œผ๋กœ ๋งŒ๋“œ๋Š” ๊ฒƒ์—๋Š” ์ฐจ์ด๊ฐ€ ์žˆ์—ˆ๊ณ , ๋‚จ์€ ๋ฐฉํ•™ ๊ธฐ๊ฐ„ ๋™์•ˆ์€ iOS์™€ ๋”ฅ๋Ÿฌ๋‹์„ ๋ณ‘ํ–‰ํ•ด ๊ณต๋ถ€ํ•˜๊ธฐ๋กœ ๋งˆ์Œ๋จน์—ˆ๋‹ค.

๋‹ค๊ณผ
์‚ฌ์—…๋‹จ์—์„œ ์ค€ 5000์›์งœ๋ฆฌ ์ฟ ํฐ์„ ๋งค๋ฒˆ ์ž˜ ํ™œ์šฉํ•˜๊ณ  ์žˆ๋‹ค..

์ด๋ฒˆ ๋ชจ๊ฐ์ฝ” ๋ชจ์ž„์€ ๊ต๋‚ด 2ํ•™์ƒํšŒ๊ด€์˜ 99์นดํŽ˜์—์„œ ์ง„ํ–‰ํ•˜์˜€๋‹ค.


๐Ÿ‘จโ€๐Ÿ’ป Binary Classification ์˜ˆ์ œ, Bank data classifcation ์‹ค์Šต ๊ณ„์†..

Kaggle์—์„œ Bank Marketing Dataset์„ ๋ฐ›์•„ ์‹ค์Šตํ–ˆ๋‹ค. ์ด์ „ ์€ํ–‰ ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์„ ๋ณด๊ณ  ๋‹ค์Œ ์€ํ–‰ ๋งˆ์ผ€ํŒ… ์บ ํŽ˜์ธ์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ์ด๋‹ค. ์ด๋ฏธ ์–ด์ œ๋ถ€ํ„ฐ ์‹ค์Šต์„ ์ง„ํ–‰ํ•˜๋˜ ์ƒํƒœ๋ผ, ๋ฐ์ดํ„ฐ ์ •๋ฆฌ๋ฅผ ๋๋งˆ์น˜๊ณ  ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด ํ•™์Šต์„ ์‹œํ‚ค๋Š” ๋‹จ๊ณ„์ด๋‹ค.

nan
cost์˜ ๊ฒฐ๊ณผ๊ฐ€ nan์ด ๋‚˜์˜จ๋‹ค..

์ง€๊ธˆ ์ง๋ฉดํ•œ ์ƒํ™ฉ์€ ํ•™์Šตํ•˜์˜€์„ ๋•Œ cost์˜ ๊ณ„์‚ฐ ๊ฒฐ๊ณผ๊ฐ€ nan (not a number)๋กœ ๋‚˜์˜ค๋Š” ๋ฌธ์ œ์ด๋‹ค. bias์˜ ๋ฌธ์ œ, Yํ–‰๋ ฌ์˜ ์‚ฌ์ด์ฆˆ๋ฌธ์ œ๋ฅผ ์˜์‹ฌํ•ด๋ดค์ง€๋งŒ, ๋ฌธ์ œ๊ฐ€ ์•„๋‹Œ๊ฒƒ ๊ฐ™์•˜๋‹ค. Google์„ ํ†ตํ•ด ์ฐพ์•„๋ณด๋‹ค Tensorflow KR ์—์„œ log ๋‚ด๋ถ€์— ์ด์ƒํ•œ ์ˆซ์ž๊ฐ€ ๋“ค์–ด๊ฐ€์„œ ๊ณ„์‚ฐ์ด ์ž˜๋ชป ์ด๋ค„์ง€๋Š”๊ฒƒ์ด๋ผ๋Š” ๊ธ€์„ ๋ฐœ๊ฒฌํ–ˆ๋‹ค. log ๋‚ด๋ถ€์— ๋“ค์–ด๊ฐ€๋Š” ์ˆ˜ ์ค‘ ์ž˜๋ชป๋  ์ˆ˜๊ฐ€ ๋ฌด์—‡์ด ์žˆ๋‚˜ ์ƒ๊ฐํ•ด ๋ณด๋˜ ์ค‘ Weight์™€ bias๊ฐ€ ๋ณด์˜€๋‹ค.Weigt์™€ bias๋Š” tf.random_normal()ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ์ดˆ๊ธฐํ™”ํ–ˆ๋Š”๋ฐ, ์ด ๊ฐ’์ด ์ด์ƒํ•˜๊ฒŒ ๋“ค์–ด๊ฐ€์„œ nan์ด ๋œจ๋Š”๊ฒƒ์œผ๋กœ ์ถ”๋ก ํ–ˆ๊ณ , ์ด๋ฅผ ๋Œ€์‹ ํ•ด์„œ ์ €๋ฒˆ์ฃผ ํŠน๊ฐ•์—์„œ ๋ฐฐ์› ๋˜ Xavier initializer๋ฅผ ์‚ฌ์šฉํ•ด๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค.

xavier
Xavier initializer๋ฅผ ์‚ฌ์šฉํ•˜์ž cost๊ณ„์‚ฐ์ด ์ •์ƒ์ ์œผ๋กœ ๋˜์—ˆ๋‹ค.

์ด๋ฅผ ํ†ตํ•ด cost๊ฐ€ ์ •์ƒ์ ์œผ๋กœ ๊ณ„์‚ฐ๋˜๋Š”๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์—ฌ์ „ํžˆ cost๋Š” ๋†’์•˜๊ณ , ์˜ˆ์ธก๊ฒฐ๊ณผ๋„ ์ด์ „ 47%์—์„œ 50%์ •๋„๋กœ(..) ๋‹ค ์ฐ์–ด๋„ ๊ทธ ์ •๋„๋Š” ๋‚˜์˜ฌ์ˆ˜์ค€ ์ด์—ˆ๋‹ค. ๊ทธ๋ž˜์„œ ์ด๋ฒˆ์—” step์ˆ˜๋ฅผ 10000๋กœ ์ฆ๊ฐ€์‹œ์ผœ๋ณด์•˜๋‹ค.

cost
cost๊ฐ€ 0.69๋กœ ์ˆ˜๋ ดํ•œ๋‹ค..

์—ฌ์ „ํžˆ cost๋Š” 0.69๋กœ ์ˆ˜๋ ดํ•˜์˜€๊ณ , accuracy๋„ 52%๋ฅผ ์œ ์ง€ํ–ˆ๋‹ค. learning rate๋ฅผ ์˜ฌ๋ ค๋ณด๊ธฐ๋„ ํ–ˆ์ง€๋งŒ ํšจ๊ณผ๊ฐ€ ์—†์—ˆ๋‹ค. Kaggle์‚ฌ์ดํŠธ์—์„œ๋Š” ์ด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ ์ด๋ ‡๊ฒŒ ์ง์ ‘ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด ์ ‘๊ทผํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š์€ ๋…ธํŠธ๋ถ๋“ค๋ฐ–์— ์—†์–ด์„œ ์ฐธ๊ณ ํ• ๋งŒํ•œ ๋…ธํŠธ๋ถ์ด ์—†์—ˆ๋‹ค. learning rate๋ฅผ ์กฐ์ ˆํ•ด๋„ ๋ณ€ํ•˜์ง€ ์•Š๋Š”๊ฒƒ์„ ๋ณด๋ฉด local optimal์— ๋น ์ง„ ๊ฒƒ ๊ฐ™์ง€๋Š” ์•Š์•˜๊ณ , ๋ฌด์–ธ๊ฐ€ ๋ฐ์ดํ„ฐ์— ๋ฌธ์ œ๊ฐ€ ์žˆ๋‹ค๋Š” ์ƒ๊ฐ์ด ๋“ค์—ˆ๋‹ค.

๐Ÿ‘จโ€๐Ÿ’ป iOS๊ณต๋ถ€ ๊ณ„์†..

Bank marketing dataset์„ ์ด์šฉํ•œ binary classificastion ์‹ค์Šต์— ๋„ˆ๋ฌด ํ—ค๋งค์ด๋Š” ๋ฐ”๋žŒ์— ์‹œ๊ฐ„์กฐ์ ˆ์— ์‹คํŒจ, iOS๊ณต๋ถ€๋ฅผ ํ•˜์ง€ ๋ชปํ–ˆ๋‹ค. ๐Ÿ˜ข

~๋‹ค์Œ ์ „ ๊ธ€ ๐Ÿง‘โ€๐Ÿ’ป ๋ชจ๊ฐ์ฝ” 8์ฃผ์ฐจ ๋ณด๋Ÿฌ๊ฐ€๊ธฐ.~

Share: Twitter Facebook
Seunghun Yang's Picture

About Seunghun Yang

Seunghun is undergraduate student at Computer Science Engineering in CNU(Chungnam National University).

Daejeon, South Korea

Comments