ํ‹ฐ์Šคํ† ๋ฆฌ ๋ทฐ

์ถœ์ฒ˜ : ๊ธฐ๊ณ„ํ•™์Šต(Machine Learning, ๋จธ์‹  ๋Ÿฌ๋‹)์€ ์ฆ๊ฒ๋‹ค! Part 1

 

๊ธฐ๊ณ„ ํ•™์Šต(Machine Learning, ๋จธ์‹  ๋Ÿฌ๋‹)์€ ์ฆ๊ฒ๋‹ค! Part 1

(์›๋ฌธ : Machine Learning is Fun! by Adam Geitgey)

medium.com

Machine Learning์ด๋ž€ ๋ฌด์—‡์ธ๊ฐ€?

- Machine Learning์€ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋งž์ถค ์ฝ”๋“œ(custom code)๋ฅผ ์ž‘์„ฑํ•˜์ง€ ์•Š๊ณ ๋„ ์ผ๋ จ์˜ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ๋ฌด์–ธ๊ฐ€ ํฅ๋ฏธ๋กœ์šด ๊ฒƒ์„ ์•Œ๋ ค์ค„ ์ˆ˜ ์žˆ๋Š” ์ผ๋ฐ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜(generic algorithms)์ด ์žˆ๋‹ค๋Š” ์•„์ด๋””์–ด!

- ex) ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ข…๋ฅ˜๊ฐ€ classification์ผ ๋•Œ, ์†์œผ๋กœ ์“ด ์ˆซ์ž๋ฅผ ์ธ์‹ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๋™์ผํ•œ classification ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ฝ”๋“œ ๋ณ€๊ฒฝ์—†์ด ์‚ฌ์šฉํ•ด์„œ, ์ด๋ฉ”์ผ์„ ์ŠคํŒธ๊ณผ ์ŠคํŒธ์ด ์•„๋‹Œ ๊ฒƒ์œผ๋กœ ๋ถ„๋ฅ˜ ๊ฐ€๋Šฅ!

- ๋™์ผํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด์ง€๋งŒ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜๋ฉด ๋‹ค๋ฅธ ๋ถ„๋ฅ˜ ๋กœ์ง์ด ์ž๋™์œผ๋กœ ๋งŒ๋“ค์–ด์ง€๊ฒŒ ๋จ

- Machine Learning์€ ์ด๋Ÿฐ ์ข…๋ฅ˜์˜ ์ผ๋ฐ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜(generic algorithm)์„ ํฌํ•จํ•˜๋Š” ํฌ๊ด„์ ์ธ ์šฉ์–ด

 

๋‘ ์ข…๋ฅ˜์˜ Machine Learning ์•Œ๊ณ ๋ฆฌ์ฆ˜

- supervised learning๊ณผ unsupervised learning์œผ๋กœ ๋ถ„๋ฅ˜

 

Supervised Learning

- ex) ๋‚ด๊ฐ€ ๋ถ€๋™์‚ฐ ์ค‘๊ฐœ์ธ! ๋น„์ฆˆ๋‹ˆ์Šค๊ฐ€ ์„ฑ์žฅํ•จ์— ๋”ฐ๋ผ ๋‹น์‹ ์„ ๋„์™€์ค„ ์ง์›์„ ๊ณ ์šฉํ•˜๊ธฐ๋กœ ํ•˜๋Š”๋ฐ... 

- ๋‚˜๋Š” ์ฃผํƒ์„ ๋ณด๊ธฐ๋งŒ ํ•ด๋„ ์–ผ๋งˆ์˜ ๊ฐ€์น˜๊ฐ€ ์žˆ๋Š”์ง€ ์•Œ ์ˆ˜ ์žˆ์ง€๋งŒ ์ง์›์€ ๊ฒฝํ—˜์ด ์—†๊ธฐ์— ์ž˜ ๋ชจ๋ฆ„

- ์ง์›์„ ๋•๊ธฐ ์œ„ํ•ด(๋‚ด๊ฐ€ ์‰ฌ๊ธฐ ์œ„ํ•ด ใ…Ž) ์ฃผํƒ์˜ ํฌ๊ธฐ, ์ง€์—ญ ๋“ฑ์„ ๊ธฐ์ค€์œผ๋กœ ์ฃผํƒ ๊ฐ€์น˜๋ฅผ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์•ฑ ๊ฐœ๋ฐœ

- 3๊ฐœ์›” ๋™์•ˆ ์ฃผํƒ์„ ํŒ” ๋•Œ๋งˆ๋‹ค ์ •๋ณด๋ฅผ ๊ธฐ๋ก, ๋ฐฉ์˜ ๊ฐœ์ˆ˜, ํ‰๋ฐฉ ํ”ผํŠธ ํฌ๊ธฐ ๋“ฑ ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ๊ธฐ๋กํ•˜๊ณ  ์ตœ์ข… ํŒ๋งค ๊ฐ€๊ฒฉ๋„ ๊ธฐ๋ก

์ด๊ฒƒ์ด ๋ฐ”๋กœ training data

- ๊ธฐ๋กํ•œ training data๋ฅผ ์‚ฌ์šฉํ•ด ํ•ด๋‹น ์ง€์—ญ์˜ ๋‹ค๋ฅธ ์ฃผํƒ์ด ์–ผ๋งˆ์˜ ๊ฐ€์น˜๊ฐ€ ์žˆ๋Š”์ง€ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ํ”„๋กœ๊ทธ๋žจ ๊ฐœ๋ฐœ

training data๋ฅผ ์‚ฌ์šฉํ•ด ๋‹ค๋ฅธ ์ฃผํƒ์˜ ๊ฐ€๊ฒฉ ์˜ˆ์ธก

- ์ด๊ฒƒ์„ supervised learning์ด๋ผ๊ณ  ํ•จ

- ๋‚˜๋Š” ๊ฐ๊ฐ์˜ ์ฃผํƒ๋“ค์ด ์–ผ๋งˆ์— ํŒ”๋ ธ๋Š”์ง€ ์•Œ๊ณ  ์žˆ์Œ, ๋‹ค์‹œ ๋งํ•ด ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋‹ต์„ ์•Œ๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์—ฌ๊ธฐ์—์„œ ๋‹ต์„ ๋„์ถœํ•ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ž„

 

- ์•ฑ์„ ์ œ์ž‘ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ ์ฃผํƒ์— ๋Œ€ํ•œ training data๋ฅผ machine learning ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋„ฃ์–ด์•ผ ํ•จ

- ์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ํ•ด๋‹น ์ˆซ์ž์˜ ์˜๋ฏธ๋ฅผ ์•Œ์•„๋‚ผ ์ˆ˜ ์žˆ๋Š” ์ˆ˜ํ•™์ด ๋ฌด์—‡์ธ์ง€ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•ด ๋…ธ๋ ฅ

์ˆ˜ํ•™ ๋ฌธ์ œ๋ฅผ ํ‘ธ๋Š” ๊ฒƒ๊ณผ ๋™์ผ

 

์—ฐ์‚ฐ ๊ธฐํ˜ธ๊ฐ€ ์ง€์›Œ์ง„ ์ˆ˜ํ•™ ๋ฌธ์ œ

- ์—ฌ๊ธฐ์—์„œ ์˜ค๋ฅธ์ชฝ์— ์žˆ๋Š” ๊ฐ๊ฐ์˜ ๋‹ต์„ ์–ป๊ธฐ ์œ„ํ•ด ์™ผ์ชฝ์— ์žˆ๋Š” ์ˆซ์ž๋“ค์—๊ฒŒ ๋ฌด์–ธ๊ฐ€๋ฅผ ํ•˜๋ฉด ๋œ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ์Œ

- ๋‹ต์€ ๊ณฑํ•˜๊ธฐ, ๋นผ๊ธฐ ใ…Žใ…Ž

 

- Mahine Learning์—์„œ ๋‚˜๋Š”, ์ปดํ“จํ„ฐ๊ฐ€ ๊ทธ ๊ด€๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๋„๋ก ๋‚ด๋ฒ„๋ ค ๋‘๋ฉด ๋จ

- ๋˜ํ•œ ํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ์ˆ˜ํ•™์ด ๋ฌด์—‡์ธ์ง€ ์•Œ๊ฒŒ ๋˜๋ฉด ๊ฐ™์€ ์œ ํ˜•์˜ ๋‹ค๋ฅธ ๋ฌธ์ œ์— ๋Œ€ํ•ด์„œ๋„ ๋‹ต์„ ์•Œ ์ˆ˜ ์žˆ์Œ

 

Unsupervised Learning 

- ex) ๋ถ€๋™์‚ฐ ์ค‘๊ฐœ์—…์ž์˜ ์‚ฌ๋ก€๋กœ ๋Œ์•„๊ฐ€์„œ, ๊ฐ ์ฃผํƒ์˜ ํŒ๋งค๊ฐ€๊ฒฉ์„ ๋ชจ๋ฅด๋Š” ๊ฒฝ์šฐ์—๋Š” ์–ด๋–ป๊ฒŒ ๋ ๊นŒ?

- ๋‚ด๊ฐ€ ์•Œ๊ณ  ์žˆ๋Š” ์ •๋ณด๊ฐ€ ๊ฐ ์ง‘์˜ ํฌ๊ธฐ, ์œ„์น˜ ๊ฐ™์€ ๊ฒƒ ๋ฟ์ด๋ผ๋„ machine learning์„ ํ†ตํ•ด ์ผ์„ ํ•  ์ˆ˜ ์žˆ์Œ

์ˆซ์ž๊ฐ€ ์•Œ๋ ค์ง€์ง€ ์•Š์Œ(๊ฐ€๊ฒฉ ๋“ฑ)

- ์ด ๋ฐ์ดํ„ฐ๋กœ ๋ฌด์—‡์„ ํ•  ์ˆ˜ ์žˆ์„๊นŒ? ๋ฐ์ดํ„ฐ์—์„œ ์„œ๋กœ ๋‹ค๋ฅธ ์‹œ์žฅ ์„ธ๊ทธ๋จผํŠธ(market, segments)๋ฅผ ์ž๋™์œผ๋กœ ์‹๋ณ„ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋งŒ๋“ค ์ˆ˜๋„ ์žˆ์Œ

- ์–ด์ฉŒ๋ฉด ๋Œ€ํ•™ ๊ทผ์ฒ˜์˜ ์ฃผํƒ ๊ตฌ๋งค์ž๋Š” ์นจ์‹ค์ด ๋งŽ์€ ์ž‘์€ ์ง‘์„ ์„ ํ˜ธํ•˜์ง€๋งŒ ๊ต์™ธ์˜ ์ฃผํƒ ๊ตฌ๋งค์ž๋Š” ๋ฉด์ ์ด ๋„“์€ ์นจ์‹ค์ด 3๊ฐœ์ธ ์ง‘์„ ์„ ํ˜ธํ•œ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์•Œ์•„๋‚ผ ์ˆ˜ ์žˆ์Œ

→ ์œ„์ฒ˜๋Ÿผ ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ๊ณ ๊ฐ์— ๋Œ€ํ•ด ์•Œ๊ฒŒ๋˜๋ฉด ๋งˆ์ผ€ํŒ… ํ™œ๋™์— ์ง์ ‘์ ์œผ๋กœ ๋„์›€์„ ๋ฐ›์„ ์ˆ˜ ์žˆ์„ ๊ฒƒ

 

- ๋˜ํ•œ, ๋‹ค๋ฅธ ์ฃผํƒ๋“ค๊ณผ ํŠน์ดํ•œ ์ฃผํƒ์„ ์‹๋ณ„ํ•˜๋Š” ๊ฒƒ, ์ด ํŠน์ดํ•œ ์ฃผํƒ๋“ค์ด ๊ฑฐ๋Œ€ํ•œ ์ €ํƒ์ด๋ผ๋ฉด ๋” ๋งŽ์€ ์ˆ˜์ˆ˜๋ฃŒ๋ฅผ ๋ฐ›์„ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ง์›๋“ค์„ ์ด๊ณณ์— ์ง‘์ค‘์‹œํ‚ฌ์ˆ˜๋„ ์žˆ์Œ

 

- ๋Œ€๋ถ€๋ถ„ supervised learning์— ์ง‘์ค‘ํ•˜์ง€๋งŒ, unsupervised learning์ด ๋œ ์œ ์šฉํ•˜๊ฑฐ๋‚˜ ํฅ๋ฏธ๋กญ์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์€ ์•„๋‹˜

- unsupervised learning์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ํ–ฅ์ƒ๋จ์— ๋”ฐ๋ผ ๋”์šฑ๋” ์ค‘์š”ํ•ด์ง€๊ณ  ์žˆ์Œ, ์™œ๋ƒํ•˜๋ฉด unsupervised learning์ด ์ •ํ™•ํ•œ ๋‹ต์„ ๊ฐ€์ง„ ๋ผ๋ฒจ์ด ๋ถ™์—ฌ์ง„ ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋‹Œ ๊ฒฝ์šฐ์— ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ

 

๊ทธ๋Ÿฐ๋ฐ, ์ •๋ง๋กœ ์ฃผํƒ ๊ฐ€๊ฒฉ์ด ์–ผ๋งˆ์ธ์ง€ "ํ•™์Šต"์„ ํ†ตํ•ด ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์„๊นŒ?

- ์ธ๊ฐ„์˜ ๋‘๋‡Œ๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์ƒํ™ฉ์— ๋Œ€ํ•ด ์ดํ•ดํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ช…์‹œ์ ์œผ๋กœ ๊ฐ€๋ฅด์ณ ์ฃผ์ง€ ์•Š์•„๋„ ์ƒํ™ฉ์„ ์–ด๋–ป๊ฒŒ ํ•ด๊ฒฐํ•˜๋ฉด ๋˜๋Š”์ง€ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์Œ

- ์ผ์— ์ ์‘ํ•˜๋‹ค๋ณด๋ฉด "๋А๋‚Œ(์ด‰)"์„ ๋ณธ๋Šฅ์ ์œผ๋กœ ๊ฐ–๊ฒŒ ๋  ๊ฒƒ์ธ๋ฐ, Strong AI ์—ฐ๊ตฌ์˜ ๋ชฉํ‘œ๊ฐ€ ๋ฐ”๋กœ ์ด๋Ÿฌํ•œ ์ธ๊ฐ„์˜ ๋Šฅ๋ ฅ์„ ์ปดํ“จํ„ฐ๋กœ ๋ณต์ œํ•˜๋Š” ๊ฒƒ

 

- ํ˜„์žฌ์˜ machine learning์€ ๊ทธ๋Ÿฐ ์ˆ˜์ค€์ด ์•„๋‹ˆ๋ฉฐ ๋งค์šฐ ๊ตฌ์ฒด์ ์ด๊ณ  ์ œํ•œ์ ์ธ ๋ฌธ์ œ์— ์ดˆ์ ์„ ๋งž์ถ˜ ๊ฒฝ์šฐ์—๋งŒ ๋™์ž‘

- ์ด๋Ÿฌํ•œ ๊ฒฝ์šฐ "ํ•™์Šต"์— ๋Œ€ํ•œ ๋” ๋‚˜์€ ์ •์˜๋Š” "์•ฝ๊ฐ„์˜ ์ƒ˜ํ”Œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํŠน์ • ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ์ •์‹์„ ์•Œ์•„๋‚ด๋Š” ๊ฒƒ"์ด ๋  ์ˆ˜ ์žˆ์Œ

→ Machine Learning

 

ํ”„๋กœ๊ทธ๋žจ ์ž‘์„ฑ 

def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
  price = 0
# ๋‹ด๋‹น ์ง€์—ญ๋‚ด ํ‰๊ท  ์ฃผํƒ ๊ฐ€๊ฒฉ์€ ํ‰๋ฐฉ ํ”ผํŠธ ๋‹น 200 ๋‹ฌ๋Ÿฌ์ด๋‹ค
  price_per_sqft = 200
if neighborhood == "hipsterton":
    # ํ•˜์ง€๋งŒ ๋‹ค๋ฅธ ์ง€์—ญ์€ ์กฐ๊ธˆ ๋” ๋น„์‹ธ๋‹ค
    price_per_sqft = 400
elif neighborhood == "skid row":
    # ๊ทธ๋ฆฌ๊ณ  ๋‹ค๋ฅธ ๋ช‡๋ช‡ ์ง€์—ญ์€ ์‹ธ๋‹ค
    price_per_sqft = 100
# ์ฃผํƒ์˜ ํฌ๊ธฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ฃผํƒ ๊ฐ€๊ฒฉ์„ ์ถ”์ •ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์‹œ์ž‘ํ•œ๋‹ค
  price = price_per_sqft * sqft
# ์ด์ œ ์นจ์‹ค์˜ ๊ฐœ์ˆ˜๋กœ ์ถ”์ •์น˜๋ฅผ ์กฐ์ •ํ•œ๋‹ค
  if num_of_bedrooms == 0:
    # ์›๋ฃธํ˜• ์•„ํŒŒํŠธ๋Š” ๊ฐ€๊ฒฉ์ด ์‹ธ๋‹ค
    price = priceโ€Š—โ€Š20000
  else:
    # ์ผ๋ฐ˜์ ์œผ๋กœ ๋งŽ์€ ์นจ์‹ค์ด ์žˆ๋Š” ์ฃผํƒ์ด ๋” ๋น„์‹ธ๋‹ค
    price = price + (num_of_bedrooms * 1000)
return price

- ์ฃผํƒ์˜ ๊ฐ€์น˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ํ”„๋กœ๊ทธ๋žจ ์ž‘์„ฑ

- ์ด๋Ÿฐ ํ”„๋กœ๊ทธ๋žจ์€ ๊ฒฐ์ฝ” ์™„๋ฒฝํ•˜์ง€ ์•Š์œผ๋ฉฐ ๊ฐ€๊ฒฉ์ด ๋ณ€ํ•จ์— ๋”ฐ๋ผ ๋กœ์ง์„ ์œ ์ง€ํ•˜๊ธฐ ์–ด๋ ค์šธ ๊ฒƒ

 

def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
  price = <์ปดํ“จํ„ฐ, ๋‚˜ ๋Œ€์‹  ์ˆ˜ํ•™์‹ ์ข€ ๋งŒ๋“ค์–ด์ค˜>
return price

- ์ปดํ“จํ„ฐ๊ฐ€ ์ด ๊ธฐ๋Šฅ์„ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ๋” ์ข‹์Œ

- ๊ฐ€๊ฒฉ → ์ŠคํŠœ / ์žฌ๋ฃŒ๋“ค → ์นจ์‹ค์˜ ๊ฐœ์ˆ˜, ํ‰๋ฐฉ ํ”ผํŠธ ๋ฉด์  ๋ฐ ์ง€์—ญ

- ๊ฐ ์žฌ๋ฃŒ๊ฐ€ ์ตœ์ข… ๊ฐ€๊ฒฉ์— ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด ์ด ์ตœ์ข… ๊ฐ€๊ฒฉ์„ ๋งŒ๋“ค์–ด ์ค„ ํ˜ผํ•ฉ ์žฌ๋ฃŒ์˜ ์ •ํ™•ํ•œ ๋น„์œจ์ด ์žˆ์„ ๊ฒƒ

 

def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
 price = 0
# ์ด๊ฑด ํ•œ ๊ผฌ์ง‘ ๋„ฃ๊ณ 
 price += num_of_bedrooms * .841231951398213
# ๊ทธ๋ฆฌ๊ณ  ์ €๊ฑด ํ•œ ์Šคํ”ˆ ์ •๋„ ๋„ฃ๊ณ 
 price += sqft * 1231.1231231
# ์ด๊ฑด ์•„๋งˆ๋„ ํ•œ ์คŒ ๋„ฃ๊ณ 
 price += neighborhood * 2.3242341421
# ๊ทธ๋ฆฌ๊ณ  ๋งˆ์ง€๋ง‰์œผ๋กœ, ์•ฝ๊ฐ„์˜ ์†Œ๊ธˆ์„ ์ถ”๊ฐ€
 price += 201.23432095
return price

- ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์›๋ž˜ ํ•จ์ˆ˜๋ฅผ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ค„์ผ ์ˆ˜ ์žˆ์Œ

- ์ˆซ์ž๋ฅผ ์ฃผ๋ชฉ → ์ด ์ˆซ์ž๋“ค์€ ๋ฐ”๋กœ ๊ฐ€์ค‘์น˜

- ๋ชจ๋“  ์ฃผํƒ์— ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์™„๋ฒฝํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ์ฐพ์•„๋‚ผ ์ˆ˜๋งŒ ์žˆ๋‹ค๋ฉด ์šฐ๋ฆฌ์˜ ํ•จ์ˆ˜๋Š” ์ง‘๊ฐ’์„ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ

 


์ตœ์ƒ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์•Œ์•„๋‚ผ ๋•Œ์˜ ๋ฐฉ๋ฒ•

Step 1:

๋จผ์ € ๊ฐ€์ค‘์น˜๋ฅผ 1.0์œผ๋กœ ํ•˜๊ณ  ์‹œ์ž‘

def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
 price = 0
# ์ด๊ฑด ํ•œ ๊ผฌ์ง‘ ๋„ฃ๊ณ 
 price += num_of_bedrooms * 1.0
# ๊ทธ๋ฆฌ๊ณ  ์ €๊ฑด ํ•œ ์Šคํ”ˆ ์ •๋„ ๋„ฃ๊ณ 
 price += sqft * 1.0
# ์ด๊ฑด ์•„๋งˆ๋„ ํ•œ ์คŒ ๋„ฃ๊ณ 
 price += neighborhood * 1.0
# ๊ทธ๋ฆฌ๊ณ  ๋งˆ์ง€๋ง‰์œผ๋กœ, ์•ฝ๊ฐ„์˜ ์†Œ๊ธˆ์„ ์ถ”๊ฐ€
 price += 1.0
return price

 

Step 2:

์•Œ๊ณ  ์žˆ๋Š” ๋ชจ๋“  ์ฃผํƒ ๋ฐ์ดํ„ฐ๋ฅผ ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ์‹คํ–‰ํ•ด๋ณด๊ณ , ๊ฐ ์ฃผํƒ์˜ ์ •ํ™•ํ•œ ๊ฐ€๊ฒฉ๊ณผ ์ด ํ•จ์ˆ˜๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š”์ง€ ๋น„๊ต

 

ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ๊ฐ ์ฃผํƒ์˜ ๊ฐ€๊ฒฉ ์˜ˆ์ƒ

- ์˜ˆ๋ฅผ ๋“ค์–ด ์ฒซ๋ฒˆ์งธ ์ฃผํƒ์€ ์‹ค์ œ๋กœ๋Š” $250,000์— ํŒ๋งค๋˜์—ˆ๊ณ  ํ•จ์ˆ˜์—์„  $178,000์— ํŒ๋งค๋˜์—ˆ๋‹ค๊ณ  ์ถ”์ •๋˜์—ˆ๋Š”๋ฐ, ์ด ์ฃผํƒ ํ•˜๋‚˜๋งŒ ๋ณด๋”๋ผ๋„ $72,000๋งŒํผ ์ฐจ์ด

 

- ์ด์ œ dataset์— ์žˆ๋Š” ๊ฐ ์ฃผํƒ๋งˆ๋‹ค ์ฐจ์ด๋‚œ ๊ฐ€๊ฒฉ์˜ ์ œ๊ณฑ๊ฐ’์„ ์ถ”๊ฐ€, dataset์—๋Š” 500๊ฐœ์˜ ์ฃผํƒ ํŒ๋งค ์ •๋ณด๊ฐ€ ์žˆ์—ˆ๊ณ  ๊ฐ ์ฃผํƒ์— ๋Œ€ํ•ด ๋‹น์‹ ์˜ ํ•จ์ˆ˜๊ฐ€ ์ถ”์ •ํ•œ ๊ฐ’๊ณผ ์‹ค์ œ ๊ฐ€๊ฒฉ์˜ ์ฐจ์ด๋ฅผ ์ œ๊ณฑํ•œ ๊ฐ’์˜ ์ดํ•ฉ์€ $86,123,373๋ผ๊ณ  ๊ฐ€์ •

→ ํ•จ์ˆ˜๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ž˜๋ชป๋˜์—ˆ๋Š”์ง€ ์•Œ ์ˆ˜ ์žˆ์Œ

 

- ์ด ํ•ฉ๊ณ„๋ฅผ 500์œผ๋กœ ๋‚˜๋ˆ ์„œ ๊ฐ ์ฃผํƒ๋ณ„๋กœ ์–ผ๋งˆ๋‚˜ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š”์ง€ ํ‰๊ท ๊ฐ’์„ ๊ตฌํ•จ

→ ํ‰๊ท  ์˜ค๋ฅ˜ ๊ฐ’์„ ์ด ํ•จ์ˆ˜์˜ ๋น„์šฉ(cost)๋ผ๊ณ  ํ•จ

 

- ๊ฐ€์ค‘์น˜๋ฅผ ์ž˜ ์กฐ์ •ํ•ด ์ด ๋น„์šฉ์„ 0์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค๋ฉด, ํ•จ์ˆ˜๋Š” ์™„๋ฒฝํ•ด์ง€๊ฒŒ ๋จ

- ๋ชจ๋“  ๊ฒฝ์šฐ์— ๋Œ€ํ•ด์„œ ํ•จ์ˆ˜๊ฐ€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ฃผํƒ ๊ฐ€๊ฒฉ์„ ์™„๋ฒฝํ•˜๊ฒŒ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธ

- ๋‹ค๋ฅธ ๊ฐ€์ค‘์น˜๋ฅผ ์‹œ๋„ํ•ด ๊ฐ€๋Šฅํ•œ ์ด ๋น„์šฉ์„ ๋‚ฎ์ถ”๋ ค๋Š” ๊ฒƒ์ด ์šฐ๋ฆฌ์˜ ๋ชฉํ‘œ

 

Step 3:

๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๊ฐ€์ค‘์น˜๋ฅผ ์กฐํ•ฉ

- 2๋‹จ๊ณ„๋ฅผ ๊ณ„์† ๋ฐ˜๋ณต, ์–ด๋–ค ์กฐํ•ฉ์˜ ๊ฐ€์ค‘์น˜๋Š” ๋น„์šฉ์„ 0์— ๊ฐ€๊น๊ฒŒ ๋งŒ๋“ค์–ด ์ฃผ๋Š” ๊ฒƒ์„ ์‚ฌ์šฉํ•˜๋ฉด ๋จ

 


 

- ์œ„์—์„œ ์šฐ๋ฆฌ๋Š” ์•ฝ๊ฐ„์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ ธ์™€ ์ด๋ฅผ ์„ธ๊ฐ€์ง€์˜ ์ผ๋ฐ˜์ ์ด๊ณ  ์•„์ฃผ ๊ฐ„๋‹จํ•œ ๋‹จ๊ณ„์— ์ œ๊ณตํ•œ ๋‹ค์Œ, ํ•ด๋‹น ์ง€์—ญ์˜ ๋ชจ๋“  ์ง‘์˜ ๊ฐ€๊ฒฉ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค์–ด ๋ƒ„

 

ํ•˜์ง€๋งŒ

1. 40๋…„ ๋„˜๊ฒŒ ๋งŽ์€ ๋ถ„์•ผ(์–ธ์–ดํ•™/๋ฒˆ์—ญ)์—์„œ ์—ฐ๊ตฌํ•œ ๊ฒฐ๊ณผ, "์ˆซ์ž๋กœ ๋งŒ๋“  ์ŠคํŠœ๋ฅผ ์ “๋Š”"(์œ„์—์„œ ๋งŒ๋“ ) ์ด๋Ÿฌํ•œ ์ผ๋ฐ˜ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋ช…์‹œ์ ์ธ ๊ทœ์น™์œผ๋กœ ์ ‘๊ทผํ•˜๋Š” ์‹ค์ œ ์‚ฌ๋žŒ๋“ค์˜ ์ ‘๊ทผ๋ฐฉ๋ฒ•์„ ์••๋„, machine learning์˜ ์ด ๋ฉ์ฒญํ•œ ์ ‘๊ทผ๋ฐฉ๋ฒ•์ด ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€๋“ค์„ ์ด๊ธด ๊ฒƒ

 

2. ์œ„์—์„œ ๋งŒ๋“  ์ตœ์ข… ํ•จ์ˆ˜๋Š” ์‹ค์ œ๋กœ๋Š” ์™„์ „ํžˆ ๋ฐ”๋ณด!์ž„, "ํ‰๋ฐฉ ํ”ผํŠธ"๋˜๋Š” "์นจ์‹ค"์ด ๋ฌด์—‡์ธ์ง€ ์•Œ์ง€๋„ ๋ชปํ•จ, ์ด ํ•จ์ˆ˜๊ฐ€ ์•„๋Š” ๊ฒƒ์ด๋ผ๊ณ ๋Š” ์ •๋‹ต์„ ์–ป๊ธฐ์œ„ํ•ด ์ด๋Ÿฌํ•œ ์ˆซ์ž๋“ค์˜ ๊ฐ’์„ ์ €์–ด์ค˜์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ

 

3. ์šฐ๋ฆฌ๋Š” ์–ด์งธ์„œ ํŠน์ • ๊ฐ€์ค‘์น˜์˜ ์กฐํ•ฉ์ด ์ž˜ ๋™์ž‘ํ•˜๋Š”์ง€ ์•Œ์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ์ด ๋‹น์—ฐํ•จ, ์ฆ‰ ์ดํ•ดํ•˜์ง€ ๋ชปํ•˜๋Š” ํ•จ์ˆ˜๋ฅผ ์ž‘์„ฑํ–ˆ์ง€๋งŒ ์ž˜ ๋™์ž‘ํ•˜๋Š” ๊ฒƒ์€ ์ฆ๋ช… ๊ฐ€๋Šฅ

 

4. "sqft"์™€ "num_of_bedrooms"์™€ ๊ฐ™์€ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€์‹  ์˜ˆ์ธก ํ•จ์ˆ˜์— ์ˆซ์ž ๋ฐฐ์—ด๋งŒ์„ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ์ƒ๊ฐ, ๊ทธ๋ฆฌ๊ณ  ๊ฐ ์ˆซ์ž๊ฐ€ ์ž๋™์ฐจ ์œ„์— ์žฅ์ฐฉํ•œ ์นด๋ฉ”๋ผ๋กœ ์ดฌ์˜ํ•œ ์ด๋ฏธ์ง€์—์„œ 1ํ”ฝ์…€์˜ ๋ฐ๊ธฐ๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค๊ณ  ๊ฐ€์ •, ์ด์ œ "price"๋ผ๋Š” ์˜ˆ์ธก์„ ์ถœ๋ ฅํ•˜๋Š” ๋Œ€์‹  ์ด ํ•จ์ˆ˜๋Š” "degrees_to_turn_steering_wheel"์ด๋ผ๋Š” ์˜ˆ์ธก์„ ์ถœ๋ ฅํ•œ๋‹ค๊ณ  ์ƒ์ƒ

→ ์Šค์Šค๋กœ ์ฐจ๋ฅผ ์กฐ์ข…ํ•  ์ˆ˜ ์žˆ๋Š” ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ฌ!

 

Step 3์—์„œ "๋ชจ๋“  ์ˆซ์ž๋ฅผ ์‹œ๋„ํ•ด๋ณด๋Š” ๊ฒƒ"์€ ๋ฌด์Šจ ๋œป์ธ๊ฐ€์š”?

- ๋ฌผ๋ก  ์‹ค์ œ๋กœ ๋ชจ๋“  ๊ฐ€์ค‘์น˜์˜ ์กฐํ•ฉ์„ ์‹œ๋„ํ•ด์„œ ๊ฐ€์žฅ ์ž˜ ์ž‘๋™ํ•˜๋Š” ์กฐํ•ฉ์„ ์ฐพ์„ ์ˆœ ์—†์Œ, ์‹œ๋„ํ•  ์ˆซ์ž ์กฐํ•ฉ์€ ๋ฌดํ•œํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‹น์—ฐํ•˜๊ฒŒ๋„ ์˜์›ํ•œ ์‹œ๊ฐ„.. ์ด ๊ฑธ๋ฆด ๊ฒƒ

 

- ์ด๊ฒƒ์„ ํ”ผํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜ํ•™์ž๋“ค์€ ๋งŽ์€ ๊ฒƒ์„ ์‹œ๋„ํ•˜์ง€ ์•Š๊ณ ๋„ ์ด๋Ÿฌํ•œ ๊ฐ€์ค‘์น˜์— ๋Œ€ํ•œ ์ข‹์€ ๊ฐ’์„ ๋นจ๋ฆฌ ์ฐพ์„ ์ˆ˜ ์žˆ๋Š” ์˜๋ฆฌํ•œ ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ƒ„

 

๋จผ์ €, Step 2๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ„๋‹จํ•œ ๋ฐฉ์ •์‹ ์ž‘์„ฑ

๋น„์šฉ ํ•จ์ˆ˜(cost function)

- ์ด์ œ ์™„์ „ํžˆ ๋˜‘๊ฐ™์€ ๋ฐฉ์ •์‹์„ ์žฌ์ž‘์„ฑํ•ด ๋ณผํ…๋ฐ, ๊ธฐ๊ณ„ํ•™์Šต์˜ ์ˆ˜ํ•™ ์šฉ์–ด๋ฅผ ์‚ฌ์šฉ

θ๋Š” ํ˜„์žฌ ๊ฐ€์ค‘์น˜๋ฅผ ๋‚˜ํƒ€๋ƒ„, J(θ)๋Š” 'ํ˜„์žฌ ๊ฐ€์ค‘์น˜์˜ ๋น„์šฉ'์„ ์˜๋ฏธ

- ์ด ๋ฐฉ์ •์‹์€ ํ˜„์žฌ ์„ค์ •ํ•œ ๊ฐ€์ค‘์น˜์— ๋Œ€ํ•ด ์šฐ๋ฆฌ์˜ ๊ฐ€๊ฒฉ ์ถ”์ • ํ•จ์ˆ˜๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ฐจ์ด๋‚˜๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋ƒ„

- number_of_bedrooms์™€ sqft์— ๋Œ€ํ•œ ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ๊ฐ€์ค‘์น˜ ๊ฐ’์— ๋Œ€ํ•ด ์ด ๋น„์šฉ ๋ฐฉ์ •์‹์„ ๊ทธ๋ž˜ํ”„๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Œ

๋งˆ์น˜ ๊ทธ๋ฆ‡์ฒ˜๋Ÿผ ๋ณด์ž„, ์„ธ๋กœ์ถ•์ด ๋น„์šฉ์„ ๋‚˜ํƒ€๋ƒ„

- ์ด ๊ทธ๋ž˜ํ”„์—์„œ ํŒŒ๋ž€์ƒ‰์˜ ๊ฐ€์žฅ ๋‚ฎ์€ ์ง€์ ์ด ๋น„์šฉ์ด ๊ฐ€์žฅ ๋‚ฎ์€ ๊ณณ

- ๋”ฐ๋ผ์„œ ์œ„์˜ ํ•จ์ˆ˜๋Š” ์กฐ๊ธˆ ์ž˜๋ชป๋จ, ๊ฐ€์žฅ ๋†’์€ ์ง€์ ๋“ค์ด ๊ฐ€์žฅ ์ž˜๋ชป๋œ ๊ฒƒ

- ์ฆ‰ ์šฐ๋ฆฌ๊ฐ€ ์ด ๊ทธ๋ž˜ํ”„์˜ ๊ฐ€์žฅ ๋‚ฎ์€ ์ง€์ ์œผ๋กœ ์ด๋™ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€์ค‘์น˜๋ฅผ ์ฐพ๋Š”๋‹ค๋ฉด, ๋‹ต์„ ์ฐพ์„ ์ˆ˜ ์žˆ์Œ!

 

- ์ด์ œ ๊ทธ๋ž˜ํ”„์—์„œ ๊ฐ€์žฅ ๋‚ฎ์€ ์ง€์ ์„ ํ–ฅํ•ด "์–ธ๋•์„ ๊ฑธ์–ด ๋‚ด๋ ค๊ฐˆ ์ˆ˜ ์žˆ๋„๋ก" ๊ฐ€์ค‘์น˜ ์กฐ์ •

- ๋งŒ์•ฝ ๊ฐ€์žฅ ๋‚ฎ์€ ์ง€์ ์œผ๋กœ ์ด๋™ํ•˜๋„๋ก ๊ฐ€์ค‘์น˜๋ฅผ ์กฐ๊ธˆ์”ฉ ์กฐ์ •ํ•ด ๋‚˜๊ฐ„๋‹ค๋ฉด, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋„ˆ๋ฌด ๋งŽ์€ ๋‹ค๋ฅธ ๊ฐ€์ค‘์น˜๋ฅผ ์‹œ๋„ํ•˜์ง€ ์•Š๊ณ ๋„ ๊ทธ๊ณณ์— ๋„๋‹ฌํ•˜๊ฒŒ ๋  ๊ฒƒ

 

- ํ•จ์ˆ˜๋ฅผ ๋ฏธ๋ถ„ํ•˜๋ฉด ํ•จ์ˆ˜์˜ ํŠน์ • ์ง€์ ์— ๋Œ€ํ•œ ์ ‘์„ ์˜ ๊ธฐ์šธ๊ธฐ๋ฅผ ์•Œ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด ์ƒ๊ฐ๋‚  ๊ฒƒ

- ๋‹ค์‹œ ๋งํ•ด์„œ, ๋ฏธ๋ถ„์„ ํ†ตํ•ด ๊ทธ๋ž˜ํ”„์˜ ํŠน์ • ์ง€์ ์— ๋Œ€ํ•ด ๋‚ด๋ฆฌ๋ง‰๊ธธ์ด ์–ด๋А ๋ฐฉํ–ฅ์ธ์ง€ ์•Œ ์ˆ˜ ์žˆ์Œ, ์ด ์ง€์‹์„ ์ด์šฉํ•ด ๋‚ด๋ฆฌ๋ง‰๊ธธ๋กœ ๊ฑธ์–ด ๋‚ด๋ ค๊ฐˆ ์ˆ˜ ์žˆ์Œ

 

- ๋”ฐ๋ผ์„œ ๊ฐ ๊ฐ€์ค‘์น˜์— ๋Œ€ํ•œ ๋น„์šฉ ํ•จ์ˆ˜์˜ ํŽธ๋ฏธ๋ถ„์„ ๊ณ„์‚ฐํ•˜๊ณ , ๊ฐ ๊ฐ€์ค‘์น˜์—์„œ ํ•ด๋‹น ๊ฐ’์„ ๋บ„ ์ˆ˜ ์žˆ์Œ, ์ด๋ฅผ ๋ฐ˜๋ณตํ•˜๋ฉด ๊ถ๊ทน์ ์œผ๋กœ ์–ธ๋• ๋งจ ์•„๋ž˜์— ๋„๋‹ฌํ•˜์—ฌ ๊ฐ€์žฅ ์ข‹์€ ๊ฐ€์ค‘์น˜๋ฅผ ์–ป๊ฒŒ ๋จ

 

- ์ด ๋ฐฉ๋ฒ•์€ ํ•จ์ˆ˜์˜ ์ ํ•ฉํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ์ฐพ๋Š” ๋ฐฉ๋ฒ• ์ค‘์— ํ•˜๋‚˜์ธ ๋ฐฐ์น˜ ๊ธฐ์šธ๊ธฐ ํ•˜๊ฐ•(batch gradient descent)์— ๋Œ€ํ•œ ๊ฐœ๊ด„์  ์„ค๋ช…

 

์ ๋‹นํžˆ ๊ฑด๋„ˆ ๋›ด ๋‚ด์šฉ์€ ๋˜ ์–ด๋–ค ๊ฒƒ๋“ค์ด ์žˆ๋‚˜์š”?

- ์•ž์„œ ์„ค๋ช…ํ•œ 3๋‹จ๊ณ„์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋‹ค๋ณ€์ˆ˜ ์„ ํ˜• ํšŒ๊ท€(multivariate linear regression)๋ผ๊ณ  ๋ถ€๋ฆ„

- ์ด ๋ฐฉ์ ์‹์„ ์‚ฌ์šฉํ•ด ์ด์ „์— ๋ณด์ง€ ๋ชปํ–ˆ๋˜ ์ฃผํƒ์˜ ํŒ๋งค ๊ฐ€๊ฒฉ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ

→ ์ด๋Š” ์ •๋ง ๊ฐ•๋ ฅํ•œ ์•„์ด๋””์–ด์ด๋ฉฐ "์ง„์งœ" ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Œ

 

- ๊ทธ๋Ÿฌ๋‚˜ ์ง€๊ธˆ๊นŒ์ง€ ์„ค๋ช…ํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋‹จ์ˆœํ•œ ๊ฒฝ์šฐ์—๋Š” ํšจ๊ณผ๊ฐ€ ์žˆ์ง€๋งŒ, ๋ชจ๋“  ๊ฒฝ์šฐ์— ๋™์ž‘ํ•˜์ง„ ์•Š์Œ 

- ์ง‘๊ฐ’์ด ํ•ญ์ƒ ์—ฐ์†์ ์ธ ์ง์„ ์„ ๋”ฐ๋ผ๊ฐˆ๋งŒํผ ๋‹จ์ˆœํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ

 

- ์œ„๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋น„์„ ํ˜• ๋ฐ์ดํ„ฐ(ex. ์‹ ๊ฒฝ๋ง, SVMs, kernels)๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋งŽ์€ machine learning ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์žˆ์Œ

- linear regression์„ ๋ณด๋‹ค ์˜๋ฆฌํ•˜๊ฒŒ ์‚ฌ์šฉํ•ด์„œ ๋”์šฑ ๋ณต์žกํ•œ ์„ ์„ ๋งž์ถ”๋Š” ๋ฐฉ๋ฒ•๋„ ์žˆ์Œ

- ์ด๋Ÿฌํ•œ ๋ชจ๋“  ๋ฐฉ๋ฒ•์—๋Š” ์ตœ์ƒ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์ฐพ์•„์•ผํ•œ๋‹ค๋Š” ๋™์ผํ•œ ๊ธฐ๋ณธ ์•„์ด๋””์–ด๋Š” ์—ฌ์ „ํžˆ ์ ์šฉ

 

- ์ •๋ฆฌํ•˜์ž๋ฉด, ๊ธฐ๋ณธ ๊ฐœ๋…์€ ๋งค์šฐ ๋‹จ์ˆœํ•˜์ง€๋งŒ machine learning์„ ์ ์šฉํ•˜๊ณ  ์œ ์šฉํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป์œผ๋ ค๋ฉด ์•ฝ๊ฐ„์˜ ๊ธฐ์ˆ ๊ณผ ๊ฒฝํ—˜ ํ•„์š”, ํ•˜์ง€๋งŒ ๋ชจ๋“  ๊ฐœ๋ฐœ์ž๊ฐ€ ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ˆ !

 

machine learning์€ ๋งˆ์ˆ ์ธ๊ฐ€?

- ์ปดํ“จํ„ฐ ํ•™์Šต ๊ธฐ์ˆ ์„ ์–ด๋ ค์›Œ ๋ณด์ด๋Š” ๋ฌธ์ œ์— ์–ผ๋งˆ๋‚˜ ์‰ฝ๊ฒŒ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์•Œ๊ฒŒ ๋˜๋ฉด, ์ถฉ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ๋งŒ ์žˆ๋‹ค๋ฉด machine learning์„ ์ ์šฉํ•ด์„œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๋А๋‚Œ์„ ๊ฐ€์ง€๊ฒŒ ๋  ๊ฒƒ

- ๋‹จ์ง€ ๋ฐ์ดํ„ฐ๋งŒ ์ œ๊ณตํ•˜๊ณ  ์ปดํ“จํ„ฐ๊ฐ€ ๋งˆ์ˆ ์ฒ˜๋Ÿผ ๋ฐ์ดํ„ฐ์— ๋งž๋Š” ๋ฐฉ์ •์‹์„ ๊ณ„์‚ฐํ•ด ์ฃผ๋Š” ๊ฒƒ์„ ๊ฐ์ƒ๋งŒ ํ•˜๋ฉด ๋จ

 

- ํ•˜์ง€๋งŒ machine learning์€ ๋ณด์œ ํ•œ ๋ฐ์ดํ„ฐ๋กœ ํ•ด๊ฒฐ ๊ฐ€๋Šฅํ•œ ๋ฌธ์ œ์ธ ๊ฒฝ์šฐ์—๋งŒ ๋™์ž‘ํ•œ๋‹ค๋Š” ์ ์„ ๊ธฐ์–ตํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”

 

- ex) ๊ฐ ์ฃผํƒ์˜ ํ™”๋ถ„ ์ข…๋ฅ˜์— ๋”ฐ๋ผ ์ฃผํƒ ๊ฐ€๊ฒฉ์„ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ? ์ ˆ๋Œ€ ๋™์ž‘ X, ์•„๋ฌด๋Ÿฐ ๊ด€๊ณ„๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ

→ ์ปดํ“จํ„ฐ๊ฐ€ ์•„๋ฌด๋ฆฌ ๋…ธ๋ ฅํ•ด๋„ ๋‘˜ ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ๊ฒฐ์ฝ” ์ถ”๋ก ํ•  ์ˆ˜ ์—†์Œ

์‹ค์ œ๋กœ ๊ด€๋ จ์ด ์žˆ๋Š” ๊ด€๊ณ„๋งŒ์„ ๋ชจ๋ธ๋งํ•  ์ˆ˜ ์žˆ์Œ

- ๋”ฐ๋ผ์„œ ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€๊ฐ€ ์ˆ˜์ž‘์—…์œผ๋กœ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์—†๋‹ค๋ฉด, ์ปดํ“จํ„ฐ๋„ ์•„๋งˆ ๋™์ž‘ํ•˜์ง€ ์•Š์„ ๊ฒƒ

- ๋ฐ”๊ฟ”๋งํ•ด, ์ธ๊ฐ„์ด ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ œ ์ค‘์—์„œ ์ปดํ“จํ„ฐ๊ฐ€ ํ›จ์”ฌ ๋นจ๋ฆฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์— ์ง‘์ค‘!

 

 

 

'๐Ÿ’ก THINKING > ๐Ÿฆพ Machine Learning' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

Machine Learning์€ ์ฆ๊ฒ๋‹ค! Part 3  (0) 2021.09.09
Machine Learning์€ ์ฆ๊ฒ๋‹ค! Part 2  (0) 2021.09.07
Comments