๋จธ์ ๋ฌ๋์ ํฌ๊ฒ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๋ ๋ฅ๋ฌ๋๊ณผ ์ฌ์ฉํ์ง ์๋ ์ ํต์ ์ธ ๋จธ์ ๋ฌ๋์ผ๋ก ๋๋๋ค.
์ธ๊ณต์ง๋ฅ์ด๋?
์์ ์ ๋๋ฌ์ผ ํ๊ฒฝ์ ์ง๊ฐ/์ธ์ํ๊ณ → ์ ์ ํ ํ๋์ ์ทจํ์ฌ → ๋ชฉํ๋ฅผ ์ฑ์ทจํ ๊ฐ๋ฅ์ฑ์ ์ต๋ํ ํ๋ ๊ธฐ๊ณ(๊ฐ ๊ฐ์ง ์ง๋ฅ)
์ง๋ฅ์ ๊ท๋ฒ ๋ฒ์์ ๋ฐ๋ผ ๊ตฌ๋ถํ์๋ฉด..
Artificial Narrow Intelligence("weak AI") → Artificial General Intelligence("strong AI") → Artificial Super Intelligence
์ด๋ ๊ฒ ๋ณผ ์ ์๋ค.
์ฝํ ์ธ๊ณต์ง๋ฅ์ ํน์ ์์ญ์ ๋ฌธ์ ๋ฅผ ํธ๋ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ๋งํ๋ค.
์ํ๊ณ ๋ ์์จ ๋ชจ๋ ์ฝํ ์ธ๊ณต์ง๋ฅ์ด๋ฉฐ, ํ์ฌ๊น์ง ์ธ๊ฐ์ด ๋ง๋ค์ด๋ธ ์ธ๊ณต์ง๋ฅ์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ ๋ชจ๋ ๊ฒ์ ๋ค ์ฝํ ์ธ๊ณต์ง๋ฅ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
๊ฐํ ์ธ๊ณต์ง๋ฅ์ ์ธ๊ฐ์ ์ง๋ฅ์ ๊ฐ์ง๊ณ ์๊ฐํ ์ ์๋ ์ปดํจํฐ๋ฅผ ๋งํ๋ค.
๋ช ๋ น์ ๋ฐ์ง ์์๋ ์ค์ค๋ก ์ผ์ ํ ์ ์์ผ๋ฉฐ, ์์ ์ด ์๊ฐํ์ ๋ ๋ถํฉ๋ฆฌํ๋ค๋ฉด ๋ช ๋ น์ ๊ฑฐ๋ถํ ์๋ ์๋ ์์ค์ ๋งํ๋๋ฐ,
์ฌ์ค ์ด ๊ฐ๋ ์ ์์ ํ์ง ์๋ค. '์ธ๊ฐ์ ์ง๋ฅ' ์์ฒด๋ฅผ ๋ช ํํ๊ฒ ๊ท์ ํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
๋ฐ๋ผ์,
"์ฐ๋ฆฌ ํ์ฌ๋ ์ธ๊ณต์ง๋ฅ์ ์ ์ฉํด ~~๋ฅผ ํ๋ ํ์ฌ์ ๋๋ค" ๋ผ๋ ๋ง์
"์ฐ๋ฆฌ ํ์ฌ๋
1) (๊ฐ์ข ์ ํ/๋ฐ์ ํ/๋น์ ํ) ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ
2) (๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํ ์ ์๋ ํจ์(์๊ณ ๋ฆฌ์ฆ)์ ํ๋ณด๋ค์ ์ ํ๊ณ ,
ํจ์์ ํฌํจ๋ Parameter ๋ค์ ๊ฐ์ฅ ์ข์ ๊ฐ์ ์ปดํจํฐ๋ก ์ฐพ์๋ธ) ๋ชจ๋ธ์ ๋ง๋ค๊ณ
3) ์ด ๋ชจ๋ธ์ ์ ์ฉํ ~~ ๊ธฐ๋ฅ์ ๋ง๋๋
ํ์ฌ์ ๋๋ค." ๋ผ๋ ๋ป์ด๋ค!
๋จธ์ ๋ฌ๋์ด๋?
์์ ์ฌ๋ฌด์์ "์ปดํจํฐ๊ฐ ๋ช ์์ ์ผ๋ก ํ๋ก๊ทธ๋จ ๋์ง ์๊ณ ๋ ํ์ตํ ์ ์๋๋ก ํ๋ ์ฐ๊ตฌ ๋ถ์ผ" ๋ผ๊ณ ์ ์ํ๋ค.
๋จธ์ ๋ฌ๋์ 1) ์ด๋ ํ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ณผ์ ์์ 2) ํน์ ํ ํ๊ฐ ๊ธฐ์ค์ ๋ฐํ์ผ๋ก 3) ํ์ต์ ๊ฒฝํ์ ์์๋๊ฐ๋ ํ๋ก๊ทธ๋จ ์ด๋ค.
๋จธ์ ๋ฌ๋์ ํฌ๊ฒ 3๊ฐ์ง๋ก ๋ถ๋ฅ๋๋ค.
๋ฌด์์ด ๋์๋ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํ๋ ํจ์๋ฅผ ์ฐพ๋ ๊ฒ์ด ๋ชฉํ๋ค!
1๏ธโฃ Supervised learning (์ง๋ ํ์ต)
์ ๋ต(Label, Target)์ด ์กด์ฌํ๋ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ Input data์ ๋ํ ์ ๋ต์ ์์ธกํ๊ธฐ ์ํด ํ์ต์ํค๋ ๊ฒ์ด๋ค.
Output์ ํํ์ ๋ฐ๋ผ ํ๊ท ๋ถ์๊ณผ ๋ถ๋ฅ ๋ถ์์ผ๋ก ๋๋ ์ ์๋ค.
ํ๊ท(Regression) ๋ถ์์ Output์ด ์ค์ ์์ญ ์ ์ฒด์์ ๋ํ๋๋ค.
๋ถ๋ฅ(Classification) ๋ถ์์ Output์ด class์ ํด๋นํ๋ ๋ถ์ฐ์๊ฐ์ผ๋ก ๋ํ๋๋ค.
2๏ธโฃ Unsupervised learning (๋น์ง๋ ํ์ต)
์ ๋ต(Label, Target)์ด ์กด์ฌํ์ง ์๋ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ Input data ์์ ์จ์ด์๋ ๊ท์น์ฑ์ ์ฐพ๊ธฐ ์ํด ํ์ต์ํค๋ ๊ฒ์ด๋ค.
๋น์ง๋ ํ์ต์ ๋ํ์ ์ธ ์ข ๋ฅ๋ก๋ ๊ตฐ์ง ๋ถ์(Clustering)๊ณผ ์ฐจ์ ์ถ์(Dimensionality reduction)๊ฐ ์๋ค.
3๏ธโฃ Reinforcement learning (๊ฐํ ํ์ต)
์ฃผ์ํ๊ฒฝ๊ณผ ์์ ์ ํ๋(Decision) ์ฌ์ด์ ๋ฐ๋ณต์ ์ํธ์์ฉ์ ๋ฐํ์ผ๋ก, ์ต์ข ์ ์ผ๋ก ์ป๊ฒ ๋ ๊ธฐ๋ ๋ณด์์ ์ต๋ํํ๊ธฐ ์ํ ํ๋ ์ ํ ์ ์ฑ (Policy)์ ํ์ต์ํค๋ ๊ฒ์ด๋ค.
ํ์ต(Learning)์ด๋?
๋ด๊ฐ ๋ค๋ฃจ๊ณ ์๋ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํ๋ ๋ฐฉ๋ฒ์ ์ฐพ๋ ๊ณผ์ ์ด๋ค!
์ฆ, ๋ด ๋ฐ์ดํฐ์ ๋ง๋ ๋ชจ๋ธ์ ์ฐพ๋ ๊ณผ์ (= Model fitting)์ด๋ค.
โก๏ธ ์ด๋ป๊ฒ ์ฐพ์ ์ ์์๊น?
1) ์ด๊ธฐ ๋ชจ๋ธ(๊ฐ์ค ๋ชจ๋ธ)์ ๋ฐ์ดํฐ๋ฅผ ๋ฃ๋๋ค.
2) ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ค.
3) ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํด ๋ชจ๋ธ์ ์์ ํ๋ค.
๋ค์ ๋งํ๋ฉด, ์ค์ ์ ๋ต๊ณผ ์์ธก ๊ฒฐ๊ณผ ์ฌ์ด์ ์ค์ฐจ(Loss, Cost, Error)๋ฅผ ์ค์ฌ๋๊ฐ๋ ์ต์ ํ ๊ณผ์ ์ด๋ค.
Capacity๋ ํ์ค ์ธ๊ณ์ ๋ณต์กํจ์ ๋ด์๋ผ ์ ์๋ ์ฉ๋์ ๋ปํ๋ค.
์ค์ํ ์ ์ capacity๊ฐ ํฌ๋ค๊ณ ๋ฌด์กฐ๊ฑด ์ข์๊ฑด ์๋๋ค!
Overfitting(๊ณผ์ ํฉ)์ ํผํด์ผ ํ๋ค.
Capacity์ ๊ทน๋ํ → Overfitting ๋ฐ์ → Generalization error ์ฆ๊ฐ → ์๋ก์ด ๋ฐ์ดํฐ์ ์ ๋์ํ์ง ๋ชปํจ
โก๏ธ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํด์๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๊ฒ ํ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ๋ ๊น?
Cross validation(๊ต์ฐจ ๊ฒ์ฆ)
๋ฐ์ดํฐ๋ฅผ 3๊ฐ์ ๊ทธ๋ฃน์ผ๋ก ๋๋
1) 60%์ Training data๋ก ๋ชจ๋ธ์ ํ์ต(Learn)์ํจ๋ค
2) 20%์ Validation data๋ก ๋ชจ๋ธ(or Hyper Parameter)์ ์ต์ ํ/์ ํ(Tune)ํ๋ค
3) 20%์ Test data๋ก ๋ชจ๋ธ์ ํ๊ฐ(Test only, no more tune)ํ๋ค.
์ด๋ ๋น์จ์ 6:2:2 ๋๋ 7:3์ ๋ง์ด ์ฌ์ฉํ๋๋ฐ,
๋์ฉ๋ ๋ฐ์ดํฐ๋ผ๋ฉด 98:1:1 ์ด๋ 99:0.5:0.5 ๋ฅผ ์ฌ์ฉํ๊ธฐ๋ ํ๋ค.
K-Fold Cross Validation (ํ๋ณด ๋ชจ๋ธ ๊ฐ ๋น๊ต ๋ฐ ์ ํ์ ์ํ ์๊ณ ๋ฆฌ์ฆ)
K-Fold CV๋ ์ฌ๋ฌ๊ฐ์ง ๋ชจ๋ธ์ด ์์ ๋ ์ด๋ค ๋ชจ๋ธ์ ์ฐ๋๊ฒ ์ข์์ง ๊ตฌํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค. (์ฌ๊ธฐ์ K ๋ ‘์ฐ๋ฆฌ๊ฐ ๊ฒฐ์ ํ๋ ๊ฒ'์ ๋ปํ๋ค)
'TIL๐ฅ > ๋ฉ์์ด์ฌ์์ฒ๋ผ_AI School 5๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 30 (0) | 2022.04.12 |
---|---|
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 29 (0) | 2022.04.11 |
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 25 (0) | 2022.04.07 |
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 18 (0) | 2022.03.31 |
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 17 (0) | 2022.03.30 |
๋๊ธ