๋๋ค ํจ์
๋๋ค(lambda) ํจ์๋ ์ต๋ช ํจ์(Anonumous function)๋ก ์ด๋ฆ ์๋ ํจ์๋ค.
1ํ์ฉ์ผ๋ก ์ ๊น๋ง ์ฐ๋ ํจ์๋ฅผ ๋ง๋ค ๋ ์ฌ์ฉํ๋ค. ๊ทธ๋์ ์ฝ๋๊ฐ ๊ต์ฅํ ๊ฐ๊ฒฐํ๋ค!
ํ์ง๋ง ์ฌ๋๋ง๋ค ์ฝ๋ฉ ์คํ์ผ์ด ๋ค๋ฅด๋ค๋ณด๋ ๋ง์ ์ฝ๋๋ค์ ๋ณด๋ค๋ณด๋ฉด ์์ฃผ ๊ธด ๋๋ค ํจ์๋ฅผ ๋ง์ฃผ์น ๋๊ฐ ์๋ค๊ณ ํ๋ค.
๊ทธ ๋ ๊ฐ์ฅ ์ค์ํ๊ฑด " : " ์ ์ฐพ๋ ๊ฒ์ด๋ค..! ์ฝ๋ก ์ ๊ธฐ์ค์ผ๋ก ์ผ์ชฝ์ ์ธํ, ์ค๋ฅธ์ชฝ์ ์์ํ์ ๋ํ๋ด๊ธฐ ๋๋ฌธ์ด๋ค.
๋ชจ๋? ๋ผ์ด๋ธ๋ฌ๋ฆฌ? ํจํค์ง?!
ํท๊ฐ๋ฆฌ๋ ์ฉ์ด๋ค์ ์ฝ๊ฒ ์ ๋ฆฌํด์ฃผ์ จ๋ค.
๋ชจ๋์ ๊ฐ์ฅ ์์ ๋จ์๋ก python ํ์ผ ํ๋๋ฅผ ๋งํ๋ค.
๊ทธ๋ฆฌ๊ณ ๊ทธ ํ์ผ๋ค์ ๋ชจ์๋์ ํด๋๋ฅผ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋๋ ํจํค์ง ๋ผ๊ณ ๋งํ๋ค.
๋ฐ์ดํฐ
๋ฐ์ดํฐ์ ์ข ๋ฅ๋ ํฌ๊ฒ 3๊ฐ์ง๋ก ๋ถ๋ฅํ ์ ์๋ค.
- ์ ํ ๋ฐ์ดํฐ : ํ๊ณผ ์ด์ด ์๋ ๋ฐ์ดํฐ (ex. ์์ )
- ๋ฐ์ ํ ๋ฐ์ดํฐ : ๋น์ ํ ๋ฐ์ดํฐ ์ค ํ ์คํธ ๋ฐ์ดํฐ ์ผ์ข . ๊ตฌ์กฐํ๋์ด์๋ ๋ฐ์ดํฐ๋ค. (ex. ๋ก๊ทธ, html)
- ๋น์ ํ ๋ฐ์ดํฐ: ์์ฑ, ์์, ์ด๋ฏธ์ง, ํ ์คํธ ๋ฐ์ดํฐ ๋ฑ
Pandas(ํ๋ค์ค)
ํ๋ค์ค๋ ๋ฐ์ดํฐ ๋ถ์์ ํ ๋ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค.
DataFrame(๋ฐ์ดํฐํ๋ ์)๊ณผ Series(์๋ฆฌ์ฆ), 2๊ฐ์ ์๋ฃ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ค.
# ๋ฐ์ดํฐ ํ๋ ์์ ์๋จ ๋ถ๋ถ์ ์ถ๋ ฅํ๋ค
df.head()
# ๋ฐ์ดํฐ ํ๋ ์์ ํ๋จ ๋ถ๋ถ์ ์ถ๋ ฅํ๋ค
df.tail()
# ๊ฐ ์ด์ ๊ธฐ์ ํต๊ณ๋(Descriptive Statistics)์ ๋ณด์ฌ์ค๋ค
df.describe()
# ์ปฌ๋ผ๋ช
, ๊ฒฐ์ธก์น๋ฅผ ์ ์ธํ ๋ฐ์ดํฐ ์นด์ดํธ, ๋ฐ์ดํฐํ์
์ ๋ณด์ฌ์ค๋ค
df.info()
# ์์
์ ํผ๋ฒ ํ
์ด๋ธ๊ณผ ๋น์ทํ๋ค
pd.pivot_table(df, index='ํ ์์น์ ๋ค์ด๊ฐ ์ด', aggfunc=np.์ง๊ณํจ์)
del df['์ด ์ด๋ฆ'] # ์ด ์ญ์
df.drop(['ํ ์ด๋ฆ']) # ํ ์ญ์
df.columns # ์ด ์ด๋ฆ๋ค์ ๋ณด์ฌ์ค๋ค
df.index # ํ ์ด๋ฆ๋ค์ ๋ณด์ฌ์ค๋ค
# ์ด ์ด๋ฆ ๋ฐ๊พธ๊ธฐ
df.rename(columns = {'๊ธฐ์กด ์ปฌ๋ผ๋ช
' : '๋ฐ๊ฟ ์ปฌ๋ผ๋ช
'}, inplace = True)
# ํน์ ์ปฌ๋ผ ๊ธฐ์ค์ผ๋ก ๋ด๋ฆผ์ฐจ์ ์ ๋ ฌํ๊ธฐ
df.sort_values(by='์ปฌ๋ผ๋ช
', ascending = False, inplace = True)
new_df = df.copy() # ๋ฐ์ดํฐ ํ๋ ์ ๋ณต์ฌ. deep copy.
* ์ฐธ๊ณ ) aggfunc == aggregation function(์ง๊ณ ํจ์) : sum, mean, max, min ๋ฑ
** ๊ฒฐ์ธก์น(missing data)๋ฅผ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ
- ๋๋คํ๊ฒ ์ฑ์ฐ๊ธฐ (์๋ฅผ๋ค์ด ์ต๋/ ์ต์๊ฐ์ ์ง์ ํ๊ณ ๊ทธ ์์์ random ํจ์๋ก ๊ฐ์ ์ ํ๋ ๊ฒฝ์ฐ)
- ์ฃผ๋ณ (ํ์) ๊ฐ๋ค๋ก ์ฑ์ฐ๊ธฐ (๋งค์ผ ์จ๋๊ฐ์ ์ฒดํฌํ๋ ๋ฐ์ดํฐ์ผ ๊ฒฝ์ฐ ์ด ๋ฐฉ๋ฒ์ด ๋์์ง ์๋ค)
- ์ด์ ๋ํฏ๊ฐ์ ๊ณ์ฐํด์ ์ฑ์ฐ๊ธฐ (ํ๊ท ์ด๋ ์ค์๊ฐ ์ฌ์ฉ)
- ์ ์ฒด ํ๋ค์ ๊ทธ๋ฃน์ผ๋ก ๋ฌถ์ด๋ธ ํ ๊ทธ๋ฃน ๋ด ํด๋น ์ด์ ๋ํฏ๊ฐ์ผ๋ก ์ฑ์ฐ๊ธฐ
- ๋๋จธ์ง ์ด๋ค๋ก ๋จธ์ ๋ฌ๋ ์์ธก๋ชจ๋ธ์ ๋ง๋ ํ ํด๋น ์ด์ ๊ฐ์ ์์ธกํด ์ฑ์ฐ๊ธฐ
- ํด๋น ์ด ์ญ์ (์ค์ํ์ง ์์ ๋ฐ์ดํฐ์ธ ๊ฒฝ์ฐ)
โ ๏ธ ํด๋น ๊ธ์ ๋ฉ์์ด์ฌ์์ฒ๋ผ AI SCHOOL ๊ต์ก ๋ด์ฉ์ ๋ณต์ตํ๊ธฐ ์ํด ์์ฑํ์์ต๋๋ค
'TIL๐ฅ > ๋ฉ์์ด์ฌ์์ฒ๋ผ_AI School 5๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 11 (0) | 2022.03.24 |
---|---|
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 10 (0) | 2022.03.23 |
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 8 (0) | 2022.03.21 |
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 6 (0) | 2022.03.19 |
[๋ฉ์ฌ] AI SCHOOL 5๊ธฐ_ Day 5 (0) | 2022.03.18 |
๋๊ธ