본문 바로가기

전체 글39

[멋사] AI SCHOOL 5기_ Day 31 K-Means Algorithm 비지도학습의 Clustering(군집화) 도구다. 비슷한 데이터는 같은 그룹으로 묶고, 비슷하지 않은 데이터는 다른 그룹으로 떨어뜨리는 것이 목표다. 여기서 K 값은 클러스터 개수를 의미하며 직접 지정하는 hyper-parameter인데, 최적의 클러스터 개수를 정하는 것이 어렵고 중요하다. K-Means의 원리는 다음과 같다. 1. K개의 임의의 중심값을 고른다. (보통 데이터 샘플 중의 하나를 선택) 2. 각 데이터마다 중심값까지의 거리를 계산하여 가까운 중심값의 클러스터에 할당한다. 3. 각 클러스터에 속한 데이터들의 평균값으로 각 중심값을 이동시킨다. 4. 데이터에 대한 클러스터 할당이 변하지 않을 때까지 2와 3을 반복한다. iris 데이터를 가지고 K-Means.. 2022. 4. 13.
[멋사] AI SCHOOL 5기_ Day 30 Decision Tree(의사결정나무) 이해하기 쉽고 해석도 용이하다. 하지만 2가지 큰 단점이 있다 입력 데이터의 작은 변동에도 Tree의 구성이 크게 달라질 수 있다 과적합이 쉽게 발생한다 → 그래서 모델 앙상블 기법 중 하나인 Boosting 기법이 적용되었다. AdaBoost (Adaptive Boosting) 1) 데이터를 바탕으로 여러 weak learner들을 반복적으로 생성한다 2) 앞선 learner가 잘못 예측한 데이터에 가중치를 부여하도록 하고(boosting) 학습시킨다 3) 최종적으로 만들어진 strong learner를 이용하여 실제 예측을 진행한다 여기서 문제는 높은 가중치를 가진 data point가 존재하게 되면 성능이 크게 떨어졌음 → 그래서 어떻게 하면 에러를 최소화하는.. 2022. 4. 12.
[멋사] AI SCHOOL 5기_ Day 29 Linear Regression(선형 회귀) 정답이 있는 데이터의 추세를 잘 설명하는 선형 함수를 찾아 x에 대한 y를 예측하는 것이다. - 1개의 독립변수(x)가 1개의 종속변수(y)에 영향을 미칠 때, 단순 회귀분석이라 하고 y = ax + b 형태의 식을 세운다. 이때 a는 가중치(weight), b는 보정치 또는 편향(bias)라고 한다. - 2개 이상의 독립변수(x)가 1개의 종속변수(y)에 영향을 미칠 때, 다중 회귀분석이라 하고 다음과 같은 형태의 식을 세운다. 여기서 머신러닝은 최적의 Theta set를 찾기 위해 실제값과 가설로부터 얻은 예측값의 오차를 계산하는 식을 세우고, 이 식의 값을 최소화하는 방식을 사용한다. 이때 실제값과 예측값에 대한 오차에 대한 식을 Cost Function.. 2022. 4. 11.
2022 고난주간 말씀챌린지 도전 🙌 고난주간 월드비전말씀챌린지 홍보 영상 04월 11일부터 16일까지는 고난주간이다💫 작년에는 쿵모임 사람들이랑 매일 사복음서 묵상을 하고 나눴었는데 이번에는 같이 월드비전에서 주관하는 고난주간 말씀챌린지에 도전하기로 했다ㅎㅎ 선착순 1000명으로 진행되는거라고해서 3월에 일찍이 신청을 했고, 신청접수가 완료되었다는 문자도 두번이나 받았는데..!! 지난주에 갑자기 연락이 와서 받아보니 참가비 입금이 완료되지 않은 것 같다며 신청이 누락되었다고 하셨다ㅠㅜㅋㅋㅋㅋ 그래서 다시 신청을 했고, 무사히 챌린지 시작 전에 패키지를 받을 수 있었다☺️ 생각보다 너무 고퀄의 굿즈를 받아보니 오랜만에 수련회하는 느낌이 들어서 더 기대가 된다! 매일 말씀을 통해 십자가를 묵상하며 하나님의 풍성한 은혜를 누리는 한주가 되길🙏 2022. 4. 11.
김명락, 이것이 인공지능이다 이 책은 인공지능 전문 개발자를 위한 기술 위주의 책이 아니라 인공지능 때문에 걱정스럽고 혼란스러운 일반인들을 위한 책이라고 소개한다. 그래서그런지 사례 위주로 쉽고 재밌게 글이 쓰여있어 단숨에 읽을 수 있었다!ㅎㅎ 인공지능이 세상을 바꾸고, 긍정적인 방향으로 활용되느냐 그렇지 않느냐는 그 기술을 개발하는 사람들의 손에 달린 것이 아니라 그것을 이해하고 활용하는 평범한 사람들에 의해 결정된다. - Part1 인공지능 파도가 오고 있다 _20 저자는 이 책에서 내내 '인공지능을 어떻게 활용해야 하는지'에 초점을 맞춰 이야기한다. IT(Infomation Technology)는 수 많은 데이터 중에서 쓸모있는 데이터를 사람의 판단력으로 선별해 활용하는 것이라면, DT(Data Technology)는 사람의 .. 2022. 4. 11.
[멋사] AI SCHOOL 5기_ Day 26 머신러닝은 크게 인공신경망을 사용하는 딥러닝과 사용하지 않는 전통적인 머신러닝으로 나뉜다. 인공지능이란? 자신을 둘러싼 환경을 지각/인식하고 → 적절한 행동을 취하여 → 목표를 성취할 가능성을 최대화 하는 기계(가 가진 지능) 지능의 규범 범위에 따라 구분하자면.. Artificial Narrow Intelligence("weak AI") → Artificial General Intelligence("strong AI") → Artificial Super Intelligence 이렇게 볼 수 있다. 약한 인공지능은 특정 영역의 문제를 푸는 인공지능 기술을 말한다. 알파고나 왓슨 모두 약한 인공지능이며, 현재까지 인간이 만들어낸 인공지능이라고 불리는 모든 것은 다 약한 인공지능이라고 볼 수 있다. 강한 인.. 2022. 4. 8.