clustering 썸네일형 리스트형 코세라 머신러닝 case study 수료 코세라에서 제공하는 "Machine Learning Foundations" 강의를 이수하였다. 이번 강의는 개론 수준에서 머신러닝이 활용되는 대표적인 5가지 분야에 대해 알려준다. 각각은 Regression, Classification, Clustering, Recommendation, Deep Learing(Image Recognition) 이며, 분야별 Case Study는 다음과 같다. 집값예측하기 긍정/부정적 감정 분석하기 위키피디아 문서를 활용하여 유사한 인물들 찾기 개인화된 노래추천하기 고전 머신러닝을 활용한 이미지 분류와 딥러닝을 활용한 이미지분류 성능 비교해보기 딥러닝을 활용하여 유사한 이.. 더보기 7-2. EM algorithm for K-means clustering 용어정의 EM algorithm for K-means clustering 1. 용어정의 피드백 후 작성예정입니다. 2. EM algorithm for K-means clustering D 크기의 차원을 가진 N개의 데이터가 있다고 가정하면, K-means Clustering은 이 데이터들의 분포를 K개의 집단으로 나누는 것이다. K개의 집단으로 구분하기 위해, 데이터셋에 대한 "Distortion measure" 를 구하고 이를 최소화하는데 여기서 "Distortion measure"는 아래의 수식으로 계산된다. 여기서 μ_k 는 K번째 Cluster에 관한 평균이고, r_nk는 n번째 데이터가 K 번째 Cluster에 존재하면 '1'의 값을 갖고 아닐 경우 '0'의 값을 갖는다. 결국, E.. 더보기 7-1. Mixture Models and Expectation-Maximization(EM) Algorithm 용어정의 Introduction 1. 용어정의 피드백 후 작성예정입니다. 2. Introduction 혼합모델(Mixture model)은 복잡한 확률분포를 알아내는데 활용할 수 있을 분만 아니라, 유사한 분포를 갖는 데이터들끼리 그룹화(Clustering) 하는데도 사용할 수 있다. 이러한 혼합모델의 추정은 아래와 같이 복잡하게 얽혀있는 관측데이터들 사이의 관계를 파악하는데 보다 직관적으로 확인할 수 있다. 따라서, 앞으로 작성될 7장의 내용에서는 Expectation-Maximization (EM)이라는 Two-step 알고리즘을 통해서 데이터들을 그룹화하고, 가우시안 혼합 분포에 적용하는 대표적 방법들을 설명한다. 더보기 이전 1 다음