본문 바로가기

인공지능

3. 아이템 기반 최근집 이웃 협업 필터링 용어정의 데이터 가공 및 변환 영화간 유사도 산출 최근접 이웃 협업 필터링을 이용한 개인화 영화 추천시스템 개발 1. 용어정의 피드백 후 작성예정입니다. MovieLens 데이터셋은 데이터셋 자료실 에 있습니다. 전체코드는 https://github.com/pjh5672/Recommendation_System 에 올려두었습니다. 2. 데이터 가공 및 변환 협업 필터링 기반의 영화 추천을 위해서는 사용자가 영화 평점을 매긴 사용자ㅡ영화 평점 매트릭스 데이터셋이 필요하다. 이를 위해 MovieLens 데이터셋을 다운받아 pandas.DataFrame으로 로딩한다. 영화에 대한 정보인 movies.csv 파일은 9742개 영화에 대한 movieId, title, genres 등으로 구성되며, 영화.. 더보기
2. 콘텐츠 기반 필터링 용어정의 데이터로딩 및 가공 장르 유사도 측정 콘텐츠 기반 필터링을 이용한 추천시스템 개발 추천결과 분석 및 왜곡데이터 이해 추천시스템 개선 1. 용어정의 피드백 후 작성예정입니다. TMDB 5000 Movies 데이터셋은 데이터셋 자료실 에 있습니다 전체코드는 https://github.com/pjh5672/Recommendation_System 에 올려두었습니다. 2. 데이터 로딩 및 가공 TMDB 5000 Movies 데이터셋은 4,803개 영화에 대한 영화제목, 개요, 장르, 인기도, 평점, 투표 수, 예산, 출시일, 키워드 등 20개의 메타정보(피처) 테이블로 구성된다. 이 중에서 주요 칼럼인 아이디, 영화제목, 장르, 평균 평점, 평균 투표 수, 인기도, 키워드, 개요설명 등을 뽑.. 더보기
MovieLens dataset MovieLens dataset Download 구글드라이브 링크 더보기
Home price dataset Home price dataset Download 구글드라이브 링크 더보기
amazon.com review dataset amazon.com review dataset Download 구글드라이브 링크 더보기
TMDB 5000 Movie Dataset TMDB 5000 Movie Dataset Download Kaggle 링크 더보기
1. 추천시스템 개요 용어정의 콘텐츠 기반 필터링(Content based filtering) 협업 필터링(Collaborative filtering) 최근접 이웃(Nearest Neighbor) 협업 필터링 잠재요인(Latent Factor) 협업 필터링 하이브리드 협업 필터링(Hybrid filtering) 1. 용어정의 피드백 후 작성예정입니다. 2. 콘텐츠 기반 필터링(Content based filtering) 유사도 계산을 통해 특정 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천하는 방식으로, 대표적으로 코사인 유사도, 자카드 계수 등을 유사도 계산에 사용한다. 3. 협업 필터링(Collaborative filtering) 사용자가 아이템에 매긴 평점정보나 상품구매이력과 동일한 사용자의 행동양식을 .. 더보기
7-3. EM algorithm for Gaussian Mixtures 용어정의 Mixtures of Gaussians EM algorithm for Gaussian mixtures Comparison of EM algorithms 1. 용어정의 피드백 후 작성예정입니다. 2. Mixtures of Gaussians 가우시안 혼합 분포(Mixtures of Gaussians)은 복수의 가우시안 분포들의 선형 결합으로 실제데이터의 분포를 근사하는 방법으로 아래와 같은 그림으로 표현할 수 있다. 이는 아래 오른쪽 그림과 같이, 단일 가우시안 분포를 통해 데이터 분포를 표현하기엔 한계가 존재하고 복수의 혼합 분포를 사용해서 더 정확하게 표현할 수 있기 때문에 유용하게 사용되는 방법이다. 즉, 가우시안 혼합분포를 나타내기 위해서는 잠재변수(Latent variable).. 더보기

728x90
반응형