본문 바로가기

영화 추천

5. Surprise 라이브러리를 이용한 추천시스템 개발 용어정의 Surprise 패키지 소개 Surprise 주요 모듈 OS 파일데이터를 Surprise 데이터셋으로 로딩 Pandas Dataframe 을 Surprise 데이터셋으로 로딩 Surprise 추천 알고리즘 클래스 베이스라인 평점 교차검증과 하이퍼 파라미터 튜닝 Surprise 를 이용한 개인화 영화 추천시스템 개발 1. 용어정의 피드백 후 작성예정입니다. MovieLens 데이터셋은 데이터셋 자료실 에 있습니다. 2. Surprise 패키지 소개 파이썬 기반의 추천 시스템 구축을 위한 전용 패키지 중 하나인 Surprise 는 파이썬 기반에서 사이킷런과 유사한 API 와 프레임워크를 제공하여, 추천 시스템의 전반적인 알고리즘을 이해하고 사이킷런 사용경험이 있으면 쉽게 사용할 수 있다.. 더보기
4. 행렬 분해를 이용한 잠재요인 협업 필터링 용어정의 행렬 분해의 이해 확률적 경사하강법(SGD)를 이용한 행렬 분해 확률적 경사하강법(SGD) 활용예제 행렬 분해를 이용한 개인화 영화 추천시스템 개발 1. 용어정의 피드백 후 작성예정입니다. MovieLens 데이터셋은 데이터셋 자료실 에 있습니다 2. 행렬 분해의 이해 행렬 분해는 다차원 매트릭스를 저차원 매트릭스로 분해하는 기법으로 대표적으로 SVD(Singular Value Decomposition), NMF(Non-Negative Matrix Factorization) 등이 있습니다. 즉, M개의 사용자(User) 행과 N개의 아이템(Item) 열을 가진 평점 행렬 R은 M X N 차원으로 구성되며, 행렬 분해를 통해 사용자-K 차원의 잠재 요인 행렬 P (M X K 차원)와 .. 더보기
2. 콘텐츠 기반 필터링 용어정의 데이터로딩 및 가공 장르 유사도 측정 콘텐츠 기반 필터링을 이용한 추천시스템 개발 추천결과 분석 및 왜곡데이터 이해 추천시스템 개선 1. 용어정의 피드백 후 작성예정입니다. TMDB 5000 Movies 데이터셋은 데이터셋 자료실 에 있습니다 전체코드는 https://github.com/pjh5672/Recommendation_System 에 올려두었습니다. 2. 데이터 로딩 및 가공 TMDB 5000 Movies 데이터셋은 4,803개 영화에 대한 영화제목, 개요, 장르, 인기도, 평점, 투표 수, 예산, 출시일, 키워드 등 20개의 메타정보(피처) 테이블로 구성된다. 이 중에서 주요 칼럼인 아이디, 영화제목, 장르, 평균 평점, 평균 투표 수, 인기도, 키워드, 개요설명 등을 뽑.. 더보기
TMDB 5000 Movie Dataset TMDB 5000 Movie Dataset Download Kaggle 링크 더보기

728x90
반응형