본문 바로가기

추천시스템

5. Surprise 라이브러리를 이용한 추천시스템 개발 용어정의 Surprise 패키지 소개 Surprise 주요 모듈 OS 파일데이터를 Surprise 데이터셋으로 로딩 Pandas Dataframe 을 Surprise 데이터셋으로 로딩 Surprise 추천 알고리즘 클래스 베이스라인 평점 교차검증과 하이퍼 파라미터 튜닝 Surprise 를 이용한 개인화 영화 추천시스템 개발 1. 용어정의 피드백 후 작성예정입니다. MovieLens 데이터셋은 데이터셋 자료실 에 있습니다. 2. Surprise 패키지 소개 파이썬 기반의 추천 시스템 구축을 위한 전용 패키지 중 하나인 Surprise 는 파이썬 기반에서 사이킷런과 유사한 API 와 프레임워크를 제공하여, 추천 시스템의 전반적인 알고리즘을 이해하고 사이킷런 사용경험이 있으면 쉽게 사용할 수 있다.. 더보기
4. 행렬 분해를 이용한 잠재요인 협업 필터링 용어정의 행렬 분해의 이해 확률적 경사하강법(SGD)를 이용한 행렬 분해 확률적 경사하강법(SGD) 활용예제 행렬 분해를 이용한 개인화 영화 추천시스템 개발 1. 용어정의 피드백 후 작성예정입니다. MovieLens 데이터셋은 데이터셋 자료실 에 있습니다 2. 행렬 분해의 이해 행렬 분해는 다차원 매트릭스를 저차원 매트릭스로 분해하는 기법으로 대표적으로 SVD(Singular Value Decomposition), NMF(Non-Negative Matrix Factorization) 등이 있습니다. 즉, M개의 사용자(User) 행과 N개의 아이템(Item) 열을 가진 평점 행렬 R은 M X N 차원으로 구성되며, 행렬 분해를 통해 사용자-K 차원의 잠재 요인 행렬 P (M X K 차원)와 .. 더보기
3. 아이템 기반 최근집 이웃 협업 필터링 용어정의 데이터 가공 및 변환 영화간 유사도 산출 최근접 이웃 협업 필터링을 이용한 개인화 영화 추천시스템 개발 1. 용어정의 피드백 후 작성예정입니다. MovieLens 데이터셋은 데이터셋 자료실 에 있습니다. 전체코드는 https://github.com/pjh5672/Recommendation_System 에 올려두었습니다. 2. 데이터 가공 및 변환 협업 필터링 기반의 영화 추천을 위해서는 사용자가 영화 평점을 매긴 사용자ㅡ영화 평점 매트릭스 데이터셋이 필요하다. 이를 위해 MovieLens 데이터셋을 다운받아 pandas.DataFrame으로 로딩한다. 영화에 대한 정보인 movies.csv 파일은 9742개 영화에 대한 movieId, title, genres 등으로 구성되며, 영화.. 더보기
2. 콘텐츠 기반 필터링 용어정의 데이터로딩 및 가공 장르 유사도 측정 콘텐츠 기반 필터링을 이용한 추천시스템 개발 추천결과 분석 및 왜곡데이터 이해 추천시스템 개선 1. 용어정의 피드백 후 작성예정입니다. TMDB 5000 Movies 데이터셋은 데이터셋 자료실 에 있습니다 전체코드는 https://github.com/pjh5672/Recommendation_System 에 올려두었습니다. 2. 데이터 로딩 및 가공 TMDB 5000 Movies 데이터셋은 4,803개 영화에 대한 영화제목, 개요, 장르, 인기도, 평점, 투표 수, 예산, 출시일, 키워드 등 20개의 메타정보(피처) 테이블로 구성된다. 이 중에서 주요 칼럼인 아이디, 영화제목, 장르, 평균 평점, 평균 투표 수, 인기도, 키워드, 개요설명 등을 뽑.. 더보기
TMDB 5000 Movie Dataset TMDB 5000 Movie Dataset Download Kaggle 링크 더보기
1. 추천시스템 개요 용어정의 콘텐츠 기반 필터링(Content based filtering) 협업 필터링(Collaborative filtering) 최근접 이웃(Nearest Neighbor) 협업 필터링 잠재요인(Latent Factor) 협업 필터링 하이브리드 협업 필터링(Hybrid filtering) 1. 용어정의 피드백 후 작성예정입니다. 2. 콘텐츠 기반 필터링(Content based filtering) 유사도 계산을 통해 특정 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천하는 방식으로, 대표적으로 코사인 유사도, 자카드 계수 등을 유사도 계산에 사용한다. 3. 협업 필터링(Collaborative filtering) 사용자가 아이템에 매긴 평점정보나 상품구매이력과 동일한 사용자의 행동양식을 .. 더보기

728x90
반응형