본문 바로가기

인공지능/추천시스템

1. 추천시스템 개요


< 목차 >

  1. 용어정의
  2. 콘텐츠 기반 필터링(Content based filtering)
  3. 협업 필터링(Collaborative filtering)
    1. 최근접 이웃(Nearest Neighbor) 협업 필터링
    2. 잠재요인(Latent Factor) 협업 필터링
  4. 하이브리드 협업 필터링(Hybrid filtering)

1. 용어정의

  • 피드백 후 작성예정입니다.

2. 콘텐츠 기반 필터링(Content based filtering)

유사도 계산을 통해 특정 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천하는 방식으로, 대표적으로 코사인 유사도, 자카드 계수 등을 유사도 계산에 사용한다.


3. 협업 필터링(Collaborative filtering)

사용자가 아이템에 매긴 평점정보나 상품구매이력과 동일한 사용자의 행동양식을 기반으로 추천하는 방식이다. 즉, 사용자 ㅡ 아이템 평점 매트릭스를 기반으로 사용자가 평가하지 않은 아이템의 평점을 예측평가(Predicted Rating)하는 것이다.


예시) User 1에 대한 Item 4의 선호도(평점) 예측하기

 

 

3-1. 최근접 이웃(Nearest Neighbor) 협업 필터링

메모리(Memory) 협업 필터링이라고도 하며, (1) 사용자 기반과 (2) 아이템 기반 협업 필터링으로 세부적으로 다시 구분된다.

일반적으로 비슷한 콘텐츠를 선택한다고 해서 그 사람들의 취향이 비슷하다고 판단하기는 어려운 경우가 많기 때문에, 사용자 기반보다 아이템 기반 협업 필터링이 정확도가 더 높다.

즉, 매우 유명한 콘텐츠(유명한 영화, 책 등)는 취향과 관계없이 대부분의 사람들이 선택하는 경우가 많고, 사용자들이 평점을 매긴 콘텐츠의 갯수가 많지 않은 경우가 많아 사용자간 유사도 측정이 어려운 부분이 존재하는데 이를 Cold-start 문제 라고도 한다.

따라서, 대부분의 최근접 이웃 협업 필터링은 아이템 기반의 알고리즘을 사용한다.

 

(1) 사용자 기반(User-User) 협업 필터링

  • 특정 사용자와 타 사용자 간의 유사도(Similarity)를 측정한 뒤 유사도가 높은 사용자를 추출해 그들이 선호하는 아이템을 추천하는 것
  • 아래의 테이블에서 "스타워즈"보다 "프로메테우스"에 더 높은 평점 준 사용자 B 와 유사한 선호도를 갖는 사용자 A에게는 "프로메테우스" 를 추천하는 방식이다. 

 

(2) 아이템 기반(Item-Item) 협업 필터링

  • 특정 아이템에 대한 사용자들의 선호도 평가 척도가 유사한 아이템을 추천하는 것
  • 아래의 테이블에서 "다크 나이트"는 "인터스텔라"보다 사용자들의 평점분포가 유사하므로 "다크 나이트"를 좋아하는 사용자 D에게 "프로메테우스"를 추천하는 방식이다.

3-2. 잠재요인(Latent Factor) 협업 필터링

잠재 요인 협업 필터링은 사용자ㅡ아이템 평점 매트릭스 속에 숨어 있는 잠재 요인을 추출해 추천 예측을 할 수 있게 하는 기법으로, 대규모 다차원 행렬을 SVD(Singular Value Decomposition)와 같은 차원 감소 기법으로 분해하는 과정에서 의미 있는 잠재 요익을 추출하며, 이러한 기법은 행렬 분해(Matrix Factorization)이라고 한다.


다차원 희소 행렬(Sparse Matrix)인 사용자ㅡ아이템 평점 매트릭스 데이터를 저차원 밀집 매트릭스의 사용자ㅡ잠재 요인아이템ㅡ잠재 요인 매트릭스로 분해할 수 있으며, 이렇게 분해된 두 행렬의 내적을 통해서 새로운 사용자ㅡ아이템 평점 매트릭스를 계산해서 사용자가 평점을 부여하지 않은 콘텐츠에 대해 평점 예측이 가능한 것이 잠재 요인 협업 필터링의 핵심이다.


행렬 분해 기법은 SVD(Singular Value Decomposition)이나 NMF(Non-Negative Matrix Factorization) 등이 사용되며, 보통 희소행렬인 경우가 대부분이라 확률적 경사 하강법(Stochastic Gradient Descent, SGD)나 ALS(Alternating Least Squares) 방식을 이용해서 Factorization을 수행한다.

 


4. 하이브리드 협업 필터링(Hybrid filtering)

콘텐츠 기반 필터링과 협업 필터링을 결합하여 개인화 특성을 강화한 추천방식이다.


 

728x90
반응형