2021. 2. 26. 09:30ㆍ나혼빅(나혼자빅데이터)
2021.02.25
day11. 컨텐츠 기반 추천 시스템을 위한 Represented Items
벡터 형태의 Items을 표현하기 위해 총 12개의 컬럼을 선택하고, 전처리함
· 추천 시스템 (Recommendation system)
- 사용자가 소비하지 않은 아이템 중 선호/만족할 것으로 예상되는 아이템을 규명함
- 사용자의 취향 파악 -> 취향에 따라 상품 추천 -> 사용자는 해당 상품 구매
- 추천 시스템을 경험하면 높은 확률로 충성 고객이 됨. 사용자 유입이 많아지고, 데이터가 쌓이게 됨 -> 견고한 추천 시스템이 됨
- 추천 시스템은 콘텐츠 기반 필터링/ 협업 필터링 방식으로 나뉨
여기서 내가 먼저 시도해 볼 것이 컨텐츠 기반 추천 시스템이다.
<컨텐츠 기반 추천 시스템>
1. 콘텐츠 기반 필터링(Content based filtering)
- Items1, Items2, Items3 .... ItemN -> 벡터 1, 벡터2, 벡터3 ........ 벡터 N
-> 벡터들 간의 유사도를 계산
-> 벡터1부터 N까지 자신과 유사한 벡터를 추출
- 사용자가 특정 아이템을 선호하는 경우, 그 아이템과 비슷한 콘텐츠를 가진 아이템을 추천
예 : 사용자 A가 item A에 높은 평점을 주었을 때, 그 item이 action 영화, ‘김OO' 감독이면
‘김OO’ 감독의 다른 action 영화 추천
- 아이템의 콘텐츠를 직접 분석하여, 아이템과 아이템 혹은 아이템과 사용자 선호도간 유사성을 분석하여 이를 토대로 고객에게 아이템 추천
1) 사용자가 직접 입력한 프로파일 정보나 사용자가 아이템에 대해 평가한 점수 혹은 과거 구매내역을 바탕으로 생성된 정보를 통해 선호하는 아이템 파악
2) 미리 선정된 기준을 통해 분류된 아이템 카테고리와 사용자의 선호 아이템 간의 유사도 측정
3) 유사도가 가장 높게 나타난 카테고리 5에 해당하는 아이템을 추천 대상 고객에게 추천
현재, 사용자 프로필에서 item들을 가져왔으니, 아이템 속성 분석 및 사용자 선호도 학습을 진행해보도록 해야겠다.
'나혼빅(나혼자빅데이터)' 카테고리의 다른 글
[빅데이터] 데이터 분석 도구 R / R Studio 설치 / 한글 인코딩 (0) | 2021.04.23 |
---|---|
[통계] 심슨의 역설('Simpon's Paradox') (0) | 2021.03.09 |