본문 바로가기

추천시스템

(3)
02-3. CF 기반 평점 예측을 이용한 영화 추천 Item-based Collaborative Filtering 가정 : 유사한 아이템(ex. 평점을 부여한 패턴)에 내가 부여한 평점과 비슷한 평점을 부여 다시 이해해보기 CBF vs CF 1. CBF 기반 아이템유사도: 아이템간의 유사도를 아이템 속성(메타데이터 ex.장르)을 이용하여 계산 Step 1 : TF-IDF를 이용하여 아이템을 vector로 표현 Step 2 : 아이템간의 유사도를 cosine similarity로 계산 2. CF 기반 아이템유사도: 아이템간의 유사도를 사용자의 아이템 평가 이력을 이용하여 계산 Step 1 : 평점데이터를 이용하여 아이템을 vector로 표현 Step 2 : 아이템간의 유사도를 cosine(pearson) similarity로 계산 - Dimension : ..
02-1. 평점 예측을 이용한 영화 추천_overview Overview 영화 평점 데이터 셋 추천 시스템 분류 어떤 요건에 맞춰 어떤 데이터를 활용하여 어떤 모델을 이용하여 어떤 방식으로 계량할까? 추천 알고리즘 분류 Movielens 데이터 탐색 - timestamp 변수를 활용하여 date, year 파생변수 생성 df['date'] = pd.to_datetime(df['timestamp'].astype(int), unit='s') df['year'] = df['date'].apply(lambda x: x.year) - train data random sampling train = df.sample(frac=0.9, random_state=1) train['type'] = 'train' train.head() - test data sampling test..
01. 추천시스템 개요 추천시스템이란? 사용자 개인의 취향 파악을 통해 취향에 맞는 상품, 컨텐츠(영상, 음악) 등을 추천해주는 시스템. ex. Amazon 상품추천, Netflix 영상 추천, Youtube Music 음악 추천 등 (추천시스템의 이점) 1. 사용자 - 개인의 취향/선호를 파악하여 추천해주기 때문에 검색에 들이는 시간을 줄이고 생각하지 못한 선호 제품, 컨텐츠 등을 얻을 수 있다. 2. 서비스 제공자 - 목표로 하는 KPI를 달성 할 수 있다. (매출, Page View, Unique Visitor 등) 도메인에 따라 다른 추천 접근 방식을 가져야한다. 뉴스 - 최신성, 핫이슈 + 개인의 관심영역 영화 - 장르 패션 - 스타일 친구 - SNS 음악, 여행지, 식당 등 어떤 사용자에게 어떤 아이템을 제공할 것인..