Learning (42) 썸네일형 리스트형 04-2. 그래프 기반 추천(Graph-based) Input Data : Transactional Data(거래가 이루어진 데이터) -> Consumer와 product 사이의 관계를 Matrix&Graph로 표현 6 Types of CF(Collaborative Filltering) for e-Commerce Recommendation 1. User-based 2. Item-based Sparsity 문제를 해결하고자 하는 방식들 3. Dimensionality Reduction 4. Generative Model(확률적 접근 방법) 5,6. Graph-based Recommendation(그래프 특성을 활용한 접근 방법) Concept : 그래프에서의 연결 정보들을 탐색하면 잠재된 연결성을 찾을 수 있다. [연결정보를 다루는 방식] 5. Spread.. 04-1. 고급 추천(Beyond Accuracy) 추천의 만족도 : Beyond Accuracy Accuracy : 유저의 평점/소비에 맞게 예측하는가 Diversity : 다양한 유형의 아이템이 추천되는가 Serendipity : 예상치 못한(surprise) 아이템이 추천되는가 Novelty : 경험하지 못한 새로운 아이템이 추천되는가 Coverage : 얼마나 많은 아이템이 추천되는가 Accuracy 위주의 추천 - 연관성이 높은 아이템들을 추천 - 추천을 former하게 표현 한다면 - 목적함수에 연관성 외의 다른 요소를 포함하여 고려 가능 Diversity 1. Intra List Diversity - 얼마나 다양한 item을 추천하는지 : 제공 되는 K개의 추천 결과 아이템이 비슷한 속성을 이루어지는 것을 지양 2. Inter List Div.. 03-4. Personalized Recommendation Personalized Recommendation -> 사용자의 활동 로그를 활용하여 프로파일 생성 1. 연관 추천을 이용한 개인화 2. 유사한 사용자 기반의 개인화(kNN) : user의 History는 event의 집합이다. 이 event는 어떤 item을 클릭하거나 구매한 timestamp가 존재한다. 연관 추천을 이용한 개인화 - 관련이 있는 Item A,B,C가 시간 순서에 따라 행동 로그가 생겼을때, C가 가장 최근에 발생한 item이기 때문에 가중치 1을 부여하고 나머지 B,A는 순서에 따라 0.7, 0.5의 가중치를 부여한다는 컨셉 - 스코어링 어떤 user가 아이템 j에 대해서 가지는 스코어 값은 어떤 user History에 있는 이 event에서 어떤 item과 다른 item j가 시.. 03-3. Related Recommendation Related Recommendation - 해당 상품 구매가 꺼려지는 경우 연관된 다른 상품을 추천해주는 방법 "Transaction Data에서의 아이템 연관성 추출" - 사용자 : 동일 사용자가 같이 본 아이템들은 연관성 존재 - 세션 : 동일 세션에서 같이 조회한 아이템들은 연관성 존재 - 인접 : 동일 사용자 로그의 인접한 아이템들은 연관성 존재 연관성 추출 기준 - 세션 기준이 경험상 가장 정확함. 유사도 지표 - 특별한 경우가 아니라면 코사인 유사도가 가장 유용함 가중치 할당 - 대중적인 아이템은 조회나 접근 횟수가 많아 단순 카운팅 기반으로 가중치를 부여할 경우 이상 현상이 발생할 수 있음 - 가중치를 0,1로만 한정할 수 있음 - 최대값을 한정하여 이상치를 조절할 수 있음 - 횟수에 로그.. 03-2. Best Recommendation Best Recommendation ☞ 다양한 그룹에서의 베스트 - 전체 베스트 - 시간대 별 베스트 - 브랜드 별 베스트 - 카테고리 별 베스트 - 성별에 따른 베스트...... ☞ 스코어링 방법 별 베스트 - 구매 베스트 - 클릭 베스트 - 구매전환 베스트........ Step1. Best의 대상이 되는 그룹 정의 Step2. 각 그룹마다 특성화된 스코어링 방법 적용 ※ 만약 전체 Best와 그룹별 Best의 결과가 다르게 나올 경우, 새로운 인사이트를 추출하여 활용도가 높아진다. Case Study 전체 베스트 추출 Click 이력을 이용한 Best Product 추출 - 단순히 Click 이력을 사용하면 여러번 클릭하는 경우를 포함하기 때문에 session_id를 중복 제거 후 count - t.. 03-1. E-commerce 상품 추천(트랜잭션 데이터 기반) Overview 대표적인 E-commerce 사이트 - E-commerce의 추천 흐름 예시 - 추천 시스템 분류 E-commerce의 특성 1. Target : Product 2. Seasonality : 시즌성이 중요함(시즌별 추천 상품도 달리 해야한다.) 3. Meta Info : price, brand, category 등의 메타 정보가 중요. 4. Implicit Feedback : 직접적인 정보를 받기 힘들기에 implicit 정보를 확인(클릭, 검색) (평점, 장바구니, 좋아요 등으로는 explicit 가능) 5. Recency : 최신 상품 추천이 중요(사용자의 행위 패턴도 최신성이 중요하다.) 6. Top-K-Recommendation 추천 알고리즘 선택 1. Hybrid Approach.. 02-3. CF 기반 평점 예측을 이용한 영화 추천 Item-based Collaborative Filtering 가정 : 유사한 아이템(ex. 평점을 부여한 패턴)에 내가 부여한 평점과 비슷한 평점을 부여 다시 이해해보기 CBF vs CF 1. CBF 기반 아이템유사도: 아이템간의 유사도를 아이템 속성(메타데이터 ex.장르)을 이용하여 계산 Step 1 : TF-IDF를 이용하여 아이템을 vector로 표현 Step 2 : 아이템간의 유사도를 cosine similarity로 계산 2. CF 기반 아이템유사도: 아이템간의 유사도를 사용자의 아이템 평가 이력을 이용하여 계산 Step 1 : 평점데이터를 이용하여 아이템을 vector로 표현 Step 2 : 아이템간의 유사도를 cosine(pearson) similarity로 계산 - Dimension : .. 02-2. CBF 기반 평점 예측을 이용한 영화 추천 CBF 기반 예측 아이템 유사도 기반 평점 예측 가정 : 유사한 영화에는 유사한 평점을 부여할 것이다. -> 아이템간 유사도를 기준으로 평점에 가중치를 부여하여 평점을 예측 >> (4*0.7 + 3*0.2 + 3*0.3 + 5*0.5) / (0.7 + 0.2 + 0.3 + 0.5) = 4 컨텐츠 기반 유사도 측정 - 두 아이템간의 유사도를 어떻게 정량화 할 것이냐가 관건 - CBF에서는 유사도를 정량화 하기 위해서 컨텐츠 자체가 가진 특성을 활용 ex. 뉴스 : 제목, 기사 내용 등 영화 : 장르, 감독, 출연자 등 상품 : 카테고리, 가격, 이미지 등 영화의 장르를 이용해 유사도 측정 - 장르의 집합으로 간주 - 대부분 자카드 유사도를 사용한다. Distance & Similarity Bag-of-Wo.. 이전 1 2 3 4 5 6 다음