Aggregately Diversified Bundle Recommendation via Popularity Debiasing and Configuration-aware Reranking

본 문서에서는 2023년 PAKDD 학회에서 발표될 "Aggregately Diversified Bundle Recommendation via Popularity Debiasing and Configuration-aware Reranking" 논문을 소개합니다. 논문에 대한 상세한 정보는 다음과 같습니다.

Title: Aggregately Diversified Bundle Recommendation via Popularity Debiasing and Configuration-aware Reranking
Authors: Hyunsik Jeon, Jongjin Kim, Jaeri Lee, Jong-eun Lee, and U Kang
Conference: PAKDD (2023)

Aggregately Diversified Bundle Recommendation

추천 시스템은 온라인 플랫폼에서 매우 중요하며, 번들 추천은 사용자에게 개별 아이템 대신 아이템 묶음을 제안하는 것을 목표로 합니다. 번들 추천은 한번의 구매로 고객이 필요한 여러 아이템을 제공할 수 있는 이점 때문에 온라인 플랫폼에서 주목받고 있습니다. 그러나 전통적인 번들 추천 모델은 정확도에만 초점을 맞추어 다양성에 대한 주의를 기울이지 않았습니다. 이에 반해 집계적으로 다양한 번들 추천(aggregately diversified bundle recommendation)은 정확도 뿐만 아니라 사용자 전체에 대해 다양한 아이템을 노출시키는 데 중점을 둡니다. 사용자들에게 다양한 아이템을 노출시키는 것은 그림 1과 같이 장기적으로 플랫폼의 판매 이익을 높일 뿐 아니라, 사용자들이 새로운 아이템을 발견할 수 있게 됨으로써 궁극적으로 사용자의 만족도도 높일 수 있습니다.

그림 1. 번들 추천에서 집계적 다양성의 중요성.

본 논문에서는 이처럼 실세계에서 매우 중요한 문제인 집계적으로 다양한 번들 추천 문제를 다룹니다. 구체적인 문제 정의는 다음과 같습니다.

주어진 정보

사용자-번들 상호 작용 데이터(예: 클릭 또는 구매)
사용자-아이템 상호 작용 데이터(예: 클릭 또는 구매)
번들-아이템 구성 데이터

목표

각 사용자에게 k개의 번들을 추천

높은 정확도 달성
전체 사용자에 대해 다양한 아이템 노출

최근 아이템 추천에서 집계적 다양성(aggregate diversity)을 다루기 위한 여러 연구가 있었습니다. 리랭킹(reranking) 기반 방법은 정확도와 집계적 다양성을 모두 달성하기 위해 훈련된 모델의 추천 결과를 재정렬하는 방식으로, 집계적 다양성을 다루는데 효과적이라고 알려져 있습니다. 그러나 이러한 방법들은 번들 추천에서 직접 활용하기에 완전히 적합하지 않은데, 첫째로, 번들 추천 모델이 인기 있는 번들에 과적합되기 쉬우며, 이로 인해 집계적 다양성을 높이기 위해서 정확도를 많이 희생해야 합니다. 둘째로, 번들 추천에서 아이템 노출의 다양성을 다루는데 중요한 정보인 번들 구성을 고려하지 않습니다.

Proposed Method

본 논문에서는 집계적으로 다양한 번들 추천 문제를 다루기 위해 PopCon (Popularity Debiasing and Configuration-aware Reranking)을 제안합니다. PopCon은 추천 모델을 학습하는 단계(training phase)와 모델의 결과를 리랭킹하는 단계(raranking phase)로 구성되며, 전체적인 과정은 그림 2와 같습니다. PopCon의 핵심 아이디어는 다음과 같이 요약됩니다.

PopCon은 추천 모델의 인기도 편향(popularity bias)을 줄이기 위해, 모델을 학습하는 과정에서 인기도 기반의 네거티브 샘플링(negative sampling)을 도입합니다.
PopCon은 정확도와 집계적 다양성이라는 상반된 목표를 동시에 다루기 위해, 리랭킹 과정에서 사용자가 좋아할 확률이 높은 번들은 추천 목록에 남기고 사용자가 좋아할 확률이 낮은 번들을 덜 노출된 아이템들을 포함하는 번들로 대체합니다.

그림 2. PopCon의 전반적인 과정.

PopCon의 학습 단계(training phase)에서는 널리 쓰이는 번들 추천 모델(예: DAM 또는 CrossCBR)을 백본(backbone) 모델로 활용하여 사용자와 번들의 관계를 학습합니다. 이러한 번들 추천 모델은 사용자들에게 인기있는 번들을 주로 추천하는 경향을 나타내는 인기도 편향 현상이 나타나며, 이로 인해 높은 다양성을 달성하기 어려워집니다. PopCon은 이러한 인기도 편향을 완화하기 위해 모델 학습 과정에서 인기도 기반의 네거티브 샘플링(negative sampling)을 도입합니다. 일반적으로는 균일한 확률 분포에서 네거티브 번들을 선택하여 사용자와 해당 번들 간의 관계에 대한 점수를 낮추도록 모델을 학습하지만, PopCon은 인기 있는 번들에 대한 네거티브 선택 확률을 높임으로써 이러한 인기도 편향을 줄입니다. 네거티브 샘플링에 대한 구체적인 확률 분포는 논문을 참조해 주시기 바랍니다.

PopCon은 리랭킹 단계(reranking phase)에서 학습된 모델의 추천 결과를 재정렬하여 정확도와 집계적 다양성을 동시에 최대화하는 것을 목표로 합니다. 먼저, 모든 번들에 대한 점수를 사용하여 각 사용자에 대한 후보 번들을 선택한 후, 이를 재정렬하여 최종 번들을 추천합니다. 이 과정에서, PopCon은 각 사용자와 번들 간의 적합성을 평가하기 위해 새로운 점수 측정 방식을 도입합니다. 이 점수는 사용자가 번들을 좋아할 확률이 높을수록, 집계 다양성을 크게 증가시킬수록 더 큰 값을 갖습니다. 집계 다양성이 증가하는 정도는 각 번들의 구성을 파악한 후, 해당 번들을 추천하면 얼마나 아이템의 다양성을 증가시키는지를 통해 계산됩니다. 한편, 정확도와 집계적 다양성은 서로 상반되기 때문에 이 두 가지를 동시에 높이는 것은 매우 어려운 문제입니다. PopCon을 이를 다루기 위해 사용자의 만족도를 높이기 위해서는 집계적 다양성의 향상에 상관없이 사용자들이 좋아할 확률이 높은 번들이 추천되어야 한다는 직관을 반영합니다. 구체적으로는, 정확도가 높아짐에 따라 집계적 다양성 향상의 영향을 줄이도록 식을 설계합니다. 해당 식에 대한 구체적인 내용은 논문을 참조해주시기 바랍니다.

Experiments

본 논문은 제안하는 방법의 우수성을 입증하기 위해 기존 기법들과의 비교 실험을 제시합니다. 각 플롯의 X축은 정확도를 나타내고 Y축은 집계적 다양성을 나타내며, 모두 높은 값일 수록 좋은 성능을 의미합니다. PopCon은 두 가지(DAM, CrossCBR) 모델을 백본으로 사용했을 경우에 모두 경쟁 방법들에 비해 우수한 성능을 보입니다. 이는 PopCon이 경쟁 방법들에 비해 정확도 손실을 최소화하며 집계적 다양성을 최대화하는 것을 의미합니다.

그림 3. PopCon과 경쟁 방법들의 성능 비교.

Conclusion

본 문서에서는 2023년 PAKDD 학회에서 발표될 "Aggregately Diversified Bundle Recommendation via Popularity Debiasing and Configuration-aware Reranking" 논문을 소개하였습니다. 해당 논문은 번들 추천에서 정확도의 손실을 최소화하면서 집계적 다양성을 최대화할 수 있는 PopCon (Popularity Debiasing and Configuration-aware Reranking) 알고리즘을 제안하였습니다. PopCon은 실세계 데이터에서 경쟁 기법들에 비해 더 우수한 성능을 보였습니다. 본 논문은 실제 온라인 플랫폼에서 매우 유용하게 활용될 수 있습니다. 예를 들어, 아마존과 같은 전자상거래 사이트에서 상품 묶음을 추천할 때 최대한 많은 상품들을 노출시켜 장기적인 판매 이득을 최대화할 수 있습니다. 또한, 스포티파이와 같은 스트리밍 사이트에서 플레이리스트를 추천할 때 다양한 음악들을 노출시켜 사용자들의 만족도를 높일 수 있습니다. 이처럼 본 논문은 실제 온라인 플랫폼에서 판매 이득과 사용자의 만족도를 모두 높이는데 유용하게 활용될 수 있을 것으로 기대됩니다. 본 논문에 대한 자세한 정보는 다음 링크에서 확인할 수 있습니다(링크).

Data Mining Lab. Blog

Search This Blog