Sequentially Diversified and Accurate Recommendations in Chronological Order for a Series of Users

 본 문서에서는 2025년 WSDM학회에서 발표될 "Sequentially Diversified and Accurate Recommendations in Chronological Order for a Series of Users" 논문을 소개합니다. 논문에 대한 상세한 정보는 다음과 같습니다.

  • Title: Sequentially Diversified and Accurate Recommendations in Chronological Order for a Series of Users
  • Authors: Jongjin Kim and U Kang
  • Conference: WSDM (2025)

Sequentially Diversified Recommendation

상품의 종류가 늘어나고 정보가 범람함에 따라 오늘날 사용자들은 구매할 아이템을 찾기 위해 추천시스템에 크게 의존하곤 합니다. 따라서 전자상거래 플랫폼 등에서 수익을 극대화하기 위한 기술이 점점 중요해지고 있습니다. 다양화 추천은 플랫폼의 수익을 극대화하기 위한 대표적인 연구 주제입니다. 다양화 추천에서는 사용자들에게 정확한 아이템을 추천하는 것을 넘어서 사용자 전체에 대해 다양한 아이템을 노출시키는 것을 목표로 합니다. 이를 통해 플랫폼은 보유한 재고를 모두 소진하도록 사용자들을 유도할 수 있으며 또한 덜 유명한 아이템의 노출 횟수를 늘려 고른 수익을 얻을 수 있습니다.

그러나 기존 다양화 추천 시스템(aggregately diversified recommendation)은 여러 사용자에 대한 추천이 동시에 일어난다고 가정하는 한계가 있었습니다. 실제 전자상거래 플랫폼에서는 사용자가 한 번에 한 명씩 필요할 때마다 추천을 받아가므로 매 추천 시점에서 이후에 어떤 사용자가 추천을 받게 될지를 사전에 알지 못한 채 추천을 진행해야 합니다. 본 논문은 이처럼 추천이 차례로 이루어지는 상황에서 다양화 추천을 수행하는 순차 다양화 추천(sequentially diversified recommendation)을 새로이 제안합니다.


그림 1. (a) 기존 다양화 추천과 (b) 순차 다양화 추천의 비교

그림 1은 추천의 순서를 고려했을 때 발생하는 문제를 보여주고 있습니다. 그림 1(a)는 기존 다양화 추천 기법의 작동 방식을 보여주고 있습니다. 모든 유저의 선호도가 미리 주어지면 유저 2는 체리만 좋아하므로 체리를 추천하고 유저 1은 체리와 키위를 비슷하게 좋아하므로 키위를 추천하여 정확도와 다양성을 모두 확보할 수 있습니다. 그러나 (b)와 같이 유저 1과 유저 2가 차례로 추천을 받는 경우 유저 2가 체리만 좋아한다는 사실을 유저 1에게 추천하는 시점에는 모릅니다. 따라서 단순히 유저 1이 더 좋아하는 체리를 추천하는 순간 유저 2에게 체리를 추천하기에는 다양성이 낮아지고 키위를 추천하기에는 정확도가 낮아지는 딜레마에 직면하게 됩니다

순차 다양화 추천 문제의 구체적인 정의는 다음과 같습니다.

  • 주어진 정보
    • 타임스탬프가 포함된 사용자-아이템 상호 작용 데이터(예: 클릭 또는 구매)
  • 목표
    • 사용자들이 추천을 받는 순서대로 각자 k개의 아이템을 추천
      • 높은 정확도 달성
      • 전체 사용자에 대해 다양한 아이템 노출
    이 때 사용자들에게 순서대로 추천을 한다는 것은 각 사용자들에게 추천할 때 나중에 추천받을 사용자들의 선호도 정보를 미리 알지 못한다는 것을 의미합니다. 따라서 추천 과정에서 바로 추천해야 할 아이템과 혹시 모를 나중 유저를 위한 아이템을 안배해 두는 것이 중요한 과제입니다.

    Proposed Method

    본 논문에서는 순차 다양화 추천 문제를 다루기 위해 SAPID (Sequentially Diversified Recommendation via Popularity Debiasing and Item Distribution)를 제안합니다. SAPID는 추천 모델을 학습하는 단계(training phase)와 모델의 결과를 리랭킹하는 단계(raranking phase)로 구성되며, 전체적인 과정은 그림 2와 같습니다. SAPID의 핵심 아이디어는 다음과 같이 요약됩니다.
    • SAPID는 추천 모델의 인기도 편향(popularity bias)을 줄이기 위해, 모델을 학습하는 과정에서 시간적 인기도 기반의 네거티브 샘플링을 통해 인기도가 낮은 아이템이 네거티브 샘플로 부당하게 자주 선택되는 것을 방지합니다.
    • SAPID는 추천 과정에서 지금 추천해야 할 아이템과 나중에 추천하기 위해 아껴둘 아이템을 구분하기 위해 각 아이템의 예상 총 추천 횟수를 계산하여 추천 후보군에서 예상 추천 횟수가 낮은 순서대로 추천 리스트를 구성합니다.
    그림 2. SAPID의 전반적인 과정.

    SAPID의 학습 단계에서는 일반적인 순차 추천 모델 (예: SASRec 또는 GRU4Rec)을 기본 모델 (base model)로 활용하여 사용자가 상호작용한 아이템 세션과 나중에 상호작용할 아이템 사이의 관계를 학습합니다. 이 때 일반적인 학습 방식을 이용하면 네거티브 샘플링 과정에서 사용자가 상호작용하지 않은 모든 아이템이 같은 확률로 선택되게 됩니다. 그러나 실제로는 유명한 아이템과 상호작용하지 않았다는 것은 실제로 그 아이템을 싫어했을 확률이 높지만 덜 유명한 아이템과 상호작용하지 않았다는 것은 단순히 해당 아이템을 몰랐기 때문일 수 있기 때문에 해당 아이템을 싫어한다고 단정하기 어렵습니다. 따라서 일반적인 학습 방식에서는 덜 유명한 아이템이 과도하게 선택되어 모델이 편향되는 문제가 발생합니다. 이를 해결하기 위해 SAPID에서는 세션이 형성된 시점의 아이템 인기도를 기반으로 네거티브 샘플링 확률을 조정하여 모델의 편향을 제거합니다. 구체적인 알고리즘은 논문을 참조해 주시기 바랍니다.

    SAPID의 리랭킹 단계에서는 기본 모델이 추론한 사용자의 아이템들에 대한 선호도를 바탕으로 추천 후보군을 조성하여 그 중 예상 총 추천 횟수가 낮은 아이템을 우선적으로 추천합니다. 이 과정에서 예상 총 추천 횟수는 미래의 각 아이템의 추천 비율은 기존 훈련 데이터셋에서 각 아이템의 등장 비율과 같다고 가정합니다. 이를 통해 지금까지 진행한 추천에서 각 아이템이 등장한 횟수와 미래에 각 아이템이 등장할 예상 횟수를 합하여 구합니다. 이를 통해 선호도가 높으면서도 모든 사용자들에 대한 추천이 완료된 후 다양성을 최대화하기 위한 아이템을 골라 추천할 수 있게 됩니다. 마찬가지로 구체적인 알고리즘은 논문을 참조해 주시기 바랍니다.

    Experiments

    본 논문은 제안하는 방법의 우수성을 입증하기 위해 기존 기법들과의 비교 실험을 제시합니다. 각 플롯의 X축은 정확도를 나타내고 Y축은 다양성을 나타내며, 정확도는 HR로 측정되어 높을수록 좋으며 다양성은 Gini계수로 측정되어 낮을수록 좋은 지표입니다. 기본 모델은 SASRec을 이용하였습니다. 모든 데이터셋에서 SAPID는 경쟁 기법보다 우수한 정확도 및 다양성을 보여 가장 우수한 경쟁 상대보다 최대 61.0%의 다양성 향상을 38.9%의 정확도 향상과 함께 거두었습니다. 이 외에 다양한 기본 모델에 대한 보다 세부적인 실험은 논문을 참조해 주시기 바랍니다.

    그림 3. SAPID와 경쟁 방법들의 성능 비교.

    Conclusion

    본 문서에서는 2025년 WSDM 학회에서 발표될 "Sequentially Diversified and Accurate Recommendations in Chronological Order for a Series of Users" 논문을 소개하였습니다. 해당 논문은 기존의 다양화 추천 문제를 현실 플랫폼에 맞게 수정한 순차 다양화 추천 문제를 제안하고 이를 해결하기 위한 알고리즘인 SAPID를 제안했습니다. SAPID는 실세계 데이터에서 경쟁 기법들에 비해 더 우수한 성능을 보였습니다. 본 논문은 실제 전자상거래 플랫폼에서 매우 유용하게 활용될 수 있습니다. 예를 들어, 쿠팡과 같은 플랫폼에서 여러 사용자들에게 추천을 진행할 때 보유한 재고를 최대한 많이 노출시켜 재고를 모두 소진하게끔 유도함으로써 잠재 수익을 높일 수 있습니다. 또한, 유튜브와 같은 컨텐츠 플랫폼에서도 여러 제작자의 컨텐츠를 고루 노출시킴으로써 소외되는 제작자 없이 활발한 생태계가 조성되도록 유도할 수 있습니다. 이처럼 본 논문은 실제 온라인 플랫폼에서 제공자와 소비자의 만족도를 모두 높일 수 있을 것으로 기대됩니다. 본 논문에 대한 자세한 정보는 다음 링크에서 확인할 수 있습니다 (Link).