- Title: Towards True Multi-interest Recommendation: Enhanced Scheme for Balanced Interest Training
- Authors: Jaeri Lee, Jeongin Yun, and U Kang
- Conference: BigData (2024)
Multi-interest Recommendation
추천 시스템은 사용자의 관심사를 기반으로 콘텐츠를 추천하는 기술로, 전자상거래, 동영상 스트리밍, 소셜 네트워크 등 다양한 분야에서 핵심적인 역할을 합니다. 최근에는 단일 관심사 추천(single-interest recommendation)의 한계를 보완하고자 다중 관심사 추천(multi-interest recommendation)이 도입되었습니다. 이러한 다중 관심사 추천 모델은 사용자의 복잡한 선호를 여러 벡터로 나타내어 더 정밀한 추천을 가능하게 합니다.
그러나 기존 다중 관심사 추천 연구는 주로 모델 아키텍처 설계에 초점을 맞추었으며, 학습 과정에서 나타나는 불균형 문제를 간과하는 경우가 많습니다. 특히, 하나의 주요 관심사에 학습이 집중되어 다른 관심사들은 충분히 반영되지 못하는 문제와 각각의 관심사를 독립적으로 학습한다는 문제가 존재합니다. 이는 다음과 같은 결과를 초래합니다:
- 추천의 편향: 특정 관심사에 치우친 추천 결과.
그림 1. 관심사 학습과 각 관심사에서 도출된 추천의 비중.
그림 1은 기존 다중 관심사 추천 모델인 ComiRec에서 학습이 한 관심사에 치중되었을 때, 추천 결과 역시 한 관심사로 평향됨을 보여줍니다. 본 논문에서 제안한 기법인 BaM은 학습을 균형있게하여 결과적으로 고르게 분포된 추천을 보여줍니다.
- 관심사 간 관계 미반영: 사용자 선호의 다차원적인 상호작용을 효과적으로 학습하지 못함.
그림 2. 아이템-관심사 분배 행렬.
그림 2는 기존 다중 관심사 추천 모델인 ComiRec은 독립된 하나의 아이템으로만 각 관심사를 표현하고 있음을 나타냅니다. 반면, 제안한 기법인 BaM은 겹치거나 겹치지 않는 여러 아이템으로 여러 관심사를 표현하여, 관심사 간의 관계를 고려하고 있습니다.
위와 같은 문제를 해결하며, 본 논문에서 제안한 기법인 BaM 순차 추천에서 뛰어난 성능을 보입니다. 순차 추천 문제의 구체적인 정의는 다음과 같습니다:
- 주어진 정보: 타임스탬프가 포함된 사용자-아이템 상호 작용 데이터(예: 클릭 또는 구매)
- 목표: 사용자들에게 각자 k개의 아이템을 추천
Proposed Method
- 소프트 셀렉션(Soft Selection) :기존 방식에서는 손실(loss) 계산 시 가장 유사도가 높은 단일 관심사만 선택하여 학습에 사용했습니다. BaM은 확률 기반의 소프트 셀렉션을 도입하여 모든 관심사가 고르게 학습될 기회를 제공합니다. 이는 관심사 간 편향을 줄이고, 사용자 선호를 다각도로 반영할 수 있도록 합니다
- 다중 관심사 손실 함수(Multi-interest Loss) : BaM은 전통적인 단일 관심사 손실 함수(single-interest loss)를 확장하여 모든 관심사 벡터의 기여를 고려하는 다중 관심사 손실 함수를 도입했습니다. 이를 통해 관심사 간의 상호작용을 반영하고, 더 풍부한 사용자 표현을 학습할 수 있습니다.
그림 3. BaM의 구조도
BaM은 소프트 셀렉션은 모든 관심사 벡터가 균형 있게 학습되도록 설계되었습니다. 기존의 다중 관심사 추천 모델은 관심사 벡터 중 하나를 선택할 때, 유사도가 가장 높은 벡터를 고정적으로 선택(하드 셀렉션)하여 손실을 계산합니다. 이러한 방식은 선택되지 않은 관심사 벡터가 충분히 학습되지 못하게 하여, 특정 관심사에 과도하게 치우친 학습 결과를 초래합니다. 예를 들어, 사용자가 특정한 카테고리(예: 액션 영화)에 높은 빈도로 상호작용을 하면, 그 외의 잠재적 선호도(예: 다큐멘터리, 로맨스 등)는 모델에 반영되지 못합니다. 소프트 셀렉션은 각 관심사 벡터와 정답 아이템 간의 유사도를 기반으로 확률 분포를 생성하며, 이 확률에 따라 벡터를 선택합니다. 특히, 소프트맥스(Softmax) 함수와 조정 가능한 하이퍼파라미터 τ를 활용해 확률 분포의 집중도를 제어할 수 있습니다. 구체적인 수식은 논문을 참조해주시길 바랍니다.
BaM은 여러개의 관심사 벡터를 동시에 학습하는 다중 관심사 손실 함수를 제안합니다. 기존의 단일 관심사 손실 함수는 가장 유사도가 높은 하나의 관심사 벡터만을 선택하여 손실을 계산하므로, 다른 관심사 벡터는 학습 과정에서 제외됩니다. 이는 사용자 관심사의 다차원적인 특성을 반영하지 못하며, 관심사 간 상호작용이 중요한 경우 모델 성능을 제한합니다. 다중 관심사 손실 함수는 LogSumExp 연산을 활용하여, 모든 관심사 벡터의 기여도를 반영한 확률값을 계산합니다. 예를 들어, 사용자가 액션 영화를 선호하지만 특정 감독의 코미디 영화에도 관심을 가진 경우, 두 관심사가 함께 학습에 반영됩니다. 또한, 다중 관심사 손실 함수는 관심사 벡터와 아이템 간의 연관성을 한 번에 학습하며, 이 과정에서 관심사 간의 관계와 연관성을 동시에 반영합니다. 이를 통해 모델은 단순히 독립된 관심사를 학습하는 것을 넘어, 사용자의 복합적인 선호 구조를 포괄적으로 이해할 수 있습니다. 마찬가지로 구체적인 수식은 논문을 참조해주시길 바랍니다.