(사진=SKT)
이번에 발표된 논문은 SKT가 독자 개발한 ‘충돌 선호 최적화(C-APO, Conflict-Aware Direct Preference Optimization)’를 핵심으로 한다. 이 기술은 서로 상충하는 선호를 걸러내고 고객이 진짜 원하는 상품을 보다 정확하게 추천하는 데 사용된다.
이를 위해 SKT는 고객이 오랜 기간 반복적으로 보여온 행동 패턴을 분석해, 꾸준히 관심을 보여온 취향을 ‘일관된 선호’로 정의한다. 예를 들어, 고객이 특정 서비스나 콘텐츠를 지속적으로 조회하거나 이용해 왔다면, 이를 고객의 실제 관심사에 가까운 신호로 보는 방식이다. 반면, 한두 번 클릭했거나 우연히 조회한 서비스, 일시적인 호기심으로 이용한 콘텐츠는 ‘표면적 선호’로 구분한다.
(사진=SKT)
기존 추천 시스템은 일시적 행동도 고객의 취향으로 받아들이는 경우가 많아 실제 취향과 다른 추천이 발생하기도 했다. 하지만, SKT의 독자 개발 기술을 활용하면 전체 이용 이력 속에서 반복성과 맥락을 함께 따져 더 신뢰도 높은 ‘일관된 선호’를 찾아낼 수 있다.
예를 들어, 평소 로맨스 영화를 선호하는 고객이 한 번 액션 영화를 시청했을 때 이후 추천이 해당 장르로 치우치는 현상이 나타날 수 있는데, 이 기술은 이러한 일시적 반응과 실제 취향을 구분해 보다 일관된 추천을 가능하게 한다.
또, 무엇을 추천할지에 그치지 않고, 추천 결과를 보다 논리적으로 설명할 수 있는 기반도 강화했다. 이는 향후 AI 추천 서비스에서 추천의 품질뿐 아니라 설명 가능성과 신뢰도를 높이는 데에도 중요한 역할을 할 것으로 기대된다.
SKT는 이번 연구 결과를 고객의 △이용 맥락 해석 △추천 후보 생성 △결과 검증·조정에 이르는 3단계 계층이 유기적으로 협력하는 에이전트 방식의 대고객 추천 시스템에 적용할 예정이다.
석지환 SKT AI/DT데이터담당은 “이번 기술은 고객의 실제 취향을 더 정확히 이해해, 더 신뢰도 높은 개인화 추천 경험을 제공하기 위한 기반 기술”이라며, “이번 ICLR 2026 논문 발표는 고객 경험을 AI로 고도화하는 SKT의 AI 전환에 의미 있는 이정표로, 앞으로도 고객이 체감할 수 있는 AI 기술을 지속적으로 발전시켜 나가겠다”고 말했다.









