작성자: Wang Hao
| Sun Shujuan
추천 시스템의 공정성은 2017년부터 인공지능 연구의 뜨거운 분야였습니다. 트위터, 구글, IBM, 바이두 등 유명 인공지능 기업들은 모두 인공지능 윤리팀을 설립하거나 인공지능 윤리 제품을 개발했다. 그러나 인공지능 윤리 연구가 중국에서 뒤늦게 시작된 점은 아쉽고, 외국과 비교하면 여전히 어느 정도 격차가 있다.
순위 학습은 2010년경에 등장한 기계 학습 기술로 추천 시스템 및 정보 검색 분야에서 널리 사용되었습니다. 최근 몇 년 동안 순위 학습은 인공지능 윤리 연구의 인기 있는 알고리즘 벤치마크가 되었습니다.
이 기사에서는 2022년 CISAT 2022(International Conference on Computer Information Science and Application Technology)에서 발표된 추천 시스템의 공정성 향상을 위한 Pareto pairwise Ranking 논문을 소개합니다. 본 글에서는 파레토 분포와 순위 학습을 결합하여 공정한 순위 학습 추천 알고리즘을 구현하는 방법을 주로 설명합니다.
그림 1. MovieLens 데이터세트의 영화 시청률 차이 확률 분포
관찰(그림 1)과 통계 이론(Zipf 분포의 통계적 추정)을 바탕으로 다음과 같은 결론을 얻을 수 있습니다. 동일 항목별로 사용자의 평가 차이가 발생할 확률 분포는 평가 차이에 비례합니다. 확률 행렬 분해의 손실 함수를 수정하고 우리가 발명한 새로운 알고리즘인 Pareto 쌍별 순위의 손실 함수 공식을 얻습니다.
우리의 정당한 관찰 결과를 손실로 가져옵니다. 함수 공식에서 우리는 다음 손실 함수 공식을 얻습니다.
L의 로그를 취하여 다음 공식을 얻습니다.
그래디언트 내림차순 공식 손실 함수의 로그를 풀고 다음 공식을 얻습니다.
Pareto 순위 학습의 알고리즘 흐름은 다음과 같습니다.
그림 2와 3은 MovieLens 100만 데이터 세트 데이터 세트에 대한 Pareto 순위 학습 테스트 결과를 보여줍니다. 논문의 저자는 추천 시스템 알고리즘 10개를 비교한 결과 공정성 지수에서 Pareto 순위 학습 알고리즘이 가장 좋은 성능을 발휘한다는 사실을 발견했습니다.
그림 4와 그림 5는 LDOS-CoMoDa 데이터 세트에 대한 Pareto 순위 학습의 테스트 결과를 보여줍니다. Pareto 순위 학습 알고리즘은 여전히 공정성 지수에서 가장 좋은 성능을 발휘합니다.
파레토 순위 학습 알고리즘은 중국에서 보기 드문 공정성 기반 순위 학습 추천 시스템 알고리즘입니다. 알고리즘 원리는 간단하고 구현이 쉽고 작동 속도가 빠릅니다. 저자는 16G RAM과 Intel Core i5를 탑재한 Lenovo 노트북에서 테스트했는데, 실행 속도가 매우 빨랐습니다. 인공지능 윤리 연구는 현재 국제적으로 연구 핫스팟이고, 모두의 관심을 충분히 끌 수 있기를 바랍니다.
Funplus 인공 지능 연구소의 전 소장인 Wang Hao는 ThoughtWorks, Douban, Sina, NetEase 및 기타 회사에서 11년 이상의 R&D 및 관리 경험을 보유하고 있습니다. 그는 추천 시스템, 채팅 로봇, 위험 제어 및 사기 방지 분야에서 풍부한 기술 경험을 보유하고 있습니다. 국제학술대회 및 저널에 30편의 논문을 게재하였고, 최우수논문상/우수논문보고상 3회 수상하였습니다. 2006년 ACM 지역대회 금메달. 미국 유타대학교에서 학사, 석사 학위를 취득했습니다. 국제경영경제대학 파트타임 MBA.
위 내용은 파레토 순위 학습: 추천 시스템의 공정성에 기반한 순위 학습의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!