村上里沙快播

找色妹妹 FRC:一种基于图镶嵌回击学习公谈示意的保举算法 FRC: A Recommendation Algorithm Based on Graph Embedding Adversarial Learning for Fair Representation

发布日期:2025-04-15 10:43    点击次数:126

找色妹妹 FRC:一种基于图镶嵌回击学习公谈示意的保举算法 FRC: A Recommendation Algorithm Based on Graph Embedding Adversarial Learning for Fair Representation

上海理工大学光电信息与算计机工程学院找色妹妹,上海

收稿日历:2024年4月30日;委派日历:2024年5月23日;发布日历:2024年5月31日

纲目

保举系统的标的是过滤和筛选信息,从而展望用户最感兴趣的内容。但公谈性问题可能会对保举结果产生影响。现时的公谈性保举模子大多数假定用户实体之间的独处性,莫得研讨实体之间联系的情况下该何如缓解公谈性问题。此外,在已有的少数愚弄图结构缓解公谈性问题的决策中,仅愚弄节点镶嵌学习数据示意,而用户的明锐信息可能会被局部图结构袒露。针对上述两个问题,本文建议了一种基于图镶嵌回击学习达成公谈保举的模子FRC,适用于任何将用户和技俩镶嵌看成输入的保举任务,该模子将用户–技俩数据映射为双向图,结合用户级和节点级的镶嵌示意,愚弄回击学习吊销明锐特征以获取保举任务中的公谈示意。在两个真确寰宇数据集上的对比实验结果标明,本文建议的模子在保举任务中为用户生成了更公谈的保举成果。

要害词

回击学习,公谈示意学习,图镶嵌,保举系统

FRC: A Recommendation Algorithm Based on Graph Embedding Adversarial Learning for Fair Representation

Haoyang Li

School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai

Received: Apr. 30th, 2024; accepted: May. 23rd, 2024; published: May. 31st, 2024

ABSTRACT

The goal of recommendation systems is to filter and select information in order to predict the content that users are most interested in. However, fairness issues may impact the recommendation results. Most existing fairness recommendation models assume independence between user entities and do not consider how to mitigate fairness issues when entities are correlated. Additionally, in a few existing studies that utilize graph structures to address fairness issues, only node embeddings are used for learning data representations, potentially exposing sensitive user information through local graph structures. To address these two issues, this paper proposes a model called FRC, based on graph embedding adversarial learning, to achieve fair recommendations. It is applicable to any recommendation task that takes user and item embeddings as input. The model maps user-item data into a bidirectional graph, combines user-level and node-level embeddings, and utilizes adversarial learning to eliminate sensitive features for fair representation in recommendation tasks. Comparative experiments on two real-world datasets demonstrate that the proposed model generates fairer recommendations for users in recommendation tasks.

Keywords:Adversarial Learning, Fair Representation Learning, Graph Embedding, Recommendation System

Copyright © 2024 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

1. 小引

在如今信息爆炸的时间,保举系统等闲应用于各样场景,为用户提供个性化建议。近期有一些决策标明,保举结果常受算法偏见和不公谈身分影响 [1] [2] [3] 。举例,奇迹保举时,同等条目的男女候选东谈主,系统更偏向保举男性 [4] ;在外交网罗保举中,结果常偏向多数群体,限度了少数群体的社会影响力 [5] 。因此,决策保举系统中存在的不公谈问题变得至关迫切。

公谈示意学习因其简便普适的特色受到了等闲顺心,其主要任务是学习数据的示意,并愚弄回击学习手艺过滤掉数据示意中袒护的明锐信息,以达成公谈保举的标的。但有大范围的决策标明,用户的明锐特征(性别、年纪)是不错从其他雷同的用户活动特征中推断出来的,大多数基于公谈性的保举任务假定实体之间的独处性,并莫得建模与其他实体联系情况下该何如缓解保举不公谈问题。在保举系统中,将数据映射为图结构,不错团员节点之间的关联信息,获取更高维度的信息示意,以处置上述问题。因此,基于图的视角学习保举中的公谈示意是至关迫切的。

决策以为用户和技俩的数据不错自然酿成用户–技俩双向图的结构 [6] [7] ,在学惯用户和技俩镶嵌示意时引入图结构,并结合神经图网罗模子,会得到优质的保举性能 [8] 。此外,在已有的少数将图结构与公谈性保举结合的决策中,仅愚弄节点镶嵌学习数据示意,独处的对每个节点的明锐特征进行过滤,用户的明锐信息可能会被其局部图结构所袒露。因此本文将为每个用户成就以自我为中心的图网罗,团员用户邻域信息,学惯用户级的数据示意,结合节点眉目的数据示意,愚弄图回击学习过滤明锐特征,以缓解保举系统中的不公谈问题。

本文专注于决策公谈示意学习,旨在吊销示意学习中的用户明锐特征 [3] [9] 。公谈性系统的要求为袒护用户的明锐特征,如性别、年纪和奇迹,以确保保举结果与用户的明锐特征无关。鉴于保举系统在试验应用中的各样性和复杂性,保举模子应具有不成知性。故本文建议的模子适用于任缘何用户和技俩镶嵌看成输入的保举任务。通过界确认锐特搜集,从图的视角学习过滤空间,生成屏蔽明锐特征的用户镶嵌示意。具体地说,本文模子学习了每个明锐特征的过滤器,将原始用户和技俩镶嵌示意转机到过滤空间中,并将每个用户示意为一个自中心网罗图,在回击熟习中学习数据示意,吊销以用户为中心的图结构中暴浮现的明锐特征;辨别器老成展望相应的明锐特征,与过滤器共同熟习,通过回击学习使得过滤器和辨别器二者互相学习,从而达成更公谈的保举。此外,因技俩曝光偏差的存在,在数据采样经由中,算计技俩的曝光度,通过负采样计谋提高保举准确性。

2. 问题界说

2.1. 保举任务

保举系统旨在向用户保举其最有可能感兴趣的技俩。在保举任务中,界说 U = { u 1 , u 2 , u 3 , ⋯ , u m } 为用户勾搭, V = { v 1 , v 2 , v 3 , ⋯ , v n } 为技俩勾搭,m和n示意用户和技俩的数目。用户与技俩的交互历史界说为矩阵 R ∈ ℝ M * N , r u v 为用户u对技俩v的评分,若用户u于技俩v莫得交互则 r u v = 0 。将用户–技俩数据构建为双向图 G = 〈 U ∪ V , A 〉 , A 是基于交互矩阵 R 构建的,不错示意为:

A = [ R 0 N × M 0 M × N R T ] (1)

通过编码学惯用户和技俩的镶嵌示意 E = E n c ( G ) = [ e 1 , ⋯ , e u , ⋯ , e v , ⋯ , e M + N ] 。使用 r ^ u v 示意关于用户–技俩对的展望偏好得分,不错示意为:

r ^ u v = e u T × e v (2)

2.2. 公谈性任务

与之前的决策一致 [2] [10] ,达成保举任务公谈性最径直的见解吊销用户数据中的隐秘明锐特征,举例年纪、奇迹、性别等。假定 X ∈ ℝ K * M 示意用户的明锐特搜集,为了保证保举结果不受用户明锐特征的影响,关于给定用户u,汗漫 v ∈ V 关于用户–技俩对展望结果的评分函数 r ^ u v 齐独处于用户明锐特征 X u ,表情上,将公谈性任务界说为:

I ( f u , X u ) = 0 , ∀ u ∈ U (3)

其中 I ( · ) 示意两个变量的交互信息, f u 示意过滤明锐特征后的用户镶嵌示意。

3. 步骤

本文建议的模子如图1所示。该模子的标的是在过滤空间中达成模子不成知的公谈示意学习,也便是该模子不错应用于将用户和技俩镶嵌看成输入的汗漫保举任务中,这里公谈性的要求指的是保举结果不受用户明锐特搜集 X ∈ ℝ K * M 的影响。

本文模子使用回击学习达成公谈性,回击网罗由过滤器网罗 F k 和辨别器网罗 D k 构成。本节将重心先容过滤器结构、保举公谈性的建模以及回击熟习经由。

3.1. 过滤器结构

使用过滤器网罗结构来过滤原始镶嵌,其具有两个标的:1) 代表用户的个性化偏好,以保证保举结果的准确性;2) 过滤后的镶嵌示意不会表现用户明锐特征联系的信息。

图1. 模子总体框架找色妹妹

给定原始镶嵌矩阵E和明锐特搜集X,过滤器结构包含K个子过滤网罗以吊销用户明锐特征信息,将用户节点和技俩节点从原始镶嵌空间E转机至过滤后空间 F = F ( G , E , X ) 。过滤网罗 F 包含K个子过滤器,也便是 F = [ F k ] k = 1 K ,每个子过滤器被熟习为过滤第k个明锐特征。过滤后的用户或技俩镶嵌示意如下:

f i = ∑ k = 1 K F k ( e i ) K (4)

其中, e i 示意原始镶嵌矩阵中的用户或技俩示意。

过滤后的镶嵌示意 f i 吊销了用户明锐特征信息,展望偏好得分 r ^ u v 此时不错被示意为:

r ^ u v = f u T × f v (5)

3.2. 公谈性建模

本文将充分愚弄用户–技俩双向图中的数据关系,结合用户自中心图结构眉目和节点眉目进行公谈性建模,将两个眉目的标的优化函数融入回击学习的耗费函数中。

3.2.1. 自中心图结构的公谈性

构建保举系统的根柢是用户之间的和谐性,用户之间通过用户–技俩双向图结构 G 中的技俩进行关联,是以本节从用户自中心图的角度对公谈性进行建模。关于用户u而言,经过滤后的用户镶嵌示意 f u 无法全面的表征该用户的局部图结构,因此本文将每个用户u成就为以自我为中心的图结构示意:

p u = P ( G u , F ) = M L P ( h u 1 , h u 2 , ⋯ , h u L ) (6)

这里使用基于深度神经网罗的步骤学习每个用户u以自我为中心的第 阶邻域表征 h u l ,因为多层感知机(MLP)大概靠拢任何通用复杂函数,是以使用了MLP春联图示意的通盘层进行非线性团员。其中 P 是用户局部图汇总的结构示意函数, G u 是用户自中心图结构。

其中,用户自中心网罗的 阶邻域在 l = 1 和 l ≥ 2 分别示意为:

h i 1 = ∑ j ∈ A i a i j f j ∑ j ∈ A i a i j (7)

h i l = ∑ j ∈ A i a i j h j l − 1 ∑ j ∈ A i a i j , ∀ l ≥ 2 (8)

在这里 a i j 示意权重矩阵 A (公式(1))的边权重, A i 是节点i的相邻节点集。上述公式算计每个节点的第 l 阶自中心图示意,关于l的取值会在第五节实验中严防分析。

在得到用户自中心的局部图结构示意 p u 后,通过回击熟习来确保每个用户的明锐特征不会被局部图结构袒露,本文将自中心图结构眉目的公谈性标的优化函数界说为:

L S = E ( u , v , r , x u ) ∑ k = 1 K x u k ln D k ( p u ) (9)

其中 D k 代表辨别器模块第k个辨别器网罗。

3.2.2. 节点眉目公谈性

平行于用户自中心图结构的示意,过滤明锐特征后向量节点眉目的公谈性示意亦然拦阻冷落的。节点眉目公谈性的标的是用户镶嵌示意中不会表现明锐特征,关于给定的明锐特征向量 x i ,类似于公式(9),将节点眉目的公谈性标的优化函数界说为:

L N = E ( u , v , r , x u ) ∑ k = 1 K x u k ln D k ( f u ) (10)

其中, f u 是过滤器模块输出的用户镶嵌示意。

公谈性要求 L G 的总标的优化函数不错示意为上述两层公谈性示意优化函数的加和,也便是 L G = L S + L N 。

3.3. 回击熟习

回击熟习的主要想想是同期熟习过滤器和辨别器。过滤器的主义是学习保举任务中的镶嵌示意并过滤明锐特征,辨别器的主义是展望用户明锐特征,弱化过滤器学习明锐特征的才气,二者进行极大极小博弈。具体来说,将过滤后的用户镶嵌示意 f u 看成辨别器的输入,第k个辨别器 D k 老成展望第k个明锐特征。因本文重心在建模图结构的公谈示意,是以这里的辨别器网罗将使用简便的MLP进行分类展望。回击熟习的经由不错模样为:

arg max F arg min D L ( F , D ) = L R − λ L G = E ( u , v , r , x u ) [ ln q R ( r | ( f u , f v ) − λ ln q D ( x | ( f u , p u ) ) ) ] (11)

L R = − ∑ u = 1 M ∑ v = 1 V ( r u v − r ^ u v ) 2 (12)

其中, L R 是保举任务的耗费函数, L G 是辨别器展望属性的耗费函数, r ^ u v 由公式(5)得出, λ 是回击统统,其限度着保举性能和公谈性能之间的权重。

4. 实验

在本节中,步骤先容了数据集、评价方针、基线模子和参数成就,然后对模子的性能进行实验决策,继而恢复了如下问题:

RQ1:本文建议的FRC是否灵验晋升了保举公谈性?

RQ2:本文建议的FRC应用于基线保举模子后的保举性能何如?

RQ3:用户自中心网罗的邻域阶数l的取值对模子性能的影响?

4.1. 数据集与采样计谋

4.1.1. 数据集

为了决策不同数据范围和稀少性对保举性能的影响,本文遴荐了电影保举数据集MovieLens和电子商务保举数据集CIKM。两个数据集的统计结果如表1所示。

MovieLens:该数据集包括6040名用户对随意4000部电影的100万次评级数据,遴荐性别、年纪和奇迹看成明锐特征,其中性别为二元特征,奇迹特征具有21个类别,年纪属性则按照用户的年纪范围等长分手为了13个类别。

CIKM:该数据集包含8.8万个技俩和6万个用户,210万个点击实例,录取了性别和年纪看成明锐特征。为了保证数据质地,过滤掉了少于20次交互的用户,以酿成更密集的数据集。

表1. 数据集的统计结果

4.1.2. 基于曝光的数据负采样

由上节的真确数据集统计信息可知,无数的技俩齐莫得与用户交互过,正样本和负样本技俩的数据量悬殊,这亦然保举系统中渊博存在的曝光偏差 [11] 。是以本文愚弄基于曝光度的负采样计谋来缓解技俩曝光偏差,晋升保举质地,保证公谈性。最初将技俩凭证交互次数分为高曝光组 V h i g h 和低曝光组 V l o w ,这里的交互次数为1000。由于立地遴荐的负样本会因为曝光偏差影响保举质地,是以从低曝光组对负样本进行采样:

j ~ r ^ S ( u , v ) , v ∈ V l o w (13)

4.2. 评估步骤

本文使用NDCG@N看成评估Top-N保举质地的评价方针,使用AUC看成保举公谈性的评估方针。

本文华纳了与之前学习公谈表征的责任实验成就类似的步骤 [2] [7] [8] ,熟习了一组结构与辨别器完满疏通的报复者。在回击熟习完成后,将过滤后的用户镶嵌高出相应的明锐特征输入给报复者,以熟习他们从过滤后的镶嵌中对明锐特征进行分类。为每个明锐特征齐熟习别称报复者。淌若报复者大概从用户镶嵌中准确区分出明锐特征,则以为明锐特征已表现到用户镶嵌中,从而判断保举模子不公谈。

因此试验公谈性的骨子为分类任务,算计每个报复者的AUC分数,炫夸报复者是否能正确对过滤后的用户镶嵌进行分类。AUC得分在范围[0.5, 1]内,越接近0.5越好。期许情况下,餍足公谈性要求的AUC得分约为0.5,标明报复者无法准确推测用户镶嵌中的明锐特征。公谈性的评估方针为AUC (Area Under the Curve),其界说如下:

AUC = ∑ ​ ( t i , n j ) t i > n j T * I (14)

其中T示意正样本数目,I示意负样本数目, t i 示意正样本展望分数, n j 示意负样本展望分数。

评价保举任务准确率的常用评价方针NDCG@N不错示意为:

NDCG @ n = 1 M ∑ i = 1 N 1 log 2 ( p i + 1 ) (15)

为了阐扬建议模子的合感性和灵验性,将FRC应用于基础保举模子PMF、DMF、BiasedMF和DeepModel,并对比公谈保举模子FairGAN。各基线模子的具体模样如下:

PMF [12] :一种浅层概率矩阵剖释模子,在协同过滤场景中应用等闲。

DMF [13] :一种深度矩阵剖释模子,其使用多层感知机将原始用户–技俩交互示意为低维向量空间。

BiasedMF [14] :一种矩阵剖释算法,将用户和物品的偏差加到展望的评分中以相宜数据中的偏差和个性化互异。

DeepModel [15] :该算法通过多层神经网罗进行非线性变换以学惯用户和技俩的复杂示意。

FairGAN [16] :一种基于GAN的保举模子,不错公谈地为每个技俩分派曝光,并尽可能高的保留用户服从。

4.3. 实验结果与分析(RQ1, RQ2)

表2和表3展示了在MovieLens和CIKM数据集上的实验结果,加粗数据为不同明锐特征中各基线模子中最佳的公谈性能。前4个基线模子为基础保举模子,FRC_PMF示意将本文建议的公谈保举模子FRC应用于PMF模子后的保举成果。

不雅察FRC与各基线模子的公谈性评价方针AUC分数得知:将FRC应用于基线模子PMF、DMF、BiasedMF和DeepModel后的AUC分数显着低于表中前4个纯基线模子的结果,这代表FRC相较于基础保举模子在公谈保举性能上有显贵的晋升。对比基线公谈性模子FairGAN,FRC的公谈性能仍略胜于FairGAN,也便是说在这两个数据集上,明锐特征着实不成能从过滤后的镶嵌示意中被展望出来,从而保证了公谈保举成果。

不雅察FRC与各基线模子的保举性能方针N@5分数可知:非论是对比基础保举模子PMF、DMF、BiasedMF和DMF,也曾公谈性基线模子FairGAN,FRC在应用于各模子后的仍不错达到较高的保举性能。一般而言,保证公谈性的同期会殉国部分保举性能 [2] ,因为过滤明锐特征会减少镶嵌示意的信息量。因此,组合明锐特征的保举性能略低于单个特征是不错意会的。本文建议的FRC模子在晋升公谈性的同期,仍能使保举性能接近原始算法,炫夸出其在均衡保举性能和公谈性方面的上风,也代表着愚弄图回击学习保证保举公谈的灵验性。

表2. 在MovieLens数据集上和基线模子的性能比拟。Age、Gen、Occ示意年纪、性别和奇迹,Com.示意明锐特征的组合。AUC为报复者分数,越接近0.5示意公谈性能越好。N@5示意NDCG@5

续表

表3. 在CIKM数据集上和基线模子的性能比拟

4.4. 参数分析(RQ3)

本节决策了以用户为中心的子图网罗邻域阶数l的取值对FRC模子性能的影响。表4展示了不同 的取值对模子性能的数据影响,图2为表4数据的直不雅折线图。不雅察图表数据可知,高阶图结构不错得到更好的公谈性结果和更高的保举准确性,但对高阶图进行建模也会使模子熟习愈加耗时。因 的取值大于3时用户的子图与其他用户存在较大的近似,故仅决策 l ≤ 3 的情况。其他的数据集、评价方针和基线模子的组合均不雅察到了类似的数据趋势,故这里仅展示了FRC_BiasedMF模子在MovieLens数据集上单个明锐特征的实验数据。

表4. 用户自中心网罗的邻域阶数l的取值对FRC的影响

5. 论断

现在,保举系统因数据偏差的影响而渊博存在公谈性问题。本文建议FRC模子通过构建用户–技俩

图2. 子图邻域阶数l关于模子性能的影响

双向图并愚弄图回击手艺学习公谈镶嵌,确保保举结果的公谈性,经真确数据集考据了该模子的灵验性,异日咱们将进一步探索FRC模子在教师和责任保举等规模的应用后劲。

基金技俩

国度当然科学基金技俩(61772342)资助。

著述援用

李昊洋. FRC:一种基于图镶嵌回击学习公谈示意的保举算法FRC: A Recommendation Algorithm Based on Graph Embedding Adversarial Learning for Fair Representation[J]. 建模与仿真, 2024, 13(03): 3515-3524. https://doi.org/10.12677/mos.2024.133320

麻豆 夏雨荷

参考文件找色妹妹






Powered by 村上里沙快播 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024