因果关系估计引入中选系统提升中选模型效果,研究WWW22接收
来源:内饰 2025年05月19日 12:18
数学公式 2:因果关系视角下的引荐片中都
因为 confounder(B)的不存在,T 到 Y 中都间有两条方向上,深蓝色的线回应受到 confounder 严重影响的非推论,紫色的回应Gmail和日常用品中都间冗余持续性的推论。因果关系和非因果关系的以外反应时会的是 user-item pair(T)和Gmail应答(Y)中都间的相同亲密关系。由于 confounder 的种类是多种多样的,很多时候它们也是一同起因的,数数通过引荐软件系统里的体能训练数学公式是都能有效识别单单非推论的。
因此,科学家相信:
现阶段侦查引荐为首的软件系统与新方法并没有从深层次发掘和并用侦查蓄意与引荐软件系统中都间的推论; 现阶段引荐软件系统普遍没有考虑到体能训练每一次中都诱发的各种 bias,多种 bias 组合而成的 confounder 时会严重影响软件系统的体能训练。因此,他们提单单了一个因果关系修习软件系统,尤其应用于物件codice_(instrumental variable)新方法并用侦查数学公式常规引荐软件系统。首必先 T 被溶解为 causal 和 non-causal 的以外,再将这两个以外备注征沦为新的 T,作为引荐软件系统的读写。
二、新方法介绍
针对这些再一,科学家提单单了一种基于因果关系推定中都物件codice_新方法、尤其应用于侦查数学公式常规引荐软件系统的软件系统 – IV4REC(Instrumental Variables for Recommendation)。该新方法尤其应用于Gmail的侦查 query 作为物件codice_(IVs),来溶解和备注征引荐管理系统中都的 embedding。
具体来说,该新方法主要分为三个以外:A. 基底 treatment (T)和 Instrumental Variables (IVs),B. 备注征 treatment,C. 将备注征的 treatment 尤其应用到引荐软件系统
初步知识:物件codice_
物件codice_是一种用来预估推论的新方法,在时会计学、流行病学等科技领域取得了尤其的尤其应用,是 2021 年诺贝尔时会计学奖颁给的主要助益之一。
下绘出为物件codice_的尤其应用片中都,绘出 3 为所有codice_中都间的推论。科学家一切都是洞察 T 和 Y 中都间的推论,但是其受到 confounder U 的严重影响,而物件codice_ Z 是一个和 U 牵涉到,但和 T 有关,并数通过 T 严重影响 Y 的codice_。
数学公式 3:所有codice_间的推论
绘出 4 为物件codice_尤其应用的每一次:必先用 Z 紧接著 T 取得
,再用
紧接著 Y,
紧接著 Y 取得的亲密关系就可以相信是 T 和 Y 中都间的推论。
数学公式 4:物件codice_默许后的推论
A. 基底 treatment
对于引荐片中都来说,科学家相信交互数学公式中都的 use-item pair 是 treatment。对于核苷酸引荐来说,user embedding 是通过 user 的其他用户历史记录的到的,所以 user 可以看成是其他用户历史记录中都所有 item embedding 的集合。所以 use-item pair 可以看成一个 item embedding 的集合,其中都元素为候选日常用品以及Gmail其他用户历史记录中都的所有日常用品。
对于侦查引擎的副本数学公式来说,一般存储设备的是 user-query-item-click 这种四元组。对于每一个必须的 item,通过侦查副本数学公式免职其他用户过它的 query。每一个 item 免职 n 个其他用户过它的 query 作为其物件codice_,具体新方法为:通过 BERT 等预体能训练软件系统将 query 的注释文档再生为内积,将 n 个 query 的 embedding 堆好像沦为一个乘法,该乘法即是对应 item embedding 的物件codice_(IVs)。对于每一个 user 的其他用户历史记录中都的 item 基底 IVs,这些乘法构成了 user 的 IVs。
B. Treatment 备注征
首必先透过 treatment 溶解。尤其应用于 IVs 的用以是通过 IVs 分立单单来 treatment 和 outcome 中都间的推论。科学家用 IVs(Z)紧接著 treatment(T)取得
,根据 IVs 的分析新方法,
和 Y 中都间的亲密关系均是由了 T 和 Y 中都间的推论。并且,他们用 T -
取得残差
,并相信
和 Y 中都间均是由了 T 和 Y 中都间的非推论。习惯的因果关系引荐尤其应用中都,主要用以是洞察推论而不是计算准再次的 Y,所以上会时会反之亦然移除残差
。
但是,科学家谈论的更为多是进一步提高引荐软件系统的计算准确性,所以在下一步即使如此并用残差来进一步提高引荐耐用性。
数学公式 5:treatment 备注征
Treatment 揉合。科学家尤其应用于加权割地的手段揉合两以外 treatment,2 个厚度机器修习(MLP)被分别用来修习
和
的权重,两个网络结构相同,读写均为
和
的 concatenation。
C. 将备注征的 treatment 尤其应用到引荐软件系统
数学公式 6:IV4Rec 的核心
许多核苷酸引荐软件系统(DIN、DIEN、NRHUB、BST 等等)都包涵上绘出左侧的结构,我们将其称之为 Underlying model。Underlying model 将 item 用内积回应,并用Gmail的历史记录蓄意来修习Gmail的回应,并基于吸取的Gmail和日常用品的回应来计算Gmail对于日常用品的同样高分。
科学家提单单的 IV4Rec 软件系统可以尤其应用在所有符合 underlying model 结构的软件系统上,只必须简便地在 item embedding layer 后转为 treatment reconstruction module。备注征的Gmail回应是通过其其他用户历史记录中都的日常用品的备注征内积取得的,再并用备注征单单的Gmail和候选日常用品内积,便可以取得更为加精确的计算值。
三、科学研究结果
为了证明提单单的 IV4Rec 软件系统的持续性,科学家在新闻引荐引起争议数学公式集 MIND 和更为快挥较长预告片数学公式集上透过了科学研究。选用准确性当前 AUC,以及两个排名当前 MRR 和 NDCG 透过评估,MRR 和 NDCG 的一段距离分别设置为 5 和 10。
科学家将 IV4Rec 软件系统尤其应用在了两个引荐软件系统 DIN 和 NRHUB 上(记为 IV4Rec-DIN, IV4Rec-NRHUB),并且和一个为首最佳化侦查和引荐的软件系统 JSR 透过了相当(记为 JSR-DIN,JSR-NRHUB)。
从下备注 1 可以看单单,与不转为 IV4Rec 的 underlying model 相当,在所有当前上,本文提单单的 IV4Rec 软件系统具有不俗的耐用性进一步提高。另外,IV4Rec 对于 underlying model 的耐用性进一步提高相当可观 JSR 这个为首最佳化侦查和引荐的软件系统。这些结果都验证了 IV4Rec 的持续性。
在更为快挥较长预告片数学公式集上,NRHUB 本身就并用了侦查蓄意作为Gmail特性,科学家对于 DIN 也额外转为了一个Gmail蓄意的塔来并用侦查蓄意特性,因此在该数学公式集的科学研究中都,IV4Rec 的确在在因果关系推定的角度看进一步提高了软件系统的缺点,而不是因为转为侦查特性取得的进一步提高。
备注 1. 主体科学研究结果
为了进一步洞察所提单单的新方法并用残差的缺点,科学家在更为快挥较长预告片数学公式集上试图了相同版本的 IV4Rec 软件系统,结果如下绘出 2 所示。
相同的版本计有:只尤其应用于因果关系的以外
;只尤其应用于残差
;不用 reconstruction module,反之亦然尤其应用于必先前的 treatment;尤其应用于备注征的 treatment 通过 concatenate
和残差
;尤其应用于 IV4Rec 中都手段备注征的 treatment。可以发现当两个以外被为首到一同的时候,AUC 进一步提高了很多。这种现象同时起因在 NRHUB 和 DIN 上,这概述残差也可以进一步提高Gmail同样的计算,因为残差即使如此和再次的 Y 有很强的相关亲密关系。当用以是做单单准确的计算而不是分析推论时,
和
是互补的两个以外。
绘出 2:相同的 treatment reconstruction 手段的严重影响。
插图绘出源:
。眼睛干涩的原因和解决方法视疲劳用什么眼药水
丰胸药
经常拉稀
妊娠期高血糖的辅助治疗药物有哪些
-
数字时氪微信群活动 | 建筑业数字化转型——万亿的产品的建筑业缩短产业链条进行时
人口全额递减、管理制度全过程粗放、必需原材料基本概念迫切、文化产业参差不齐、缺乏适当的数据资料资产等使建筑群金融业持续面临收入低、必需性高的发展问题。而“摄像迈进”渐渐成为一条引导建筑群业做到合