2020学术会议回顾:从这些最佳论文中一窥研究趋势( 五 )
论文链接:https://www.ijcai.org/Proceedings/2020/0336.pdf
摘要:解释有助于理解建议并增加采纳的可能性 , 然而有些解释性建议方法依赖于严格、标准化的模板 。 为了获取更加灵活、通俗、多样化的解释 , 覆盖interest各个方面 , 来自新加坡管理大学的研究者从评论中选择片段来进行综合解释 , 同时优化了其代表性和连贯性 。 为了适应目标用户的偏好 , 研究者基于一个兼容的可解释推荐模型 , 将观点与上下文相衔接 。 几个产品类别数据集上的实验表明 , 在模板、评论摘要、选择和文本生成这些方面 , 本文方法具备更高的效率 。
杰出论文2:AMulti-ObjectiveApproachtoMitigateNegativeSideEffects
论文链接:https://www.ijcai.org/Proceedings/2020/0050.pdf
摘要:非结构化环境内运行的智能体通常会产生设计时不容易识别的负面作用(NSE) 。 来自UMassAmherst和微软研究院的研究者分析了在系统部署过程中 , 如何利用各种形式的人类反馈或自主探索 , 来学习与NSE相关的惩罚函数 。 他们将降低NSE影响的问题描述为一个具备字典式奖励偏好与松弛多目标马尔科夫决策过程 。 松弛指的是相对于智能体的主要目标允许的最优策略的最大偏差 , 以减少次要目标NSE 。 多项实验评估表明 , 本文所提出的框架能够成功减少NSE的影响 , 不同的反馈机制会带来不同的偏差 , 从而影响NSE的识别 。
SIGIR2020
最佳论文:ControllingFairnessandBiasinDynamicLearning-to-Rank
论文链接:https://dl.acm.org/doi/pdf/10.1145/3397271.3401100
简介:排序算法是很多线上平台匹配用户与项目(如新闻、产品、音乐、视频等)的主要途径 。 在这类双边市场中 , 不仅用户可以从排序中获益 , 排序本身也决定了项目提供商(如出版商、卖家、艺术家等)的效益(如曝光度、收益等) 。 但人们已经注意到 , 仅针对用户的效益进行优化(几乎所有learning-to-rank算法都是这样做的)对于项目提供商而言是不公平的 。 因此 , 该研究提出一种新型learning-to-rank方法 , 可以显式地对成组项目(如同一个出版商发布的文章)提供merit-based公平性保障 。 具体而言 , 该研究提出了一种确保成组项目公平性的学习算法 , 它还可以同时基于隐式反馈数据学习排序函数 。 该算法以控制器的形式 , 集成公平性和效益的无偏估计器 , 在可用数据增多后可以对二者进行动态适应 。 该研究提供了严谨的理论基础和收敛保证 , 此外实验结果表明 , 该算法具备高度的实用性和稳健性 。
最佳论文荣誉提名奖:ModelsVersusSatisfaction:TowardsaBetterUnderstandingofEvaluationMetrics
论文链接:https://dl.acm.org/doi/pdf/10.1145/3397271.3401162
简介:
评估指标在信息检索系统批量评估中发挥重要作用 。 评估指标基于用来描述用户与排序列表交互过程的用户模型 , 旨在将多个文档的相关性分数与系统效果和用户满意度估计联系起来 。 因而 , 评估指标的有效性包括以下两个层面:
底层用户模型能否准确预测用户行为;评估指标能否很好地度量用户满意度 。目前已有大量工作涉及不同评估指标的设计、评估和对比 , 但很少有研究探讨评估指标这两个层面的一致性 。 具体而言 , 该研究想探讨与用户行为数据匹配良好的指标能否在估计用户满意度方面取得同样好的效果 。 为此 , 该研究对比了不同指标在已经优化可以拟合用户行为的情况下 , 在估计用户满意度方面的性能 。 该研究在自己收集的数据集和公开可用的用户搜索行为数据集上进行了实验 , 结果表明能够拟合用户行为的评估指标在估计用户满意度反馈方面也能实现同样好的性能 。 该研究还调查了评估指标校准过程的可信度 , 从而发现调参所需的数据量 。 该研究为用户行为建模和满意度度量之间的一致性提供了实验支持 , 同时也为评估指标的调参过程提供了指引 。
KDD2020
最佳论文:OnSampledMetricsforItemRecommendation
论文链接:http://walid.krichene.net/papers/KDD-sampled-metrics.pdf
简介:项目推荐(itemrecommendation)任务需要根据给定的条件对大型项目目录进行排序 。 项目推荐算法是使用依赖于相关项目位置的排名度量指标来评估的 。 为了加快度量指标的计算 , 近来的一些研究经常使用抽样的度量指标(sampledmetrics) , 仅对较小的一组随机项和相关项进行排序 。 Google研究小组对这些抽样指标进行了更详细的研究 , 结果表明它们与其exactversion不一致 。 也就是说 , 它们没有保持relativestatements 。
- 呷哺呷哺|呷哺呷哺业务遭市场暴击 2020年业绩料降94%
- 「涨知识」“共享员工”促就业,劳务派遣相关政策来回顾
- 创兴银行发布2020年度业绩报告,资产总额同比上升9.46%
- 城市更新一周回顾 | 全国首部“三旧”改造省级政府规章施行
- 4万级别纯电动微型车横评
- 2020年第四季DRAM总产值仅增1.1%
- 2020款传祺GS4 COUPE优惠明显,外观年轻,这样的内饰你喜欢吗?
- 汤臣倍健2020年业绩扭亏为盈至15.24亿 业务扩盘新三年规划开局
- 2020年畅销机型TOP10,看看你用的手机是否在其中
- 突破100万亿元!来之不易!
