时间: 2025-03-10 10:12:48 来源: uqozkv.zhongpai168.com 作者: 休闲
在科研领域,生成首先审稿同行评审(review-rebuttal)是反驳保证学术质量的关键环节。这一过程中的洞察辩论和反驳非常具有挑战性。传统的心理同行评审生成任务通常集中在表面层面的推理。研究人员发现,再巧考虑论点背后的生成首先审稿态度根源和主题可以提高反驳的有效性。
今天介绍的反驳这篇研究将心理学理论与辩论技术相结合,为计算辩论领域带来了新的洞察视角。具体来说,心理文章主要做了以下工作:
Paper:Exploring Jiu-Jitsu Argumentation for Writing Peer Review Rebuttals
Link:https://arxiv.org/pdf/2311.03998.pdf
做一个专门面向年轻NLPer的每周在线论文分享平台
同行评审对于确保科学的高质量至关重要:作者提交研究成果,而审稿人则辩论应不应该接受其发表。通常评审后还会有一个反驳阶段。在这里,作者有机会通过反驳论点来说服审稿人提高他们的评估分数。
这篇文章探索了同行评审领域中态度根源的概念,即在审查科学论文的标准时,识别审稿人的潜在信仰和观点。
作者首先定义典型的rebuttal为:一种与潜在态度根源相一致并解决它们的反驳论点。它足够通用,可以作为模板用于许多相同(态度根源-主题)审稿元组的实例,同时表达特定的反驳行动。
根据这个定义,作者提出了态度根源和主题引导的反驳生成任务:给定一个同行评审论点rev和一个反驳行动a,任务是根据rev的态度根源和主题生成典型反驳c。
下图展示了如何通过一系列中间步骤,将审稿内容映射到标准的反驳上。这个审稿的主要观点是关于清晰度和整体性。
为了评估反驳生成任务,作者构建了JITSUPEER数据集。该数据集专注于同行评审过程中的态度根源和主题,通过连接这些元素与基于特定反驳行动的典型反驳,实现了一种态度和主题引导的反驳生成方法。
作为JITSUPEER的基础,研究团队采用了名为DISAPERE的数据集,该数据集包含了2019年和2020年ICLR会议的审稿和相应反驳。这些审稿和反驳被细致地分解成单个句子,并被三层注释标记,包括审稿方面和极性、审稿与反驳之间的链接,以及反驳行动的直接注释。特别地,研究团队关注于需要反驳的负面审稿句子,探索了审稿方面的使用,以此来体现社区共享的科学价值观。
此外,研究者还使用了另一数据集PEER-REVIEW-ANALYZE,该数据集是一个基准资源,包含2018年ICLR的审稿,同样配备了多层注释。这些注释包括了审稿句子所指目标论文的特定部分,如方法、问题陈述等,这些信息被视为态度主题的关键元素。这一研究提供了一个独特的视角,通过关注论文的特定部分,进一步丰富了对工作的潜在信仰和主题信息的理解。
在这项研究中,研究团队的目标是创建一个详尽的语料库,其中审稿句子不仅被标注为态度根源和主题,而且还与特定反驳行动的典型反驳句子相连接。为了实现这一目标,研究团队采用了一系列方法来丰富DISAPERE数据集。
主题预测
首先,他们使用了PEER-REVIEW-ANALYZE数据集来预测态度主题,即审稿句子中所涉及的论文部分。研究团队测试了不同的模型,包括通用模型和针对同行评审领域的专门模型,如BERT、RoBERTa和SciBERT。他们通过中间层的遮蔽语言模型(MLM)对这些模型进行了领域专门化处理,并在多个配置下进行了训练和优化。研究团队在变压器的顶部添加了sigmoid分类头,以进行微调,并对不同的学习率进行了网格搜索。他们基于验证性能采用早期停止策略,并在PEER-REVIEW-ANALYZE数据集上评估了模型的性能。结果显示,所有变压器模型的性能都显著优于基线模型,其中经过领域专门化处理的SciBERTds_neg模型表现最佳。
根源–主题集群描述
接下来,研究团队对每个态度根源–主题集群添加额外的自然语言描述,旨在提供比单纯标签元组更丰富的人类可解释性。他们通过比较自动和手动生成的摘要来完成这一步骤。
摘要生成:在自动摘要方面,研究团队采用了领域特定的SciBERTds_neg模型对句子进行嵌入,并根据余弦相似度选择最具代表性的审稿句子。
评估:研究团队通过展示摘要和相应的集群句子给注释者,让他们选择更好地描述集群的摘要。他们使用INCEpTION开发了注释界面,并雇用了额外的计算机科学博士生进行标注。通过测量注释者间的一致性,研究团队确保了摘要的质量和准确性。
确定典型反驳
研究团队为每个态度根源-主题集群确定典型的反驳,这是通过考虑特定的反驳行动来完成的。这一过程分为三个步骤:首先,减少候选典型反驳的数量;其次,手动比较缩减后候选集中的反驳句子对;最后,基于成对比较的分数计算排名,并选择排名最高的候选作为典型反驳。
候选集减少:为了缩减典型反驳的候选集,研究团队采用了两种适用性分类器得出的分数。首先是一个二元分类器,基于自行训练,用于预测一个反驳句子作为典型反驳的整体适用性。其次,考虑到典型反驳的原型性质,他们还使用了SPECIFICITELLER模型来获得特定性分数。该模型是一个预训练的基于特征的模型,用来评估句子是通用的还是具体的。通过这两个步骤,研究团队最终将候选集缩减至1,845个候选。
手动标注:在手动决定典型反驳方面,研究团队设计了一套方法:展示来自特定态度根源和主题集群的≤5个审稿句子,并将这些信息与特定的反驳行动配对。然后,他们随机选择两个反驳句子,这些句子与集群中的任一审稿句子相关,并对应于所选的反驳行动。标注者需要从这对反驳句子中选择更好的一个。对于每个(态度根源、态度主题、反驳行动)三元组的n个反驳句子,成对标注设置需要对n(n − 1)/2对句子进行评判。研究团队雇佣了两名计算机科学博士生进行这项任务。
典型反驳选择:研究团队基于收集的偏好通过注释图排名得出最佳反驳。具体来说,他们为每个根源-主题-行动集群创建了一个有向图,图中的节点是反驳句子。边的方向基于偏好:如果A优于B,则创建A → B的边。然后,他们使用PageRank算法对节点进行排名,每条边的权重为0.5。排名最低的节点,即很少或没有入边的节点,被选为典型反驳。这种方法不仅提高了数据集的质量和实用性,也为未来在类似领域的研究提供了一个有力的方法论参考。
研究团队提出了三项新颖的任务,以在其数据集上进行测试。分别是典型反驳评分,审稿意见生成,典型反驳生成。
这个任务的目标是给定一个自然语言描述d和一个反驳行动a,对所有反驳r(与特定态度根源-主题集群相关)进行评分,以表明r作为该集群的典型反驳的适用性。
这个任务被视为一个回归问题。只考虑有典型反驳的反驳行动和态度根源-主题集群的组合(50个态度根源-主题集群描述,3,986个反驳句子,其中302个是典型反驳)。使用之前的PageRank分数作为模型训练的预测目标。
结果
从下表可以看出,大多数领域专门化模型的表现优于它们的非专门化对应模型。
SciBERTds_all 在所有方面都有最高的皮尔逊相关系数,然而,BERTds_neg 在排名分数方面表现最佳。
使用其他与集群相关的信息,如代表性审稿句子,以及对描述进行释义,可能会带来进一步的收益,这将留待未来研究探究。
给定一条同行评审句子rev,任务是生成该句子所属集群的抽象描述d 。
实验设置
结果
给定一条审稿句子rev 和一个反驳a,任务是生成典型反驳c。
实验设置
结果
在这项工作中,研究团队探索了基于审稿者潜在态度驱动的同行评审中的柔术式论证,为此他们创建了JITSUPEER数据集。这个新颖的数据集包含与典型反驳相连的审稿句子,这些典型反驳可以作为撰写有效同行评审反驳的模板。团队在这个数据集上提出了不同的自然语言处理任务,并对多种基线策略进行了基准测试。JITSUPEER的注释将公开提供,研究团队相信这个数据集将成为促进计算论证领域中有效同行评审反驳写作研究的宝贵资源。
《用LLM生成反驳:首先洞察审稿人的心理,再巧妙回应!》男孩、女孩宝宝名字推荐
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
·德甲球员身价涨幅榜:帕夫洛维奇2000万欧居首
德甲球员身价涨幅榜:帕夫洛维奇2000万欧居首10月9日讯德国转会市场公布了新一期的德甲球员身价涨幅情况,帕夫洛维奇上涨2000万欧元最高。以下是具体排名:1、帕夫洛维奇拜仁,5000万欧元):+2000万欧元2、马尔穆什法兰克福,4000万欧元 ...
·中国青年报:中日两队战术层面均无任何压力,国足定好稳守基调
中国青年报:中日两队战术层面均无任何压力,国足定好稳守基调11月19日讯 今晚20点,18强赛第6轮,国足主场对阵日本队。《中国青年报》撰文谈到这场比赛时认为,双方在战术层面均无任何压力。中国青年报报道称,超过60名日本记者来到厦门报道比赛,据工作人员介绍, ...
·网络切片的整体架构由什么组成 工业路由器的网络切片怎么设置
网络切片的整体架构由什么组成 工业路由器的网络切片怎么设置网络切片Network Slicing)是一种新型的网络架构概念,旨在将一个物理网络划分为多个独立的逻辑网络切片,每个切片可以根据特定的需求和业务场景提供定制化的网络服务。每个网络切片都具有自己的网络 ...
·美芯晟业绩公告:营收增长7%,净利下滑42.46%,研发投入同比增长5%
美芯晟业绩公告:营收增长7%,净利下滑42.46%,研发投入同比增长5%2023年2月26日,美芯晟公布了去年业绩情况:全年营收为人民币47.2亿元,上涨7.06%;归属母公司的净利润为人民币3.0亿元,减少42.46%;扣除非经常性损益后的净利润仅为人民币625.87万 ...
·财运来厨卫电器 千万巨资 见证品牌辉煌
财运来厨卫电器 千万巨资 见证品牌辉煌惊雷见证了春的到来,枯河见证了夏的漫延,落叶见证了秋的飘然,白雪见证了冬的纯洁。2019年财运来厨卫电器斥资千万,联手500多家媒体网站,见证财运来用努力和勤奋让平凡的瞬间闪光!春华秋实十余载 砥砺奋 ...
·祝贺周口市微创医疗高新技术推广会于周口博爱医院顺利召开
祝贺周口市微创医疗高新技术推广会于周口博爱医院顺利召开祝贺周口市微创医疗高新技术推广会于周口博爱医院顺利召开发布时间:2017-10-01 17:20 来源:豫都网 我要投稿[摘要]据河南省郑大二附院曾公布一组数据,河南省不孕不育患者约有260多万,其中 ...
·12胜1平!西班牙2024年正式比赛全年保持不败,进28球失8球
12胜1平!西班牙2024年正式比赛全年保持不败,进28球失8球11月19日讯欧国联A4组第6轮,西班牙主场3-2绝杀瑞士。至此,西班牙2024年正式比赛全年保持不败,战绩为12胜1平,进28球失8球。西班牙2024年战果:欧国联:西班牙3-2瑞士欧国联:丹麦1- ...
·2024年智能手表发展趋势:AI与健康功能将迎来显著提升
2024年智能手表发展趋势:AI与健康功能将迎来显著提升近年来,科技飞速发展使得智能手表成为了生活中必不可少的健康助手。随着时间推移至2024年,国际市场智能手表的发展走势,从各大科技巨头如苹果、三星及谷歌的产品开发规划可见端倪。纵观智能手表领域,人工智能 ...
·北青:张玉宁作用突出占据主力,武磊大概率替补&胡荷韬可能换掉
北青:张玉宁作用突出占据主力,武磊大概率替补&胡荷韬可能换掉10月13日讯 北青体育今日撰文谈到了18强赛国足的情况,提到了目前国足备战印尼的相关信息,以及国足坐镇主场可能的排兵布阵。北青首先总结了国足的现状:按照计划,中国男足将于10月13日下午5点在青岛国 ...
·祝贺周口市微创医疗高新技术推广会于周口博爱医院顺利召开
祝贺周口市微创医疗高新技术推广会于周口博爱医院顺利召开祝贺周口市微创医疗高新技术推广会于周口博爱医院顺利召开发布时间:2017-10-01 17:20 来源:豫都网 我要投稿[摘要]据河南省郑大二附院曾公布一组数据,河南省不孕不育患者约有260多万,其中 ...
美芯晟业绩公告:营收增长7%,净利下滑42.46%,研发投入同比增长5%
维尼修斯国家队36场仅5球,ESPN分析:巴西缺少罗德里这样的中场
官方:斯图边锋弗里希内收肌撕裂,将缺战荷兰&已离开德国训练营