艾伦人工智能研究所(AI2)为学者提供更卓越的研究体验

10/13/2020

利用澳鹏Semantic Scholar(语义学术)平台(一个由AI驱动的学术搜索引擎),艾伦人工智能研究所通过众包提高其新颖的引文意图功能的质量

Ai2-logo-small-300x84-1.png

我们能够快速地与众包人员一起完成不同的标注任务迭代,了解哪些有效,哪些无效。事实上,澳鹏平台已内置质量控制功能,这使得任务设置更加容易。 – Madeleine van Zuylen, 艾伦人工智能研究所数据科学分析师

公司信息

艾伦人工智能研究所(AI2)由微软联合创始人保罗•艾伦(Paul Allen,已故)于2014年创立,是一家非盈利研究机构。AI2研究人员和工程师团队致力于有极大影响力的AI项目,造福大众。Semantic Scholar的使命是利用AI帮助学者们定位和理解正确的研究,建立重要的联系,克服信息过载难题,从而加快科学突破。


挑战

AI2 Citations Semantic Scholar推出引文意图功能,使研究人员能使用所引用作品的分类发现相关的学术论文。该功能在源论文的页面上为引用该源论文工作的后续文章显示背景信息、方法和结果的分类。这些分类让用户能理解一篇研究论文引用另一篇论文的原因,并使他们快速辨别一篇被引用的论文是否与他们的兴趣相关。 为了实现推出该功能所必需的精确标注,AI2需要大规模访问标注者。


解决方案

最初,在进入数据提取之前,AI2的Semantic Scholar团队与我们合作,一起为Semantic Scholar语料库添加内容。引文意图标注和抽象标注是两个用例,这两个关键功能使Semantic Scholar成为发现学术研究内容的领先AI平台。 使用澳鹏平台在研究论文中构建带标签的句子数据集,然后将这些句子输入机器学习模型,并训练它们准确地标注句子。在我们的帮助下,AI2得以快速地为标注人员设置任务,启动任务,并有效理解标注者在任务执行中的表现,从而根据需要进行快速调整。我们还能根据语言或其他相关的因素灵活地选择不同类型的众包为客户定制服务。引文意图功能现在已经覆盖超过1000万篇论文,并对超过1亿次引用进行了分类。


成果

我们很高兴能够在澳鹏平台上达到最初期望的质量标准,更好地训练我们新的引文意图分类模型。 – Sebastian Kohlmeier, 艾伦人工智能研究所业务发展部高级经理

由于我们平台的易用性,AI2现在可以快速运行任务,并通过整合报表接收实时反馈,大大节省了时间。此外,我们的平台准确度极高,引文意图任务超过80%,并且在多次任务迭代中还能有所提高。 最终,这些辛勤劳作加强了高质量学术研究内容的可访问性,对Semantic Scholar用户体验产生了积极影响。如今,全球每月有800万学者使用该网站,与引文意图和其他AI功能交互。 Semantic Scholar团队现在正与我们合作将其扩展到未来的应用场景中。我们与AI2合作,与全球各地的众包人员携手支持薪酬公平和薪酬透明准则,为此我们深感自豪。

澳鹏提供计算机视觉AI所需的全生命流程数据服务,包括数据采集、数据标注、数据集以及模型测试,为您部署更好的计算机视觉AI进行数据支持。