人工智能训练数据的2023新趋势预测

01/13/2023

我们生活在日新月异的社会中,总想了解社会万象,把握大事件的风向标。2023年开年之际,我们有幸邀请到几位澳鹏高管与思想领袖分享他们对AI和数据未来的预测。Sujatha Sagiraju、Erik Vogt和Jen Cole就2023年对行业影响最大的因素各抒己见。

他们的预测分为四大主题:

  • 生成式AI
  • 速度与规模
  • 合成数据
  • 汽车

生成式AI将改变我们的工作方式

生成式AI已经风靡全球,人们正在利用这项技术创作复杂的艺术品。这项技术也扩展到文本应用,人们几乎在短时间内就能写出文章。

澳鹏高级副总裁兼企业销售总经理Jen Cole重点谈到“生成式AI的易用性,及其将如何使非艺术家……在PowerPoint中融入原创艺术。”艺术需要技巧和训练才能掌握,这对许多人而言都是难能可贵的奢望。人们缺乏时间或天赋来创造想要的或需要的创意,而这也正是这种新型AI如此具吸引力的一项因素。另一项因素则是预算。正如Jen所言,为内部演示制作富有冲击力的创意文档可能成本高昂,而投资回报却很低。利用生成式AI快速填补业务演示中的空白,将为高管节省时间和资金。

速度和规模将推进业务发展

澳鹏专家认为,速度和规模将是2023年企业的主要关注点。Jen预测,“企业将优先考虑明显提升效率的AI计划”,而澳鹏首席产品官Sujatha Sagiraju认为,

“只要企业利用AI,高管们便会始终重点优先考虑以下二者之一:AI部署的速度和AI数据的质量。在过去,这两者并不互斥,从而导致企业在构建、扩展、部署和维护自身AI系统时出现诸多根本问题。然而,在未来,企业不应再发现自己处于牺牲速度换取质量的境地,反之亦然。”

速度和规模双管齐下,企业通过使用性能更强的机器学习模型更快地看到成果,从而从已完成项目中获得有效的成果。

为了避免速度和规模无法同时兼顾的问题,Sujatha预计:

“我们将看到,企业继续部署解决方案,帮助他们比以往更高效地获取高质量的数据和扩展AI系统。技术与人工监督相结合,帮助发现过程中需要改进的领域,将有助于兼顾速度和质量,并帮助企业在未来一年实现他们的AI飞跃性目标。

“如果不利用外部供应商,企业就会错失良机。外部供应商是强大的合作伙伴。企业往往试图自主创建和部署AI模型,但很快会发现,他们缺乏大量数据,因此企业会转向更便宜的数据来源,并最终得到低质量的数据。即使企业可以获得与模型相关的大量干净数据,处理大数据也耗时耗力,而且需要经验。

“这些企业应该做的是,寻找一家外部供应商为其提供高质量的数据,从而获得高性能的模型。外包有助于降低成本,缩短周转时间,并有助于提高自动化水平,专注于人机协同(HITL)实践等其他关键环节。2023年将出现明显转变——越来越多的企业寻求外包AI生命周期的数据,以帮助高效实现扩展。”

隐私和边缘案例将更加重要

企业解决方案副总裁Erik Vogt表示,“在处理真实世界的数据时,身份隐私的重要性将继续增加。”

随着相关法规的实施和隐私保护意识的不断提高,对于在数据采集和模型输出过程中保护人们的期望将会扩大。这包括数据的采集方式和采集内容,以及人们如何受到这些系统的影响。对系统性偏见关注的加强将推动对平台评估和性能监控解决方案的需求增加。

“保真度:LLM(大型语言模型)等通用模型将提供可靠的功能,因此采集数据以填补表现不佳的用例的需求将会增加,特别是对于发生频率较低的事件,数据需要切合实际,因此精心定位的数据或专门生成的合成数据的需求将越来越大。

“边缘案例:企业不断发明和试验创新和狭隘的AI用例,因此我们发现,采集非常罕见的数据集的请求越来越多。所有这些用例均将有助于解决特定的边缘用例问题,这些用例远远超出人们经常所能想到的AI用例。”

合成数据创建人工生成数据集,因此数据中自然不包含个人身份信息(PII)。合成数据还可以快速生成大量数据,因此可以在无需时间或安全限制的情况下生成边缘用例数据。在2022年预测中,我们预见了对合成数据的需求,并与Mindtech合作,为客户提供合成数据。

汽车司乘将更加依赖无缝的AI功能

虽然我们可能还没有达到自动驾驶飞行汽车的阶段,但Sujatha和Jen对汽车行业将如何在今年的基础上进一步发展做出一些预测。

Jen相信,人们对自动驾驶的信任感将继续提升。“如今,许多人抱怨自动驾驶辅助系统性能不佳,最终往往平添烦恼,但随着这项技术在新车型中的改善,变得更为有效,预计会有更多人开始喜欢并寻求使用自动驾驶辅助系统。”

Sujatha预测,在安全性和消费者整体体验方面将会有长足进步。

“未来一年,AI将在自动驾驶汽车的安全驾驶技术方面取得重大进展。欧盟于2022年6月推出汽车《通用安全法规》,法规强制要求将分心司机保护、车道保持辅助系统、自动紧急制动系统和行人碰撞预警系统等安全技术作为新车型的标配。欧盟预计,到2038年将挽救2.5万人的生命,避免14万人严重受伤。

“不过,自动驾驶汽车的创新并不仅限于安全性。随着汽车行业AI支出的增加,AI还有望改善车内的消费者体验。汽车制造商已经在使用AI创建车载语音辅助系统和特斯拉的Autopilot(自动辅助驾驶)等功能,借此用户能够从停车位向汽车发出指令。未来一年,我们会发现车内体验更为舒适,如自动调节座椅、自动防眩光保护和更加个性化的信息娱乐系统。”

期待了解这些预测的结果?请务必查看我们将于今年夏天发布的第9份年度《AI和机器学习全景报告》,了解行业趋势和这些预测的结果!

澳鹏为您的模型搭建及AI部署提供全生命周期的数据支持,包括数据采集、标注、模型测试以及数据集。