什么是“人机协同”机器学习?

09/02/2020

“人机协同”(HITL)是人工智能的一个分支,它同时利用人类智能和机器智能来创建机器学习模型。在传统的“人机协同”方法中,人们会参与一个良性循环,在其中训练、调整和测试特定算法。通常,它的工作方式如下: 首先,对数据进行人工标注。这就为模型提供了高质量(和大量)的训练数据。机器学习算法学会根据这些数据做出决策。 接下来,对模型进行人工调整。这会有若干不同方式,但通常情况下,人们会对数据进行评分,以说明过度拟合的情况,教给分类器有关极端情况或模型权限范围内的新类别的信息。 最后,人们可通过对模型的输出进行评分来测试和验证模型,尤其是在算法对判断不自信或对错误决策过于自信的地方。 现在必须要注意的是,每个动作都包含一个连续的反馈循环。“人机协同”学习意味着将这些训练、调整和测试任务反馈到算法中,让算法变得更聪明、更可靠、更准确。当模型选择下一步需要学习什么(即主动学习),并将数据发送给人工标注人员进行训练时,这种方法尤其有效。 “人机协同”是我们澳鹏多年来一直倡导的一种方法。我们已经看到,这种方法有助于改进不同类别的模型,无论它们是文本分类器、计算机视觉算法还是搜索和信息检索模型,都不例外。我们能为您的独特使用场景创建大量高度精确的训练数据,然后根据人的见解调整您的模型,并进行测试,以确保其决策是准确和可操作的。如果您想了解更多信息,请随时与我们联系。


“人机协同”常见问题

如何结合人和机器来创造人工智能?

  • “人机协同”方法将最佳的人类智能与最佳的机器智能相结合。
  • 机器善于从庞大的数据集做出明智的决策,而人则更擅长用较少的信息做出决策。例如,人很擅长看着复杂的图像,然后挑出离散的实体:“这是一个灯柱”或“那是一只猫,但你只能看到它的尾巴。”这是机器在了解灯柱或猫的样子时所需的确切信息。事实上,一台机器需要从不同的角度、部分遮挡、不同的颜色等方面看到许多不同的灯柱和猫后,才能了解它们到底是什么样子。这些标记图像(即人类智能)的强大数据集能教会机器看到它们(即机器智能)。在某种程度上,有了足够的数据并做出充分的调整,机器算法就能快速而准确地看到和理解图像,而不需要人们不断地告诉它猫(或灯柱)到底是什么样子。

什么时候应该使用“人机协同”机器学习?

  • 训练时:如上所述,可以使用人力为模型训练提供标记数据。这可能是数据科学家使用人机协同方法最常见的情况。
  • 调整或测试:可以通过人工帮助调整模型,以获得更高的准确性。假设您的模型对一组特定决策没有信心,例如某个特定的图像实际上是一只猫。人工标注人员可以对这些决策进行评分,有效地告诉模型:“是的,这是一只猫”,或“不是,这是一个灯柱”,从而对其进行调整,以使将来的决策更加精确。

“人机协同”和主动学习之间的区别是什么?

  • 主动学习通常指的是人类处理低置信单元并将其反馈到模型中。“人机协同”范围更广,包括主动学习方法以及通过人工标记创建数据集。另外,人机协同”有时(尽管很少)指的是人们只是简单地验证输出(或决定输出无效),并不会将这些判断反馈给模型。

谁在使用“人机协同”机器学习?

  • “人机协同”可用于多种人工智能项目。这包括自然语言处理(NLP)、计算机视觉、情感分析、转录以及大量其他用例。人类智能在某种程度上插入“人机协同”,能够让任何深度学习的人工智能受益。

澳鹏为您的模型搭建及AI部署提供全生命周期的数据支持,包括数据采集、标注、模型测试以及数据集。