什么是“人机协同”机器学习？

09/02/2020

“人机协同”（HITL）是人工智能的一个分支，它同时利用人类智能和机器智能来创建机器学习模型。在传统的“人机协同”方法中，人们会参与一个良性循环，在其中训练、调整和测试特定算法。通常，它的工作方式如下：首先，对数据进行人工标注。这就为模型提供了高质量（和大量）的训练数据。机器学习算法学会根据这些数据做出决策。接下来，对模型进行人工调整。这会有若干不同方式，但通常情况下，人们会对数据进行评分，以说明过度拟合的情况，教给分类器有关极端情况或模型权限范围内的新类别的信息。最后，人们可通过对模型的输出进行评分来测试和验证模型，尤其是在算法对判断不自信或对错误决策过于自信的地方。现在必须要注意的是，每个动作都包含一个连续的反馈循环。“人机协同”学习意味着将这些训练、调整和测试任务反馈到算法中，让算法变得更聪明、更可靠、更准确。当模型选择下一步需要学习什么（即主动学习），并将数据发送给人工标注人员进行训练时，这种方法尤其有效。 “人机协同”是我们澳鹏多年来一直倡导的一种方法。我们已经看到，这种方法有助于改进不同类别的模型，无论它们是文本分类器、计算机视觉算法还是搜索和信息检索模型，都不例外。我们能为您的独特使用场景创建大量高度精确的训练数据，然后根据人的见解调整您的模型，并进行测试，以确保其决策是准确和可操作的。如果您想了解更多信息，请随时与我们联系。

“人机协同”常见问题

如何结合人和机器来创造人工智能？

“人机协同”方法将最佳的人类智能与最佳的机器智能相结合。
机器善于从庞大的数据集做出明智的决策，而人则更擅长用较少的信息做出决策。例如，人很擅长看着复杂的图像，然后挑出离散的实体：“这是一个灯柱”或“那是一只猫，但你只能看到它的尾巴。”这是机器在了解灯柱或猫的样子时所需的确切信息。事实上，一台机器需要从不同的角度、部分遮挡、不同的颜色等方面看到许多不同的灯柱和猫后，才能了解它们到底是什么样子。这些标记图像（即人类智能）的强大数据集能教会机器看到它们（即机器智能）。在某种程度上，有了足够的数据并做出充分的调整，机器算法就能快速而准确地看到和理解图像，而不需要人们不断地告诉它猫（或灯柱）到底是什么样子。

什么时候应该使用“人机协同”机器学习？

训练时：如上所述，可以使用人力为模型训练提供标记数据。这可能是数据科学家使用人机协同方法最常见的情况。

调整或测试：可以通过人工帮助调整模型，以获得更高的准确性。假设您的模型对一组特定决策没有信心，例如某个特定的图像实际上是一只猫。人工标注人员可以对这些决策进行评分，有效地告诉模型：“是的，这是一只猫”，或“不是，这是一个灯柱”，从而对其进行调整，以使将来的决策更加精确。

“人机协同”和主动学习之间的区别是什么？

主动学习通常指的是人类处理低置信单元并将其反馈到模型中。“人机协同”范围更广，包括主动学习方法以及通过人工标记创建数据集。另外，人机协同”有时（尽管很少）指的是人们只是简单地验证输出（或决定输出无效），并不会将这些判断反馈给模型。

谁在使用“人机协同”机器学习？

“人机协同”可用于多种人工智能项目。这包括自然语言处理（NLP）、计算机视觉、情感分析、转录以及大量其他用例。人类智能在某种程度上插入“人机协同”，能够让任何深度学习的人工智能受益。

澳鹏为您的模型搭建及AI部署提供全生命周期的数据支持，包括数据采集、标注、模型测试以及数据集。

联系我们