对话式人工智能(Conversational AI)：提高模型的智能程度和扩展能力

12/15/2020

对话式人工智能的趋势与挑战

对话式人工智能 (AI) 已经出现在许多家庭的客厅、汽车和在线购物体验中。聊天机器人、语音助手、智能扬声器、交互式语音识别系统：所有这些都是对话式 AI 的示例。由于该领域通过增强的客户体验提供了更多可访问性，因此吸引了大量投资。

最简单来说，对话式 AI 就是人与机器之间的交互。它识别语音和文本、意图以及各种语言，以模仿自然语言，或人类对话。对话式 AI 解决方案可以完成人类经常做的重复性任务，从而节省金钱和时间，并使人类腾出时间从事更高层次的战略性工作。

对话式 AI 作为机器学习 (ML) 空间中增长最快的领域之一，并非没有挑战。但是，有了智能工作流规划和战略基础架构，它可以成为利润最丰厚的企业投资领域之一。

值得关注的对话式人工智能趋势

对话式 AI 领域出现的主要趋势和变化有：

越来越多地采用数字化助手

数字化助手的使用率一直在稳步增长，年同比增长率高达 34％。数字化助手包括智能扬声器、智能家居应用程序和其他技术驱动型语音命令（例如 Amazon Alexa 或 Google Assistant）。预测表明，在未来两年内，三分之一的美国人口将使用语音助手。

AI 助力车内体验

理想情况下，驾驶员在驾驶车辆时需要将双手置于方向盘上，从而使语音成为行驶状态下安全执行任务的合理解决方案。汽车制造商已经在使用语音助手功能来增强车内体验；在某些车型中，您可以问“北京的天气怎么样？”，然后马上得到准确的回答。

汽车制造商还增加了人脸识别功能来进一步了解驾驶员及其需求，以提供理想的驾驶体验。

客户服务集成 AI

未来几年内，希望改善客户体验的企业会将 AI 作为主流投资。Gartner 调查显示，未来几年内，有 47％的组织将使用聊天机器人，而 40％的组织将部署虚拟助手。采取这种措施在一定程度上是为了节约成本，但同时也是为了响应客户日益增长的个性化和即时解决问题的需求。使用虚拟助手还可以帮助企业快速扩张，因为与人工语音服务相比，聊天机器人成本更低，响应速度更快。

对话式人工智能的挑战

对话式 AI 面临的许多挑战也是整个 AI 开发领域的挑战。偏见和多样性是最大的挑战，必须正视并加以解决。这些因素的重要作用体现在用于训练模型的数据中。特别是，用于训练语音助手的数据必须具有深度和广度，以涵盖不同的方言、口音和语言，因为世界各地的人们讲话方式是千差万别的。

训练数据不足时，失败几率大大增加。例如，最近对流行的自动语音识别技术进行的一项研究发现，对非洲裔美国人语音的识别错误率大大高于对白人语音的识别。如果在训练数据中提高非洲裔美国人语音的代表性，这些技术及其服务对象都会受益。如果在这些项目的早期阶段就解决了代表性问题，则差异可能不会那么严重，并且对客户体验的影响也会减少。

任何时候涉及数据时，数据的隐私和安全也应是首要考虑因素。在构建 AI 之前，企业应创建数据治理策略以保护敏感数据，并确保数据来源是合乎道德的。

开始 AI 之旅之前要考虑的另一点是生产规模和机器学习数据流。数据流的构建和自动化使企业即使在部署后仍可以继续调整和培训模型，因为模型将不断遇到边缘案例以及新的用户和场景。引入人机协同是监视模型性能并提供真实精度的理想方法。

战胜这些挑战并非易事，需要持续的主动性。通过预先提出有关道德规范和数据的正确的问题，对话式 AI 领域的企业将更有可能满足跨不同地域、文化和语言的客户的需求。

建立用于对话式人工智能的工作流

构建清晰的项目工作流是模型构建流程的第一步。在设计对话式 AI 工作流时，请记住，训练数据准备阶段是正确完成工作的最重要的组成部分。该步骤包括数据采集、数据标注、使用该数据训练模型并分析输出。在 AI 项目上花费的绝大部分时间会投入训练数据准备阶段，因此，企业需要适当的工具和流程，才能在这个关键阶段取得成功。

通常，对话式 AI 在与人进行的一次交互中将执行以下一系列事件：

语音到文本的转换：AI 将客户语音的原始音频文件转换为文本。
自然语言理解 (NLU)：AI 分析并处理文本，以创建可操作的指令。
内容相关性：AI 返回可以帮助客户的最佳信息。

可以以车载虚拟助手为例来说明构建对话式 AI 模型的工作流方案。训练数据准备工作流可能类似于以下步骤：

第 1 步: 收集包含客户命令的音频数据，并纳入质检步骤以确保数据的质量和准确性。对低质量数据进行返工。
第 2 步: 分割音频片段，以检测片段中的语音、背景噪音和音乐部分。
第 3 步: 转录音频片段，将其转换为文本。
第 4 步: 标注并标记文本，以辨别意图并理解自然语言。将不同类别的标签分配给句子中的每个词。
第 5 步: 根据这些数据类型训练您的模型，以便模型能够理解语音命令的主体、背景及其意图。

为了处理该工作流所需的大量标注工作并最大限度地提高模型的多样性，大多数公司将雇用来自不同地区和使用不同语言的众包人员。

如何与数据合作伙伴共同协作

上面的示例是一个简单的工作流或者数据工作流。随着模型复杂程度的增加，这些步骤可能会变得越来越复杂。无论如何，您都希望寻找一个支持各种使用场景的数据平台，并找到一个能够帮助您对模型构建、部署和其他步骤中所使用的工作流进行自动化的合作伙伴。这样一来，您就能够迅速扩大规模并进行模型迁移。只有注重质量和可扩展性，并构建正确的流程、基础架构和工具集，企业才有望在对话式 AI 以及整个 AI 领域取得成功。了解更多澳鹏如何提供帮助。

澳鹏提供290+种语言及方言的数据支持，以及大模型的全流程数据服务，为您的聊天机器人应用提供全方位支持。

联系我们