全球科技公司利用增强语音系统开辟新市场

07/02/2020

凭借澳鹏(Appen)在语言、转录和语音识别系统领域的专业知识及在全球行业领先地位,该科技公司携手澳鹏(Appen)协助其成功开发ASR系统。

公司信息

一家领先的跨国科技公司与澳鹏(Appen)合作,帮助其开发一款专为儿童应用量身打造的自动语音识别 (ASR) 系统。


挑战

当您知道大多数语音识别系统都是为成年人设计的,您可能不会感到惊讶。迄今为止,儿童使用的语音驱动型应用很少考虑儿童语音的细微差别和特质,这使得这些应用无法成功地处理与儿童受众的互动。 这正是这家领先的跨国科技公司需要解决的问题。该公司发现,其语音识别系统最初是用成人语音数据训练的,他们没有考虑儿童说话方式的所有差异,这使得该系统无法在为儿童设计的应用中使用。 通常,儿童说话的音调更高,停顿时间和用词的变化更大——不规则、犹豫和发音错误(例如“嗯”、“呃”和“似的”而不是“是的”)。


解决方案

该公司通过开发一个新的北美英语自动语音识别系统来解决这一不足,该系统专为儿童应用重新设计。 因为澳鹏(Appen)在语言、转录和语音识别系统方面的专业知识在全球行业具有领先地位,这家科技公司邀请澳鹏(Appen)参与其产品的开发。客户团队首先要求澳鹏(Appen)为新项目提供咨询指导,并提供采集和转录各种人口群体优质的儿童语音数据。 ASR 的主要目的是用于教育科技应用。澳鹏(Appen)通过技能娴熟的语言学家团队提供咨询服务,为其开发脚本,满足目标教育相关的语音需求,这包括适当范围的数字、关键词、短语和教育短句等。 整体而言,该项目范围包括:

  • 招募并与 400 名儿童演讲者合作
  • 瞄准所需的人群:50% 的白人、40% 的非裔美国人、10% 的拉丁美洲人
  • 数据采集和转录。
  • 与母语为美式英语且有口音的人合作,他们的口音包括:东北部、中西部、南部和西部口音

一位使用该平台的用户表示:“我喜欢它的人性化风格,而且速度很快。相比打电话,我更喜欢使用虚拟助理,这样方便多了。” 另一位用户认为:“这是回答问题和帮助理解保险世界的一种新方法……这与任何其他公司截然不同。这是一种出色的体验!“ 在开展这类数据采集工作时,获得正确的数据至关重要:请尽可能接近真实客户在与系统交互时提出的问题。正因为此,澳鹏(Appen) 的客户经理与客户紧密合作,在项目开始和整个项目过程中创建了严格的规范,以确保最高的质量。 “客户的客户经理是我们的关键联系人,当你指定某个事物的时候,总会有模棱两可的地方,或者很难定义的方面,它们不是百分之百完整或正确的。 澳鹏(Appen)的伟大之处在于,一旦他们有了一批数据,他们就会来找我们,‘这是我们交付的第一批数据,它们能满足您的需求吗?’然后,我们一起微调这些数据,接着他们重复该流程,收集更多数据并带回给我们,直到我们得到想要的结果。” Jack Elliott 博士 FlamingoAI 首席数据科学家 FlamingoAI 公司首席执行官 Catriona Wallace 博士对此表示赞同。“和澳鹏(Appen)团队的合作很愉快,他们在开发我们的训练数据方面展现了丰富的专业知识,并在预算范围内提前交付了项目。通过与澳鹏(Appen)合作,我们确保了虚拟助理从项目伊始就能实现我们的价值主张——为客户提供更好的客户服务并加速销售。”


结果

通过与澳鹏(Appen)的合作,这家跨国科技公司得以在预期的时间和预算范围内,实现专门针对儿童语音开发 ASR 的目标。 澳鹏(Appen)成功地收集和转录了 105 个小时的音频,总计 6 万句话,帮助客户设计、构建和交付他们计划上市的 ASR。 该公司已经将声学模型植入新的 ASR 中,并将其应用到一系列专为儿童设计的北美英语教育娱乐平台和应用中。 澳鹏(Appen)为这个项目提供的其中一项主要建议是关注哪个年龄段。客户最初认为应该重点收集 4-9 岁儿童的数据,以最好地满足他们寓教于乐的需求。 然而,澳鹏(Appen)的语言学家建议,他们应该把重点放在 4-7 岁和 9-14 岁这两个年龄段,以及其他的人口结构需求上,从而确保最佳的覆盖范围;事实证明确实如此。 此外,澳鹏(Appen)还能够在相对较短的时间内为项目招募大量参与者。澳鹏(Appen)加入了一个包含学校和教会团体的“家庭和朋友”网络,以便招募有兴趣且很乐意让自己的孩子参与这个项目的家长。 这意味着,家长可以放心地接受澳鹏(Appen)出于数据采集目的非常规范地招聘未成年人的沟通过程,这有助于项目取得更成功、更无缝的最终结果。 为儿童录音,尤其是 4-9 岁的儿童,是一项非常具有挑战性的任务。澳鹏(Appen)展示了其在与儿童合作转录方面的经验,这有助于确保在预期的时间范围内更轻松地获得结果。 通过娴熟的与儿童自然语言领域的项目经验,结合使用图像与文本,以及长期录制简短且内容丰富的对话累积,澳鹏(Appen)确保了该全球科技客户成功交付产品。

澳鹏提供290+种语言方言的语音数据服务,包括清洗、切分、转写、标注等,为您的语音处理需求提供全面支持。