Dialpad创建数据,为大规模人类对话ML模型提供支持
他们的转录模型利用我们的平台进行音频转录和分类,以及验证其模型的内部转录和输出。
公司简介
Dialpad利用数据改善对话质量。他们收集电话音频,用内部语音识别模型转录这些对话,并使用自然语言处理算法理解每一次对话。他们利用这种一对一的对话来确定每个销售代表(以及整个公司)做得好和做得不好的地方,所有这些都是为了让每个电话都能成功。
挑战
每家公司各不相同。他们都有着各自的方言、目标市场以及与客户对话的目标。这意味着Dialpad的每位客户都需要一个独特、可靠的训练数据集,以使解决方案尽可能发挥作用,各训练数据集均会为模型提供信息,用于解释特定公司的对话。 创建这些独立的训练数据集是Dialpad产品的核心部分。 毕竟,这些训练数据集才是提高解决方案准确性的核心。Dialpad曾与澳鹏的一个竞争对手合作了六个月,但却难以达到使其模型取得成功的准确性阈值。简而言之,他们从对方得到的标签并不好。他们的准确率最高约为70%。 Dialpad需要改变,所以他们转而求助澳鹏。
解决方案
“人机协同”智能会话数据 由于Dialpad的解决方案建立在识别、转录和理解模型的基础上,因此这些模型的准确性非常重要。毕竟,几乎每位工程师都知道一句古话:“无用输入,无用输出。”更通俗地说,可以归结为:糟糕的标签意味着糟糕的训练数据,糟糕的训练数据意味着糟糕的模型。 Dialpad与澳鹏合作创建支持这些模型的数据。首先,他们通过平台为他们的转录模型提供动力,从音频进行转录,将音频分类为关键时刻和其他重要数据类别,以及验证其模型的内部转录和输出。他们甚至使用我们的地理定位工具确保由英国标注员标注来自英国的惯用语。
成效
Dialpad更换供应商后,仅仅数周时间,就初见成效,他们创建了所需的转录和自然语言处理(NLP)训练数据,使模型取得成功。
“我们将供应商改为澳鹏后,仅仅数周时间,我们就发现,标注者的准确率提高到88%,此后,即便模型千差万别,标注者的准确率也一直保持在接近80%或90%的高水平。这真是场巨大的胜利。” – Etienne Manderscheid, TalkIQ数据科学主管兼联合创始人(TalkIQ已被Dialpad收购)
TalkIQ已被DialPad收购,但他们将继续利用定制训练数据扩大业务规模。他们计划的目标是,为数百个客户企业标注训练数据集,除了他们已经擅长的关键时刻数据之外,还要生成和验证其他时刻的释义。我们的平台将能够与他们同步扩展,一路支持他们并保持准确性。
澳鹏提供290+种语言及方言的数据支持,以及大模型的全流程数据服务,为您的聊天机器人应用提供全方位支持。