首页> 外国专利> Conversational agent pipeline trained on synthetic data

Conversational agent pipeline trained on synthetic data

机译:对会话代理管道进行综合数据训练

摘要

In one embodiment synthetic training data items are generated, each comprising a) a textual representation of a synthetic sentence and b) one or more transcodes of the synthetic sentence comprising one or more actions and one or more entities associated with the one or more actions. For each synthetic training data item, the textual representation of the synthetic sentence is converted into a sequence of phonemes that represent the synthetic sentence. A first machine learning model is then trained as a transcoder that determines transcodes comprising actions and associated entities from sequences of phonemes, wherein the training is performed using a first training dataset comprising the plurality of synthetic training data items that comprise a) sequences phonemes that represent synthetic sentences and b) transcodes of the synthetic sentences. The transcoder may be used in a conversational agent.
机译:在一个实施例中,生成综合训练数据项,每个综合训练数据项包括:a)合成句子的文本表示,以及b)合成句子的一个或多个转码,包括一个或多个动作以及与该一个或多个动作相关联的一个或多个实体。对于每个综合训练数据项,将综合句子的文本表示形式转换为代表综合句子的音素序列。然后将第一机器学习模型训练为代码转换器,该代码转换器从音素序列中确定包括动作和相关实体的代码转换,其中,使用包括多个合成训练数据项的第一训练数据集执行训练,该合成训练数据项包括a)代表以下内容的序列音素合成句子和b)合成句子的转码。该代码转换器可用于会话代理中。

著录项

  • 公开/公告号US10210861B1

    专利类型

  • 公开/公告日2019-02-19

    原文格式PDF

  • 申请/专利权人 APPRENTE INC.;

    申请/专利号US201816146924

  • 申请日2018-09-28

  • 分类号G06F17/28;G06N99;G10L15/02;G10L15/06;G10L15/16;G10L15/18;G10L15/193;

  • 国家 US

  • 入库时间 2022-08-21 12:12:13

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号