首页> 外国专利> Unsupervised topic modeling for short texts

Unsupervised topic modeling for short texts

机译:短文本的无监督主题建模

摘要

Topics are determined for short text messages using an unsupervised topic model. In a training corpus created from a number of short text messages, a vocabulary of words is identified, and for each word a distributed vector representation is obtained by processing windows of the corpus having a fixed length. The corpus is modeled as a Gaussian mixture model in which Gaussian components represent topics. To determine a topic of a sample short text message, a posterior distribution over the corpus topics is obtained using the Gaussian mixture model.
机译:使用无监督主题模型确定短信短信的主题。在从多个简短的短信中创建的训练语料库中,识别单词的词汇,并且对于每个字,通过处理具有固定长度的语料库的窗口来获得分布式矢量表示。语料库被建模为高斯混合模型,其中高斯组件代表主题。为了确定示例短文本消息的主题,使用高斯混合模型获得对语料库主题的后部分布。

著录项

  • 公开/公告号US11030401B2

    专利类型

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 AT&T INTELLECTUAL PROPERTY I L.P.;

    申请/专利号US201916268583

  • 发明设计人 VIVEK KUMAR RANGARAJAN SRIDHAR;

    申请日2019-02-06

  • 分类号G06F40/216;G06F40/30;G10L25/30;H04W4/14;

  • 国家 US

  • 入库时间 2022-08-24 19:05:24

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号