首页> 外国专利> Unsupervised Topic Modeling For Short Texts

Unsupervised Topic Modeling For Short Texts

机译:短文本的无监督主题建模

摘要

Topics are determined for short text messages using an unsupervised topic model. In a training corpus created from a number of short text messages, a vocabulary of words is identified, and for each word a distributed vector representation is obtained by processing windows of the corpus having a fixed length. The corpus is modeled as a Gaussian mixture model in which Gaussian components represent topics. To determine a topic of a sample short text message, a posterior distribution over the corpus topics is obtained using the Gaussian mixture model.
机译:使用无监督主题模型为短文本消息确定主题。在由许多短文本消息创建的训练语料库中,识别单词的词汇,并且对于每个单词,通过处理具有固定长度的语料库的窗口来获得分布式矢量表示。语料库被建模为高斯混合模型,其中高斯成分代表主题。为了确定样本短消息的主题,使用高斯混合模型获得了语料库主题的后验分布。

著录项

  • 公开/公告号US2019179891A1

    专利类型

  • 公开/公告日2019-06-13

    原文格式PDF

  • 申请/专利权人 AT&T INTELLECTUAL PROPERTY I L.P.;

    申请/专利号US201916268583

  • 发明设计人 VIVEK KUMAR RANGARAJAN SRIDHAR;

    申请日2019-02-06

  • 分类号G06F17/27;H04W4/14;G10L25/30;

  • 国家 US

  • 入库时间 2022-08-21 12:11:36

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号