基于混合语言模型的文档相似性计算模型

李晓光; 于戈; 王大玲

首页> 中文期刊> 《中文信息学报》 >基于混合语言模型的文档相似性计算模型

基于混合语言模型的文档相似性计算模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了克服现有文档相似性模型对文档特性拟合的不完全性和缺乏理论根据的弱点,本文在统计语言模型的基础上,提出了一种基于混合语言模型(Mixture Language Model,MLM)文档相似性计算模型.MLM利用统计语言模型描述文档特征,将相关影响因素作为模型的潜在子模型,文档语言模型由各子模型混合构成,从而准确和全面地反映文档特征.由于MLM根据具体应用确定相关影响因素,并以此构建相应文档描述模型,因此具有很强的灵活性和扩展性.在MLM的基础上,本文给出了一个基于文档主题内容相似性的实例,在TREC9数据集上的实验表明MLM优于向量空间模型(VSM).

著录项

来源
《中文信息学报》 |2006年第4期|41-48|共8页
作者
李晓光; 于戈; 王大玲;
展开▼
作者单位

东北大学,信息科学与工程学院,辽宁,沈阳,110004;

东北大学,信息科学与工程学院,辽宁,沈阳,110004;

东北大学,信息科学与工程学院,辽宁,沈阳,110004;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.41;
关键词
人工智能; 自然语言处理; 文档相似性; 统计语言模型; 混合模型; EM算法;

相似文献

中文文献
外文文献
专利

1. 基于Web网页与PDF文档自动构建更新语言模型 [J] . 张强 ,陶宏才 . 成都信息工程学院学报 . 2009,第005期
2. 基于ICA-HMAX的视觉与语义相似性计算模型 [J] . 郑新想 ,段士雷 . 电脑知识与技术 . 2016,第008期
3. 基于FIFA的主题相似性计算模型 [J] . 朱靖波 ,陈文亮 . 东北大学学报（自然科学版） . 2003,第011期
4. 基于分级匹配的维吾尔语文档相似性计算及剽窃检测方法 [J] . 亚森·艾则孜 ,艾山·吾买尔 ,阿力木江·艾沙 . 计算机应用研究 . 2019,第006期
5. 基于编辑图的XML文档相似性研究 [J] . 徐沛娟 ,齐福慧 ,李卓 . 计算机工程与应用 . 2016,第002期
6. 基于双向路径约束模型的XML文档结构相似性度量 [C] . 廉鑫 ,林伟坚 ,张海威 . 第27届中国数据库学术会议 . 2010
7. 基于语言模型的正负相关反馈文档自动识别技术的研究与实现 [A] . 李长春 . 2013

基于混合语言模型的文档相似性计算模型

摘要

著录项

相似文献

相关主题

期刊订阅