您现在的位置: 首页> 研究主题> 统计语言模型

统计语言模型

统计语言模型的相关文献在1993年到2020年内共计126篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、科学、科学研究 等领域,其中期刊论文103篇、会议论文14篇、专利文献172000篇;相关期刊65种,包括情报学报、电子学报、电子与信息学报等; 相关会议12种,包括第十届全国人机语音通讯学术会议、第六届博士生学术年会、2008年全国模式识别学术会议等;统计语言模型的相关文献由240位作者贡献,包括袁里驰、何中市、钟义信等。

统计语言模型—发文量

期刊论文>

论文:103 占比:0.06%

会议论文>

论文:14 占比:0.01%

专利文献>

论文:172000 占比:99.93%

总计:172117篇

统计语言模型—发文趋势图

统计语言模型

-研究学者

  • 袁里驰
  • 何中市
  • 钟义信
  • 方刚
  • 黄永文
  • 王作英
  • 荀恩东
  • 钱揖丽
  • 陈浪舟
  • 黄泰翼
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 完么扎西
    • 摘要: 本文将信息论的方法引入藏文信息处理技术研究领域,采用一种基于统计语言模型的信息熵估计方法,在300多万(音节)字的藏语单语语料规模上,对不同藏语语言模型估算了信息熵及其复杂度。
    • 张克君; 史泰猛; 李伟男; 钱榕
    • 摘要: 该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型.研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,而改进的语言模型通过文本关键词建立了词本身与整个文本之间的联系,在词向量训练结果的查准率和相似度方面,改进模型训练出的词向量较skip-gram、CBOW语言模型有一个小幅度的提升.通过基于维基百科1.5GB中文语料的词向量训练实验对比后发现,使用CBOW-T FIDF模型训练出的词向量在相似词测试任务中结果最佳;把改进的词向量应用到情感倾向性分析任务中,正向评价的精确率和F1值分别提高了4.79% 、4.92%,因此基于统计语言模型改进的词向量,对于情感倾向性分析等以词向量为基础的应用研究工作有较为重要的实践意义.
    • 方文渊; 刘琰; 朱玛
    • 摘要: 最新的研究表明,从大量源代码中提取代码特征,建立统计语言模型,对代码有着良好的预测能力.然而,现有的统计语言模型在建模时,往往采用代码中的文本信息作为特征词,对代码的语法结构信息利用不充分,预测准确率仍有提升空间.为提高代码预测性能,提出了方法的约束关系这一概念;在此基础上,研究Java对象的方法调用序列,抽象代码特征,构建统计语言模型来完成代码预测,并研究基于方法约束关系的代码预测模型在Java语言中的适用范围.实验表明,该方法较现有的模型提高了8% 的准确率.
    • 韩琪恒
    • 摘要: 文本分类在文本信息处理过程中有关键作用,能帮助人们提取有用信息,有效组织文本信息.本文主要介绍了文本分类的背景、国内外的研究现状以及利用机器学习方法解决文本分类问题的一般步骤.文章第二部分对中文分词、特征向量提取、分类器训练和评估原理做了重点介绍,包括了自然语言处理的统计语言模型,机器学习的KNN、SVM、神经网络算法.
    • 吴熠潇
    • 摘要: 本文主要介绍了基于统计语言模型的中文分词方法。第一部分介绍了什么是中文分词以及中文分词的意义;第二部分介绍了中文分词的国内研究现状和当前的研究热点;第三部分是文章主要部分,介绍了统计语言模型,利用隐马尔可夫假设简化语言模型使得语言模型在计算上变得可能,以及如何利用简化的语言模型进行中文分词
    • 何一航
    • 摘要: 文本分类能帮助有效组织信息,快速区分信息质量,满足用户个性需求.本文主要介绍的内容有文本分类的背景、国内外的研究现状以及利用神经网络方法解决文本分类问题的一般步骤.文章第二部分对中文分词、特征向量提取、分类器训练和评估原理做了重点介绍,包括了自然语言处理的统计语言模型,机器学习的神经网络算法.
    • 安俊颖
    • 摘要: 词向量是词的一种特征表示,是很多自然语言处理任务的基础步骤.本文介绍了一种用深度学习训练词向量的方法,训练好的词向量具有维度低、保留语义相似性的特征.对某个特定语料库训练词向量,用统计语言模型进行中文分词,去掉停用词之后,构造词库;利用CBOW模型在词库上面训练得到词向量.本文介绍了深度学习在自然语言处理任务中的一个应用,具有一定的理论和实践意义.
    • 吕鹏飞; 王春宁; 朱月琴
    • 摘要: 实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息.本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式.最后据此进行了关联关系发现和关系扩展发现实验.%Relation extraction is an important section of information extraction,which play an crucial role in valuable information discovering.On the ground of analyzing and comparing,including supervised methods,unsupervised methods,self-supervise methods and open information extraction methods,this essay has built a Geologic Entity Relation Extraction Model,using statistical language models for relation extraction and bootstrapping models for relation extension.Finally,according to the above analysis,the experiment of incidence relation discovery and relation extension discovery were carried out.
    • 方刚
    • 摘要: In order to solve the problem of time consuming and error pronein selecting optimal "brick"to assemble functional protein expression vector,based on statistical language model (SLM),a dynamic program-ming algorithm of protein expression vector was carried out.By collecting the statistical parameters of BioBrick standard parts and transforming the assembling process into SLM,a dynamic programming algorithm could be performed to choose suitable parts to compose the final genetic construction.The result showed this method had high accuracy,redundant operations could be reduced and the time and cost required for conducting bio-logical experiment could be minimized.The method could be not only used to optimize a design in a synthetic biological robotic platform,but also independently used to automate the DNA assembly process in synthetic biology.It could also be iterated and then give out different optimized results for consideration.%针对合成生物学基因片段组装中选择最优“零件”组装功能性蛋白质表达载体费时且易出错的问题,提出一种基于引入统计语言模型(SLM)与动态规划算法的蛋白质表达载体设计方法。该方法通过统计合成生物学标准“零件”(BioBrick)的参数,将基础“零件”组装过程转化为 SLM,用动态规划算法找到最优路径,以实现蛋白质表达载体的设计。实验结果证明该方法准确率高,可以减少真实装配过程的冗余操作,节省时间和费用,可用来优化其他合成生物学软件设计结果,也可独立使用来模拟装配合成生物学基因片段产生蛋白质表达载体,还可被迭代从而给出不同的优化结果供选择。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号