您现在的位置：首页> 研究主题> 统计语言模型

统计语言模型

统计语言模型的相关文献在1993年到2020年内共计126篇，主要集中在自动化技术、计算机技术、无线电电子学、电信技术、科学、科学研究等领域，其中期刊论文103篇、会议论文14篇、专利文献172000篇；相关期刊65种，包括情报学报、电子学报、电子与信息学报等；相关会议12种，包括第十届全国人机语音通讯学术会议、第六届博士生学术年会、2008年全国模式识别学术会议等；统计语言模型的相关文献由240位作者贡献，包括袁里驰、何中市、钟义信等。

统计语言模型—发文量

期刊论文>

论文：103篇占比：0.06%

会议论文>

论文：14篇占比：0.01%

专利文献>

论文：172000篇占比：99.93%

总计：172117篇

统计语言模型—发文趋势图

统计语言模型
-研究学者

袁里驰
何中市
钟义信
方刚
黄永文
王作英
荀恩东
钱揖丽
陈浪舟
黄泰翼
于戈
吴文虎
大附克年
娜步青
宋柔
岳振军
张社民
徐志明
李晓光
梁修存
梅冈孝史
殷永光
潘金贵
王大玲
王晓龙
王海燕
王轩
田斌
田红心
董云耀
赵敏涯
赵甲
郑方
郭雷
钱如栏
颜永红
鹿晓亮
A·A·梅尼泽斯
A·奥厄
C·B·夸克
E·K·林格
R·C·穆尔
丁国栋
丁晓青
中村哲
从伟
代建英
伊.达瓦
伊森·R·巴福德
何一航

统计语言模型
-相关主题

统计语言模型
-相关期刊

统计语言模型
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2020
(1)
2019
(3)
2018
(4)
2017
(1)
2016
(7)
2015
(7)
2014
(1)
2013
(3)
2012
(5)
2011
(6)
2010
(10)
2009
(5)
2008
(7)
2007
(2)
2006
(7)
2005
(7)
2004
(2)
2003
(7)
2002
(2)
2001
(1)
2000
(5)
1999
(5)
1998
(1)
1997
(2)
1996
(1)
1993
(1)

期刊

收录数据库

作者

关键词

申请/权力人

;

1. 现代藏语信息熵的估算及语言模型的复杂度
- 完么扎西
- 摘要：本文将信息论的方法引入藏文信息处理技术研究领域,采用一种基于统计语言模型的信息熵估计方法,在300多万(音节)字的藏语单语语料规模上,对不同藏语语言模型估算了信息熵及其复杂度。
2. 基于统计语言模型改进的Word2Vec优化策略研究Word2Vec Optimization Strategy Based on an Improved Statistical Language Model 北大核心 CHSSCD CSCD CSTPCD
- 张克君；史泰猛；李伟男；钱榕
- 摘要：该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型.研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,而改进的语言模型通过文本关键词建立了词本身与整个文本之间的联系,在词向量训练结果的查准率和相似度方面,改进模型训练出的词向量较skip-gram、CBOW语言模型有一个小幅度的提升.通过基于维基百科1.5GB中文语料的词向量训练实验对比后发现,使用CBOW-T FIDF模型训练出的词向量在相似词测试任务中结果最佳;把改进的词向量应用到情感倾向性分析任务中,正向评价的精确率和F1值分别提高了4.79％、4.92％,因此基于统计语言模型改进的词向量,对于情感倾向性分析等以词向量为基础的应用研究工作有较为重要的实践意义.
3. Code-predicting Model Based on Method Constraints基于方法约束关系的代码预测模型北大核心 CSCD CSTPCD
- 方文渊；刘琰；朱玛
- 摘要：最新的研究表明,从大量源代码中提取代码特征,建立统计语言模型,对代码有着良好的预测能力.然而,现有的统计语言模型在建模时,往往采用代码中的文本信息作为特征词,对代码的语法结构信息利用不充分,预测准确率仍有提升空间.为提高代码预测性能,提出了方法的约束关系这一概念;在此基础上,研究Java对象的方法调用序列,抽象代码特征,构建统计语言模型来完成代码预测,并研究基于方法约束关系的代码预测模型在Java语言中的适用范围.实验表明,该方法较现有的模型提高了8％的准确率.
4. Research on Support Vector Machine in Text Categorization
5. 机器学习方法在文本分类中的应用
- 韩琪恒
- 摘要：文本分类在文本信息处理过程中有关键作用,能帮助人们提取有用信息,有效组织文本信息.本文主要介绍了文本分类的背景、国内外的研究现状以及利用机器学习方法解决文本分类问题的一般步骤.文章第二部分对中文分词、特征向量提取、分类器训练和评估原理做了重点介绍,包括了自然语言处理的统计语言模型,机器学习的KNN、SVM、神经网络算法.
6. 中文分词相关算法研究
- 吴熠潇
- 摘要：本文主要介绍了基于统计语言模型的中文分词方法。第一部分介绍了什么是中文分词以及中文分词的意义;第二部分介绍了中文分词的国内研究现状和当前的研究热点;第三部分是文章主要部分,介绍了统计语言模型,利用隐马尔可夫假设简化语言模型使得语言模型在计算上变得可能,以及如何利用简化的语言模型进行中文分词
7. 基于机器学习的文本分类
- 何一航
- 摘要：文本分类能帮助有效组织信息,快速区分信息质量,满足用户个性需求.本文主要介绍的内容有文本分类的背景、国内外的研究现状以及利用神经网络方法解决文本分类问题的一般步骤.文章第二部分对中文分词、特征向量提取、分类器训练和评估原理做了重点介绍,包括了自然语言处理的统计语言模型,机器学习的神经网络算法.
8. 深度学习方法训练词向量
- 安俊颖
- 摘要：词向量是词的一种特征表示,是很多自然语言处理任务的基础步骤.本文介绍了一种用深度学习训练词向量的方法,训练好的词向量具有维度低、保留语义相似性的特征.对某个特定语料库训练词向量,用统计语言模型进行中文分词,去掉停用词之后,构造词库;利用CBOW模型在词库上面训练得到词向量.本文介绍了深度学习在自然语言处理任务中的一个应用,具有一定的理论和实践意义.
9. 基于文献的地质实体关系抽取方法研究Study on geologic entity relation extraction method based on literature 北大核心 CSTPCD
- 吕鹏飞；王春宁；朱月琴
- 摘要：实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息.本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式.最后据此进行了关联关系发现和关系扩展发现实验.%Relation extraction is an important section of information extraction,which play an crucial role in valuable information discovering.On the ground of analyzing and comparing,including supervised methods,unsupervised methods,self-supervise methods and open information extraction methods,this essay has built a Geologic Entity Relation Extraction Model,using statistical language models for relation extraction and bootstrapping models for relation extension.Finally,according to the above analysis,the experiment of incidence relation discovery and relation extension discovery were carried out.
10. 基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计Protein expression vector optimization based on statistical language model and dynamic programming CSTPCD
- 方刚
- 摘要： In order to solve the problem of time consuming and error pronein selecting optimal "brick"to assemble functional protein expression vector,based on statistical language model (SLM),a dynamic program-ming algorithm of protein expression vector was carried out.By collecting the statistical parameters of BioBrick standard parts and transforming the assembling process into SLM,a dynamic programming algorithm could be performed to choose suitable parts to compose the final genetic construction.The result showed this method had high accuracy,redundant operations could be reduced and the time and cost required for conducting bio-logical experiment could be minimized.The method could be not only used to optimize a design in a synthetic biological robotic platform,but also independently used to automate the DNA assembly process in synthetic biology.It could also be iterated and then give out different optimized results for consideration.%针对合成生物学基因片段组装中选择最优“零件”组装功能性蛋白质表达载体费时且易出错的问题，提出一种基于引入统计语言模型（SLM）与动态规划算法的蛋白质表达载体设计方法。该方法通过统计合成生物学标准“零件”（BioBrick）的参数，将基础“零件”组装过程转化为 SLM，用动态规划算法找到最优路径，以实现蛋白质表达载体的设计。实验结果证明该方法准确率高，可以减少真实装配过程的冗余操作，节省时间和费用，可用来优化其他合成生物学软件设计结果，也可独立使用来模拟装配合成生物学基因片段产生蛋白质表达载体，还可被迭代从而给出不同的优化结果供选择。

1. 语言模型生成装置、语言模型生成方法以及记录介质
- 三菱电机株式会社
- 公开公告日期：2021.05.11
- 摘要：本发明的语言模型生成装置具有：替换语句生成部，其使用由多个句子构成的学习用的例文中包含的语句的各词素、和词素的原始表述的近义词，来生成由词素的原始表述与词素的原始表述的近义词的组合和各词素的原始表述的近义词彼此间的组合构成的多个替换语句；以及语言模型生成部，其根据生成的多个替换语句和学习用的例文生成作为N元模型的语言模型，因此，能够获得即使是学习用的例文中不存在的单词链也会减少语音识别的误识别的语言模型。
2. 基于统计学和预训练语言模型的多标签文本分类方法
- 电子科技大学
- 公开公告日期：2022.06.24
- 摘要：本发明公开了一种基于统计学和预训练语言模型的多标签文本分类方法，包括以下步骤：S1、对需要分类的训练语料进行预处理；S2、建立基于统计学方法和语言模型的标签获取模型；S3、对获取的标签数据进行处理；S4、建立基于预训练语言模型的多标签分类模型，利用得到的标签数据进行模型训练；S5、使用训练好的多标签文本分类模型，对待分类的文本数据进行多标签分类。本发明提出一种结合了统计学方法与预训练语言模型标签获取方法，使用ALBERT语言模型来获取文本的语义编码信息，不需要人工标注数据集，能够提高获取标签的准确度。
3. 预训练语言模型的训练方法、语言模型的训练方法及装置
- 阿里巴巴(中国)有限公司
- 公开公告日期：2022-07-15
- 摘要：本公开提供一种预训练语言模型的训练方法、语言模型的训练方法及装置，包括：获取样本文本，根据样本文本执行预训练任务中的至少两种，得到预训练语言模型，其中，预训练任务包括：前向因果语言建模任务、反向因果语言建模任务以及掩码语言建模任务，前向因果语言建模任务为由样本文本中在前的词预测样本文本中在后的词的建模任务，反向因果语言建模任务为由样本文本中在后的词预测样本文本中在前的词的建模任务，掩码语言建模任务为由样本文本中非掩码位置的词预测样本文本中掩码位置的词的建模任务，可以实现从多个维度进行预训练，从而实现训练的多样性和灵活性，且可以使得从多个维度训练得到的预训练语言模型具有较高的准确性和可靠性。
4. 语言模型的训练及分词预测方法和装置、语言模型
- 支付宝(杭州)信息技术有限公司
- 公开公告日期：2020-02-21
- 摘要：本说明书实施例提供一种语言模型的训练及分词预测方法和装置、语言模型，采用分词及其笔画集合来训练语言模型以及预测目标分词，由于提取出分词级以及笔画级的特征，特征粒度更小，因此，训练出的语言模型准确度较高，预测目标分词的准确性也越高。
5. 利用语言模型预测词出现概率及语言模型训练方法和装置
- 北京地平线机器人技术研发有限公司
- 公开公告日期：2020-10-16
- 摘要：公开了一种利用语言模型预测词出现概率的方法和装置、语言模型训练方法和装置、存储介质以及电子设备。其中的利用语言模型预测词出现概率的方法包括：通过语言模型的输入层获取待预测数据中的各词的词向量；通过所述语言模型中的每一隐层对本隐层的与所述词向量对应的输入向量进行扩张卷积以及非线性变换，得到本隐层的输出向量；通过所述语言模型的输出层对与该输出层相邻的隐层的输出向量进行预测，得到所述待预测数据中的各词在相应历史词后的出现概率。本公开提供的上述技术方案有利于提高语言模型的预测效率和训练效率，并有利于提高语言模型预测结果的准确性，且使语言模型能够利用较长长度的历史词对目标词进行出现概率预测。
6. 语言模型生成装置、语言模型生成方法及其程序、语音识别装置以及语音识别方法及其程序
- 三菱电机株式会社
- 公开公告日期：2018-06-08
- 摘要：本发明的语言模型生成装置具有：替换语句生成部，其使用由多个句子构成的学习用的例文中包含的语句的各词素、和词素的原始表述的近义词，来生成由词素的原始表述与词素的原始表述的近义词的组合和各词素的原始表述的近义词彼此间的组合构成的多个替换语句；以及语言模型生成部，其根据生成的多个替换语句和学习用的例文生成作为N元模型的语言模型，因此，能够获得即使是学习用的例文中不存在的单词链也会减少语音识别的误识别的语言模型。
7. 语言模型得分前瞻值赋值设备、语言模型得分前瞻值赋值方法和程序存储介质
- 日本电气株式会社
- 公开公告日期：2011-04-20
- 摘要：一种通过使用语言模型得分前瞻值来执行帧同步集束搜索的话音识别装置防止了正确答案假设的删减，同时抑制假设数目的增长。一种语言模型得分前瞻值赋值设备108被设置有定义词语音素串的词语词典203、赋值词语的出现容易度得分的语言模型202、以及平滑化语言模型得分前瞻值计算装置201。平滑化语言模型得分前瞻值计算装置201从由词语词典203定义的词语的音素串以及由语言模型202定义的语言模型得分获得词语中每个音素处的语言模型得分前瞻值，使得防止语言模型得分前瞻值集中在词语的开头。
8. 获得语言模型概率及构建语言模型的方法和装置
- 株式会社东芝
- 公开公告日期：2011-04-20
- 摘要：本发明提供一种为句子获得语言模型概率的方法和装置、构建语言模型的方法和装置以及基于语料库的机器翻译方法和系统。该为句子获得语言模型概率的方法，包括：通过对于句子中的各个单词，尝试将其与后面的单词组成通常被作为一个词使用的组合词，而确定与该句子的语言模型概率的计算有关的各个词及其概率；以及基于所确定的与该句子的语言模型概率的计算有关的各个词及其概率，获得该句子的语言模型概率。在本发明中，通过尝试将句子中的各个单词与其后面的单词组合，能够确保在语言模型概率的计算中复合词不被拆分，从而为句子获得准确的语言模型概率，准确地体现句子的质量。
9. 获得加权语言模型概率及构建加权语言模型的方法和装置
- 株式会社东芝
- 公开公告日期：2011-04-20
- 摘要：本发明提供一种为句子获得加权语言模型概率的方法和装置、构建加权语言模型的方法和装置以及基于语料库的机器翻译方法和系统。该为句子获得加权语言模型概率的方法，包括：对于句子中与语言模型概率的计算有关的各个单词组，利用该单词组的权重对该单词组的概率进行加权；以及根据上述与语言模型概率的计算有关的各个单词组的加权后的概率，为上述句子获得加权语言模型概率；其中，上述各个单词组的权重是根据句子的结构设定的、用于反映该单词组对于句子流利度的影响程度的权重。在本发明中，通过根据句子的结构，对句子中与语言模型概率的计算有关的各个单词组指派反映该单词组对于句子流利度的影响程度的权重，能够基于句子的结构更准确地体现句子的流利度。
10. 基于统计学和预训练语言模型的多标签文本分类方法
- 电子科技大学
- 公开公告日期：2021-01-12
- 摘要：本发明公开了一种基于统计学和预训练语言模型的多标签文本分类方法，包括以下步骤：S1、对需要分类的训练语料进行预处理；S2、建立基于统计学方法和语言模型的标签获取模型；S3、对获取的标签数据进行处理；S4、建立基于预训练语言模型的多标签分类模型，利用得到的标签数据进行模型训练；S5、使用训练好的多标签文本分类模型，对待分类的文本数据进行多标签分类。本发明提出一种结合了统计学方法与预训练语言模型标签获取方法，使用ALBERT语言模型来获取文本的语义编码信息，不需要人工标注数据集，能够提高获取标签的准确度。

统计语言模型

统计语言模型—发文量

统计语言模型—发文趋势图

统计语言模型-研究学者

统计语言模型-相关主题

统计语言模型-相关期刊

统计语言模型-相关会议

统计语言模型
-研究学者

统计语言模型
-相关主题

统计语言模型
-相关期刊

统计语言模型
-相关会议