您现在的位置：首页> 研究主题> 词义消歧

词义消歧

词义消歧的相关文献在1998年到2022年内共计266篇，主要集中在自动化技术、计算机技术、语言学、汉语等领域，其中期刊论文177篇、会议论文26篇、专利文献28761篇；相关期刊94种，包括情报学报、哈尔滨理工大学学报、黑龙江科技信息等；相关会议19种，包括中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015）、第四届全国智能信息处理学术会议、第六届全国青年计算语言学会议等；词义消歧的相关文献由463位作者贡献，包括鹿文鹏、张春祥、高雪瑶等。

词义消歧—发文量

期刊论文>

论文：177篇占比：0.61%

会议论文>

论文：26篇占比：0.09%

专利文献>

论文：28761篇占比：99.30%

总计：28964篇

词义消歧—发文趋势图

词义消歧
-研究学者

鹿文鹏
张春祥
高雪瑶
卢志茂
张仰森
李生
何婷婷
吴云芳
刘挺
姬东鸿
孟凡擎
赵铁军
全昌勤
成金勇
王瑞琴
金澎
陈小荷
俞士汶
刘睿
刘鹏远
孔繁胜
张维玉
李国佳
杜月寒
杨陟卓
王惠
范冬梅
荀恩东
车超
郭鸿奇
闫蓉
陈浩
乔新晓
仇化平
刘辉
吕晓伟
周俏丽
孟禹光
寇广增
张剑
曲维光
李纲
熊经钊
谢芳
赵凌云
陈家骏
丁江伟
于东
刘宇鹏
刘建毅

词义消歧
-相关主题

词义消歧
-相关期刊

词义消歧
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(19)
2021
(12)
2020
(10)
2019
(8)
2018
(10)
2017
(7)
2016
(8)
2015
(14)
2014
(8)
2013
(6)
2012
(8)
2011
(6)
2010
(20)
2009
(11)
2008
(12)
2007
(9)
2006
(10)
2005
(13)
2004
(2)
2003
(3)
2002
(2)
2001
(2)
1999
(1)
1998
(1)

期刊

收录数据库

作者

鹿文鹏
(21)
张春祥
(17)
高雪瑶
(14)
卢志茂
(13)
张仰森
(9)
李生
(9)
何婷婷
(8)
吴云芳
(8)
刘挺
(7)
姬东鸿
(7)
孟凡擎
(7)
赵铁军
(6)
全昌勤
(5)
成金勇
(5)
王瑞琴
(5)
金澎
(5)
陈小荷
(5)
俞士汶
(4)
刘睿
(4)
刘鹏远
(4)
孔繁胜
(4)
张维玉
(4)
李国佳
(4)
杜月寒
(4)
杨陟卓
(4)
王惠
(4)
范冬梅
(4)
荀恩东
(4)
车超
(4)
郭鸿奇
(4)
闫蓉
(4)
陈浩
(4)
乔新晓
(3)
仇化平
(3)
刘辉
(3)
吕晓伟
(3)
周俏丽
(3)
孟禹光
(3)
寇广增
(3)
张剑
(3)
曲维光
(3)
李纲
(3)
熊经钊
(3)
谢芳
(3)
赵凌云
(3)
陈家骏
(3)
丁江伟
(2)
于东
(2)
刘宇鹏
(2)
刘建毅
(2)

关键词

申请/权力人

;

1. 半监督卷积神经网络的词义消歧
- 张春祥；唐利波；高雪瑶
- 摘要：为了解决有标签语料获取困难的问题,提出了一种半监督学习的卷积神经网络(convolutional neural networks,CNN)汉语词义消歧方法.首先,提取歧义词左右各2个词汇单元的词形、词性和语义类作为消歧特征,利用词向量工具将消歧特征向量化;然后,对有标签语料进行预处理,获取初始化聚类中心和阈值,同时,使用有标签语料对卷积神经网络消歧模型进行训练,利用优化后的卷积神经网络对无标签语料进行语义分类,选取满足阈值条件的高置信度语料添加到训练语料之中,不断重复上述过程,直到训练语料不再扩大为止;最后,使用SemEval-2007:Task#5作为有标签语料,使用哈尔滨工业大学无标注语料作为无标签语料进行实验.实验结果表明:所提出方法使CNN的消歧准确率提高了3.1%.
2. 古汉语词义标注语料库的构建及应用研究
- 舒蕾；郭懿鸾；王慧萍；张学涛；胡韧奋
- 摘要：古汉语以单音节词为主,其一词多义现象十分突出,这为现代人理解古文含义带来了一定的挑战。为了更好地实现古汉语词义的分析和判别,该研究基于传统辞书和语料库反映的语言事实,设计了针对古汉语多义词的词义划分原则,并对常用古汉语单音节词进行词义级别的知识整理,据此对包含多义词的语料开展词义标注。现有的语料库包含3.87万条标注数据,规模超过117.6万字,丰富了古代汉语领域的语言资源。实验显示,基于该语料库和BERT语言模型,词义判别算法准确率达到80%左右。进一步地,该文以词义历时演变分析和义族归纳为案例,初步探索了语料库与词义消歧技术在语言本体研究和词典编撰等领域的应用。
3. 基于多粒度双向注意力机制的词义消歧深度学习方法
- 初钰凤；张俊；赵丽华
- 摘要：词义消歧的目标是在特定的上下文中识别歧义词的正确词义。传统的监督方法主要是利用上下文的数据,而忽略了丰富的词义定义等词汇资源。最近的研究发现将词义定义整合到神经网络对于词义消歧具有显著的改进效果。提出引入词义定义的基于多粒度双向注意力机制的词义消歧模型,该模型采用字符级、词级和上下文嵌入的表示,使用双向注意力机制获取上下文和词义定义之间的交互关系,消融实验验证了模型中每个组成的重要性。实验结果表明,这种建模方式可以有效地识别歧义词的正确词义,在SemEval-13-task#12和SemEval-15-task#13公开数据集上进行了测试,F1值分别可达到68.9%和73.1%。
4. 基于多节点组合特征和模糊聚类的中文词义消歧方法
- 贺佳；杜建强；聂斌；熊旺平；雷银香；罗计根；曾青霞
- 摘要：词义消歧是自然语言处理中的难点问题,为提高消歧效果,提出一种基于多节点组合特征的词义消歧方法.根据依存语法理论,选择歧义词的祖父+父亲+孩子节点组合,并将其作为消歧特征.利用模糊C均值聚类算法,建立消歧模型,最终确定歧义词词义类别.采用哈工大信息检索研究中心语言技术平台的词义语料进行实验.实验结果表明,相比现有的两种方法,该方法不仅使特征维度平均值分别降低了5和25,且F1值分别提高了1.56个百分点和0.84个百分点,在一定程度上提升了词义消歧效果.
5. 第二十届中国计算语言学大会征稿启事
- 本刊
- 摘要： 2021年第二十届中国计算语言学大会(CCL 2021)将于2021年8月13-15日在呼和浩特市举行。本次会议由内蒙古大学承办,会议主题为:语言处理的认知建模和心理语言学;面向自然语言处理的机器学习;语言资源和标注;词汇语义学和词汇本体论;中文分词、词性标注和词义消歧;组块分析、句法分析和语义分析;篇章、共指和语用学;机器翻译和多语言信息处理;资源稀缺的自然语言处理;社交媒体中的自然语言处理;医学自然语言处理;自然语言处理应用等。被录用的中文稿件将被推荐至《中文信息学报》、《清华大学学报》(自然科学版)、《中国科学》及其他计算机类中国科技核心期刊(中国科学技术信息研究所制订)。大会同时接受中文和英文投稿,需统一使用LaTeX模板。提交的论文最多包含10页正文,参考文献页数不限。
6. 基于改进胶囊网络的文本细粒度情感分类方法
- 江涛；李清霞；李启明
- 摘要：针对当前文本细粒度情感分类方法仅通过浅层卷积获取文本情感特征,导致多种文本细粒度情感分类效果差,具有歧义的文本细粒度情感分类精度低的问题,提出基于改进胶囊网络的文本细粒度情感分类方法.使用信息增益最大原则,优化文本特征集,引入文本特征词语位置信息,优化贝叶斯模型词语分辨性能,消除文本歧义.基于改进稠密胶囊网络模型,建立自注意力特征模型,提取文本细粒度情感特征,使用局部约束动态路由算法,选取与变换矩阵共享局部范围胶囊路由,实现文本细粒度情感分类.实验结果表明,所提方法的查准率、召回率以及F1值较高,多种文本细粒度情感分类效果较好,能够有效提高具有歧义的文本细粒度情感分类精度.
7. 融合k均值聚类与LSTM网络的半监督词义消歧
- 张春祥；周雪松；高雪瑶；刘欢
- 摘要：一词多义是自然语言所固有的特性。词义消歧是根据上下文来确定歧义词汇的含义,是自然语言处理领域中的一项关键技术。目前,词义消歧被广泛地应用于机器翻译、信息检索和文本分类之中。为了提高词义消歧的准确率,提出了一种结合k均值聚类与长短期记忆网络的半监督词义消歧方法。以歧义词汇为中心,选取左右两个邻接词汇单元,形成大小为4的词窗。从词窗中选取词形和语义类作为聚类特征,利用k均值聚类方法对无标注语料进行聚类。将聚类得到的语料加入SemEval-2007:Task#5的训练语料中,以扩充训练语料的规模。从词窗中选取词形、词性、语义类、英文译文和消歧距离作为消歧特征,使用长短期记忆网络来确定歧义词汇的语义类别。利用扩充后的训练语料来优化长短期记忆网络的参数。使用SemEval-2007:Task#5的测试语料对词义消歧分类器进行测试。通过实验分析了隐藏层数和训练语料规模对词义消歧的影响。实验结果表明:相对于贝叶斯分类器和深度信念网络而言,所提出的方法能够提高词义消歧的准确率。
8. A Method of Word Sense Disambiguation with Recurrent Netural Networks 北大核心 CSTPCD
9. 融合语言知识的神经网络中文词义消歧模型北大核心 CSTPCD
- 穆玲玲；程晓煜；昝红英；韩英杰
- 摘要：提出一种融合语言知识的神经网络中文词义消歧模型,在双向长短时记忆网络中使用目标词的释义和例句信息进行消歧.该模型在SemEval-2007中英文词义消歧数据集上的实验结果表明,融合语言知识后,词义消歧的宏平均准确率和微平均准确率分别比基线模型提高了2.31％和1.93％,说明在神经网络模型中融合语言知识有助于改善中文词义消歧的效果.
10. 基于半监督集成学习的词义消歧北大核心 CSCD CSTPCD
- 张春祥；熊经钊；高雪瑶
- 摘要：为了解决自然语言中的一词多义问题,本文提出了半监督集成的词义消歧方法.以歧义词左右4个邻接词汇单元的词形、词性和语义类作为消歧特征,利用逻辑回归模型、梯度提升决策树和支持向量机来确定其含义.采用软投票策略融合3个基本分类器获得集成词义消歧模型.以少量人工语义标注语料为基础,结合大量无标注语料,使用半监督学习方法来提高集成词义消歧模型的性能.使用SemEval-2007: Task#5的测试语料来度量词义消歧的性能.实验结果表明:所提出方法的平均准确率达到了72. 80%,词义消歧的性能有所提升.本文提出方法能够降低人工标注语料的规模,提高词义消歧准确率.

1. 词义消歧方法和设备、词义扩展方法、装置和设备、计算机可读存储介质
- 株式会社NTT都科摩
- 公开公告日期：2020-06-16
- 摘要：一种基于上位词的词义消歧方法和设备、利用该词义消歧方法的词义扩展方法和设备、以及计算机可读存储介质。该词义消歧方法包括：接收输入语句(S101)；基于预定歧义词库，确定所述输入语句中的消歧目标词(S102)；基于对所述输入语句的句法分析以及上下文信息分析，确定所述目标词的相关词(S103)；确定所述相关词的一个或多个上位词(S104)；以及基于所述相关词以及所述一个或多个上位词的词形，词性及与目标词的句法关系，确定所述目标词在所述输入语句中的词义(S105)。
2. 词义消歧方法和设备、词义扩展方法和装置
- 株式会社NTT都科摩
- 公开公告日期：2019-05-07
- 摘要：本发明涉及一种基于上位词的词义消歧方法和设备，以及利用该词义消歧方法的词义扩展方法和设备。该词义消歧方法包括：接收输入语句；基于预定歧义词库，确定所述输入语句中的消歧目标词；基于对所述输入语句的句法分析以及上下文信息分析，确定所述目标词的相关词；确定所述相关词的一个或多个上位词；以及基于所述相关词以及所述一个或多个上位词的词形，词性及与目标词的句法关系，确定所述目标词在所述输入语句中的词义。
3. 一种基于图卷积神经网络融合支持向量机的中文词义消歧方法
- 哈尔滨理工大学
- 公开公告日期：2022-03-15
- 摘要：本发明涉及一种基于图卷积神经网络(Graph Convolution Network，GCN)融合支持向量机(Support Vector Machine，SVM)的中文词义消歧方法。本发明首先预处理语料。对训练和测试语料的语句进行分词、词性标注和语义标注处理。以歧义词所在的句子以及歧义词两侧词汇单元的词形、词性和语义类作为消歧特征，消歧特征作为节点来构建词义消歧图。使用Word2Vec、Doc2Vec工具、逐点互信息(PMI)、TF‑IDF算法对图中节点和边的权值进行计算。训练语料训练GCN模型，将模型优化。利用优化后的GCN模型计算训练和测试语料的消歧特征，再将训练语料计算后的消歧特征输入SVM分类器中，优化SVM分类器，再对测试语料进行分类，得到歧义词汇在语义类别下分类情况。本发明具有较好的词义消歧效果，准确的判断歧义词汇的真实含义。
4. 一种基于图注意力神经网络的生物医学英文词义消歧方法
- 哈尔滨理工大学
- 公开公告日期：2022-03-15
- 摘要：本发明涉及一种基于图注意力神经网络(Graph Attention Network，GAT)的生物医学英文词义消歧方法。本发明首先对生物医学英文语料进行预处理。该步骤对训练语料和测试语料包含歧义词汇的语句进行词性标注和语义标注处理。以歧义词汇所在的句子，以及句中所包含的词形、词性和语义作为消歧特征，将消歧特征作为节点来构建词义消歧特征图，利用训练语料训练GAT模型，将模型进行优化。利用优化后的GAT模型，对测试语料进行词义消歧，可得到歧义词汇在各个语义类别下的概率分布。将概率最大值对应的语义类判别为歧义词汇的语义类。本发明具有较好的词义消歧效果，更准确的判断歧义词汇的真实含义。
5. 一种基于知识图谱词义消歧的书评文本分类方法
- 重庆邮电大学
- 公开公告日期：2022-02-18
- 摘要：本发明涉及一种基于知识图谱词义消歧的书评文本分类方法，属于自然语言处理技术领域。该方法包括：S1：获取书评文本数据集；S2：将文本进行分段处理；S3：对分段后的文本进行聚类并标签化，每个文本片段对应各自的外部知识实体；S4：词级文本预处理；S5：计算词级文本间的语义相似度、余弦相似度、目标函数以及得分；S6：提取文本片段的特征；S7：利用层次注意力网络提取各文本片段的特征信息，再对文本片段的特征信息进行一次层次注意力网路的文本处理，最终得到的特征信息经归一化处理完成文本分类。本发明能有效处理篇章级别的长文本数据。
6. 模型生成方法、词义消歧方法、装置、介质以及设备
- 北京有竹居网络技术有限公司
- 公开公告日期：2022-09-06
- 摘要：本公开涉及一种模型生成方法、词义消歧方法、装置、介质以及设备，所述模型生成方法包括：获取多组平行语料，每组所述平行语料包括互为翻译的第一文本和第二文本，所述第一文本属于第一语言，所述第二文本属于第二语言；根据多组所述平行语料和预设释义集合，确定多个第一样本，每个所述第一样本包括所述第一文本、所述第一文本中的第一原始词以及该第一原始词的翻译词在所述预设释义集合中匹配的第一释义，所述翻译词是所述第二文本中与所述第一原始词匹配的词语，所述第一释义属于所述第二语言；根据多个所述第一样本生成第一分类模型。本公开可以减少生成第一分类模型的数据依赖。
7. 一种基于提示学习的中文词义消歧方法
- 重庆邮电大学
- 公开公告日期：2022-09-02
- 摘要：本发明涉及一种基于提示学习的中文词义消歧方法，属于计算机技术领域。基于BERT的大多数方法都采用使用BERT迁就下游任务的形式，首先将预训练模型应用到下游任务上，然后再通过微调预训练语言模型提升性能。但随着预训练语言模型体量不断地增大，对其微调的硬件要求和实际代价也在变得更艰难。中文的BERT是基于字的，大多数基于BERT的词义消歧模型在预训练MLM模型任务中只能以字为单位去添加MASK标记，词是取得字的平均，对词的表达不够准确。本发明主要解决中文词义消歧模型存在的消歧效率低、监督分类时需要大量数据标注以及未充分利用BERT的自身能力等问题。
8. 多头自注意力门控空洞卷积神经网络的汉语词义消歧
- 哈尔滨理工大学
- 公开公告日期：2022-08-16
- 摘要：本发明涉及一种多头自注意力门控空洞卷积神经网络的词义消歧方法。本发明对SemEval‑2007:Task#5的训练语料和测试语料进行分词、词性标注、语义类标注、依存句法分析和语义依存分析，选取歧义词汇左右四个邻接词汇单元的词形、词性和语义类以及歧义词的句法依存关系和语义依存关系作为消歧特征。利用Word2Vec对从训练语料和测试语料中抽取的消歧特征进行向量化处理，得到训练数据和测试数据。使用训练数据来优化词义消歧模型。利用优化后的词义消歧模型计算测试数据中的歧义词汇在每个语义类别下的权重，具有最大权重的语义类别即为歧义词汇的语义类别。本发明能更准确地判断歧义词汇的真实含义。
9. 卷积块注意力模块嵌入Regnety网络的词义消歧
- 哈尔滨理工大学
- 公开公告日期：2022-09-13
- 摘要：本发明涉及一种卷积块注意力模块(Convolutional Block Attention Module，CBAM)嵌入Regnety网络的词义消歧方法。本发明对SemEval‑2007:Task#5的训练语料和测试语料进行分词、词性标注、拼音首字母标注、声调标注和语义类标注。选取歧义词左右具有名词、动词、形容词、数词、量词和代词词性的邻接词汇单元的词形、词性、语义类、拼音首字母和声调作为消歧特征。利用Word2Vec工具对消歧特征进行向量化处理，得到训练数据和测试数据；将CBAM嵌入Regnety之中，获得词义消歧模型CBAMRegnety。利用训练数据对CBAMRegnety进行训练，得到优化后的CBAMRegnety。在优化后的CBAMRegnety上，对测试数据进行消歧，得到歧义词汇在每个语义类别下的权重。权重最大的语义类别即为歧义词汇的语义类别。本发明对歧义词汇实现了很好的消歧，更准确地判断歧义词汇的真实含义。
10. 基于预训练特征嵌入的文本分类方法及词义消歧方法
- 中南大学
- 公开公告日期：2022-08-30
- 摘要：本发明公开了一种基于预训练特征嵌入的文本分类方法，包括构建训练数据集；构建量子启发式文本分类初始模型；采用训练数据集训练量子启发式文本分类初始模型得到量子启发式文本分类模型；获取预训练模型ERNIE；连接量子启发式文本分类模型和预训练模型ERNIE构建文本分类模型；采用训练数据集训练文本分类模型得到基于预训练特征嵌入的文本分类模型；采用基于预训练特征嵌入的文本分类模型对实际文本进行文本分类。本发明提供的这种基于预训练特征嵌入的文本分类方法及词义消歧方法，通过结合预训练特征嵌入、神经网络模型和量子计算理论，提出了全新的文本分类方法和对应的词义消歧方法；本发明方法不仅可靠性高，而且分类精度较好。

词义消歧

词义消歧—发文量

词义消歧—发文趋势图

词义消歧-研究学者

词义消歧-相关主题

词义消歧-相关期刊

词义消歧-相关会议

词义消歧
-研究学者

词义消歧
-相关主题

词义消歧
-相关期刊

词义消歧
-相关会议