本体学习
本体学习的相关文献在2005年到2022年内共计156篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文132篇、会议论文14篇、专利文献83922篇;相关期刊78种,包括情报理论与实践、情报学报、情报杂志等;
相关会议14种,包括2011年西南三省一市自动化与仪器仪表学术年会、数字图书馆高层论坛2010年年会、2010年亚太青年通信与技术学术会议等;本体学习的相关文献由321位作者贡献,包括王昊、刘柏嵩、张友华等。
本体学习—发文量
专利文献>
论文:83922篇
占比:99.83%
总计:84068篇
本体学习
-研究学者
- 王昊
- 刘柏嵩
- 张友华
- 李绍稳
- 林世平
- 温春
- 王琦
- 石昭祥
- 苏新宁
- 丁志军
- 刘大昕
- 刘超
- 朱惠
- 王俊丽
- 王念滨
- 王红滨
- 蒋昌俊
- 邱莉榕
- 于红
- 余达太
- 傅魁
- 刘凯鹏
- 刘增良
- 刘强
- 刘欢
- 刘永坚
- 刘溪婧
- 刘秀磊
- 卫耀伟
- 吕刚
- 吴志祥
- 姚冬磊
- 孔敬
- 孙传庆
- 孟昱煜
- 张玉芳
- 徐东红
- 徐德智
- 徐惠
- 徐济成
- 文敦伟
- 方滨兴
- 曾瑞
- 李文忠
- 杜亚茹
- 杨建林
- 杨朝阳
- 林君萍
- 沈林峰
- 涂瑞
-
-
-
-
唐慧慧;
王昊;
张紫玄;
王雪颖
-
-
摘要:
[目的]探讨中文历史事件名识别和抽取的最优模型,用于历史文本的知识重组和中国历史事件本体的构建.[方法]以魏晋南北朝史书文本为原始语料,进行自动标引,运用条件随机场(CRFs)模型,以单个汉字为标注对象,探讨不同汉字角色集合、不同特征对历史事件名识别的影响,寻找最佳模型.[结果]经过实验论证,得到字素的词性倾向和姓氏特征相累加的最佳历史事件名识别模型,F1值高达98.74%,该最佳模型在两个开放场景中的应用也得到较好的识别效果.[局限]由于史书文本的语料特性,本实验的数据量不是特别充足;未在本实验环境下验证汉字角色标注相较于词角色标注的优越性.[结论]定义恰当的角色和特征集合后,CRFs模型可以有效地识别和抽取历史文本中的历史事件名.
-
-
王蕾;
夏绪辉;
曹建华;
刘翔
-
-
摘要:
为获取准确的再制造服务需求以实现服务组合匹配及服务过程,针对客户个体差异性及认知过程的局限性导致需求信息组织和表达混乱、客户隐性需求知识难以抽取的问题,提出一种需求动态获取策略.借鉴制造资源本体建模及本体学习的思想,提出基于本体学习的再制造服务需求自动获取方法.结合再制造及其服务领域特点,建立了再制造服务需求候选本体及其语义表达模型,并在此基础上,通过Web表格有效块划分、相似性计算、内容提取等构建客户再制造服务需求本体.通过应用实例验证了再制造服务需求获取方法的正确性和实用性.
-
-
张德海;
赵航;
王乃尧;
柳青;
原野
-
-
摘要:
本体广泛应用于语义网、自然语言处理、数字图书馆等领域,而自动构建本体是这些领域的难点之一.全自动的本体构建以及如何令机器自己不断学习并更新已有的本体知识的研究仍然缺乏.提出了一种基于认知算法的中文本体自动构建方法,建立了自动构建本体的概念和物理模型,并根据此模型实现了一个初步的自动构建本体的工具,在此基础上基于某些公理化算子来实现对已有本体的扩充、缩减、修正等操作,实验证明该模型和系统很大程度上降低了在构建本体过程中的人力投入.
-
-
唐慧慧12;
王昊12;
张紫玄12;
王雪颖12
-
-
摘要:
【目的】探讨中文历史事件名识别和抽取的最优模型,用于历史文本的知识重组和中国历史事件本体的构建。【方法】以魏晋南北朝史书文本为原始语料,进行自动标引,运用条件随机场(CRFs)模型,以单个汉字为标注对象,探讨不同汉字角色集合、不同特征对历史事件名识别的影响,寻找最佳模型。【结果】经过实验论证,得到字素的词性倾向和姓氏特征相累加的最佳历史事件名识别模型,F1值高达98.74%,该最佳模型在两个开放场景中的应用也得到较好的识别效果。【局限】由于史书文本的语料特性,本实验的数据量不是特别充足;未在本实验环境下验证汉字角色标注相较于词角色标注的优越性。【结论】定义恰当的角色和特征集合后,CRFs模型可以有效地识别和抽取历史文本中的历史事件名。
-
-
吴志祥;
王昊;
王密平
-
-
摘要:
Terms extraction and semantic relation parse based on unstructured domain patent textual is the premise of knowledge mining and further application of patent terms.In this paper,on the basis of the effective domain patent terms extraction,explore and realize the large-scale terms hierarchy parse,building the domain knowledge ontology just containing hierarchical relationships.The study of this paper is focused on three points.Firstly,building the term-patent semantic space based on the position weight.Secondly,to assist determine of clustering categories by the visualizing of large-scale terms through Principle Component Analysis dimensionality reduction.Thirdly,extraction the non-repeated categories labels for the hierarchy structure.The paper works as soon as possible to realize the large-scale Chinese patent terms hierarchy parse automatically,laying the foundation of patent terms non-hierarchy parse and diverse applications on the base of terms semantic relations parse.%对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提.本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体.着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法.本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础.
-
-
吴志祥;
王昊;
王雪颖;
祁磊;
苏新宁
-
-
摘要:
Singular value decomposition (SVD) is a commonly used decomposition technique in matrix analysis.It has been widely used in the dimension reduction and denoising of high-dimensional data.In this paper,the matrix SVD technique is applied to the hierarchy parse of domain patent terminology.The core idea is the depth transformation of term semantic space,which aims to express the term with a certain latent feature,instead of document,as an attribute.Specific research includes the construction of original term-document semantic space (TPSS),based on location weighting;term feature extraction,based on SVD;and hierarchy parse,based on term-feature semantic space (TFSS).The feasibility and validity of the proposed theoretical methods are verified by empirical study in this paper.On this basis,the hierarchical relationship of the patent terms in iron and steel metallurgy (I&SM) is parsed,and the result is incorporated into the ontology learning theory system,realizing the ontological and visualization of the patent knowledge in I&SM.%奇异值分解是矩阵分析中常用的分解技术,在高维数据的降维、去噪方面有着广泛的应用.本文将矩阵的奇异值分解技术应用到领域专利术语的层次关系解析中,其核心思想是术语语义空间的深度转换,旨在用某种潜在特征代替文档作为属性来表示术语.具体研究包括,基于位置加权的原始术语-文档语义空间的构建方法、基于奇异值分解的术语特征抽取方法、基于术语-特征语义空间的术语层次关系解析方法.本文对论述的理论方法进行了实证研究,证实了该方法的可行性和有效性,并在此基础上实现较大规模的钢铁冶金领域专利术语层次关系解析,将解析结果纳入到本体学习理论体系中,实现该领域专利术语的知识本体化与可视化.
-
-
王汀;
冀付军
-
-
摘要:
在进行大规模领域本体的构建时,基于手工方式的构建模式效率较低并且可行性较差.为了解决大规模领域本体的自动化构建问题,提出了一种领域主题词表与网络百科知识库相融合的两阶段领域本体自动化构建方案.第一阶段,进行主题词表至本体的粗映射,形成领域粗糙本体;第二阶段,采用改进的同义词词林与编辑距离相似度相结合的方式对百科知识与粗糙本体进行自动融合、自适应调整和扩充,形成含有丰富语义信息的、良构的领域本体.基于两阶段方法自动化地构建了大规模中国电子政务领域本体(Chinese E-Gov Ontology),从而验证该方法的可行性和有效性.%While constructing a large-scale domain ontology, the traditional manual construction method has low effi-ciency and feasibility. In order to solve the large-scale domain ontology automatic building problem, making use of the cross-domain coverage characteristics of the Chinese online encyclopedia and the e-government thesaurus, based on the improved TongYiCiCiLin similarity computing algorithms, this paper puts forward a two-stage automatic con-structing ontology solution by merging the domain thesaurus and online encyclopedia knowledge base together. Based on the proposed approach, this paper takes the Chinese e-government domain as an example and automatically builds a large-scale ontology as the foundation of Chinese Linked Open Government Data construction. Practice proves that the system has feasibility and robustness in achieving the goal of rapid and automatic building of large-scale domain ontology.
-
-
翟社平;
马蒙雨;
马传宾;
高山;
郭琳
-
-
摘要:
为了提高中文领域本体概念抽取的准确率和召回率,提出一种多策略的中文领域本体概念抽取方法.该方法使用模式匹配法改进原有的单字合并法,经词性过滤和缺陷检测筛选出概念集组成用户词典,并送入概念抽取系统进行二次分词获得候选概念集;利用词频-逆向文本频率(TFIDF)方法和信息熵融合得到TFIDFE方法,计算概念权重以获得领域概念集.实验结果表明,该方法在领域术语抽取的准确率、召回率和F值上均有较好的效果.%In order to improve the precision and recall rate of Chinese domain ontology concept extraction,a multi-strategy Chinese domain ontology concept extraction method is proposed in this paper.In this method,the method of pattern matching is used to improve the original Character Combine Method.A user dictionary is composed after screening concept set with word filter and defect detection,and then fed into the system for the second word segmentation to get candidate concept set.Fused from the TFIDF method and information entropy,the TFIDFE method is used to calculate the concept of weight to obtain the domain concept set.Experimental results show that the proposed method has a good effect on the accuracy,recall and F value of domain term extraction.
-
-
刘凯鹏;
方滨兴
- 《2010年中国计算机大会》
| 2010年
-
摘要:
由相互协作的用户在社会性标注系统中产生的大量的标注数据可以作为各种语义网应用的数据源.文中提出一种基于社会性标注的本体学习方法来挖掘蕴涵在社会性标注中的语义信息,提出一种隐含包容层次结构来刻画标签空间中潜在的结构,并基于此模型推导出本体学习算法.首先利用集合论的方法确定标签之间的包容关系,并将其表示为标签包容关系图.在将此图转化为层次关系时,为解决包容关系的不一致性,提出一种基于随机游走的标签普遍性排序方法.最后提出一种自顶向下的凝聚式层次聚类算法来生成概念层次结构.在实际社会性标注系统中采集的数据集上进行的实验表明,与目前的代表性方法相比,文中提出的方法在性能上有明显的提高.
-
-
林世平;
林君萍
- 《2010年亚太青年通信与技术学术会议》
| 2010年
-
摘要:
现有的中文本体学习中,关于非分类关系获取的研究方法大都停留在判断两个概念是否存在关系的层次上,即无法为获取的非分类关系赋上语义标签.本文提出一种方法,首先利用统计函数获取具有非分类关系的关联概念对,然后通过语言学知识表示方法为获取的非分类关系赋上语义标签.该方法在一定程度上克服了以往方法无法获取的非分类关系语义标签的难题.实验结果表明本文的方法可以实现对概念间非分类关系语义标签的获取.
-
-
- 《第二届国际计算机及计算技术在农业中的应用研讨会暨第二届中国农村信息化发展论坛》
| 2008年
-
摘要:
近年来,本体学习的研究在计算机领域变得越来越深入,而基于文本的本体学习研究正成为本体学习研究的重点.文章主要探讨了面向文本的本体学习技术,描述了当前国内外本体学习领域的研究现状,对本体学习任务、学习方法、学习工具进行了说明,特别是对本体学习领域关于概念和关系的自动抽取做了详细介绍,文章最后提出了本体学习研究出现的问题以及下一步研究方向.
-
-
-
-
-
-
-