您现在的位置: 首页> 研究主题> 本体学习

本体学习

本体学习的相关文献在2005年到2022年内共计156篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究 等领域,其中期刊论文132篇、会议论文14篇、专利文献83922篇;相关期刊78种,包括情报理论与实践、情报学报、情报杂志等; 相关会议14种,包括2011年西南三省一市自动化与仪器仪表学术年会、数字图书馆高层论坛2010年年会、2010年亚太青年通信与技术学术会议等;本体学习的相关文献由321位作者贡献,包括王昊、刘柏嵩、张友华等。

本体学习—发文量

期刊论文>

论文:132 占比:0.16%

会议论文>

论文:14 占比:0.02%

专利文献>

论文:83922 占比:99.83%

总计:84068篇

本体学习—发文趋势图

本体学习

-研究学者

  • 王昊
  • 刘柏嵩
  • 张友华
  • 李绍稳
  • 林世平
  • 温春
  • 王琦
  • 石昭祥
  • 苏新宁
  • 丁志军
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 王向前; 桂冬冬; 李慧宗
    • 摘要: 文章通过对国内外本体自动构建和从文中构建本体两个方面的相关综述文献进行评述,得出面向文本的本体自动构建过程的核心内容:概念的自动提取和概念间关系的自动抽取.从概念及其间关系的自动提取两个方面进行相关技术介绍分析并进行总结.指出当前面向文本的本体自动构建研究存在的不足以及接下来研究的重点方向.
    • 唐慧慧; 王昊; 张紫玄; 王雪颖
    • 摘要: [目的]探讨中文历史事件名识别和抽取的最优模型,用于历史文本的知识重组和中国历史事件本体的构建.[方法]以魏晋南北朝史书文本为原始语料,进行自动标引,运用条件随机场(CRFs)模型,以单个汉字为标注对象,探讨不同汉字角色集合、不同特征对历史事件名识别的影响,寻找最佳模型.[结果]经过实验论证,得到字素的词性倾向和姓氏特征相累加的最佳历史事件名识别模型,F1值高达98.74%,该最佳模型在两个开放场景中的应用也得到较好的识别效果.[局限]由于史书文本的语料特性,本实验的数据量不是特别充足;未在本实验环境下验证汉字角色标注相较于词角色标注的优越性.[结论]定义恰当的角色和特征集合后,CRFs模型可以有效地识别和抽取历史文本中的历史事件名.
    • 王蕾; 夏绪辉; 曹建华; 刘翔
    • 摘要: 为获取准确的再制造服务需求以实现服务组合匹配及服务过程,针对客户个体差异性及认知过程的局限性导致需求信息组织和表达混乱、客户隐性需求知识难以抽取的问题,提出一种需求动态获取策略.借鉴制造资源本体建模及本体学习的思想,提出基于本体学习的再制造服务需求自动获取方法.结合再制造及其服务领域特点,建立了再制造服务需求候选本体及其语义表达模型,并在此基础上,通过Web表格有效块划分、相似性计算、内容提取等构建客户再制造服务需求本体.通过应用实例验证了再制造服务需求获取方法的正确性和实用性.
    • 张德海; 赵航; 王乃尧; 柳青; 原野
    • 摘要: 本体广泛应用于语义网、自然语言处理、数字图书馆等领域,而自动构建本体是这些领域的难点之一.全自动的本体构建以及如何令机器自己不断学习并更新已有的本体知识的研究仍然缺乏.提出了一种基于认知算法的中文本体自动构建方法,建立了自动构建本体的概念和物理模型,并根据此模型实现了一个初步的自动构建本体的工具,在此基础上基于某些公理化算子来实现对已有本体的扩充、缩减、修正等操作,实验证明该模型和系统很大程度上降低了在构建本体过程中的人力投入.
    • 唐慧慧12; 王昊12; 张紫玄12; 王雪颖12
    • 摘要: 【目的】探讨中文历史事件名识别和抽取的最优模型,用于历史文本的知识重组和中国历史事件本体的构建。【方法】以魏晋南北朝史书文本为原始语料,进行自动标引,运用条件随机场(CRFs)模型,以单个汉字为标注对象,探讨不同汉字角色集合、不同特征对历史事件名识别的影响,寻找最佳模型。【结果】经过实验论证,得到字素的词性倾向和姓氏特征相累加的最佳历史事件名识别模型,F1值高达98.74%,该最佳模型在两个开放场景中的应用也得到较好的识别效果。【局限】由于史书文本的语料特性,本实验的数据量不是特别充足;未在本实验环境下验证汉字角色标注相较于词角色标注的优越性。【结论】定义恰当的角色和特征集合后,CRFs模型可以有效地识别和抽取历史文本中的历史事件名。
    • 吴志祥; 王昊; 王密平
    • 摘要: Terms extraction and semantic relation parse based on unstructured domain patent textual is the premise of knowledge mining and further application of patent terms.In this paper,on the basis of the effective domain patent terms extraction,explore and realize the large-scale terms hierarchy parse,building the domain knowledge ontology just containing hierarchical relationships.The study of this paper is focused on three points.Firstly,building the term-patent semantic space based on the position weight.Secondly,to assist determine of clustering categories by the visualizing of large-scale terms through Principle Component Analysis dimensionality reduction.Thirdly,extraction the non-repeated categories labels for the hierarchy structure.The paper works as soon as possible to realize the large-scale Chinese patent terms hierarchy parse automatically,laying the foundation of patent terms non-hierarchy parse and diverse applications on the base of terms semantic relations parse.%对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提.本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体.着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法.本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础.
    • 吴志祥; 王昊; 王雪颖; 祁磊; 苏新宁
    • 摘要: Singular value decomposition (SVD) is a commonly used decomposition technique in matrix analysis.It has been widely used in the dimension reduction and denoising of high-dimensional data.In this paper,the matrix SVD technique is applied to the hierarchy parse of domain patent terminology.The core idea is the depth transformation of term semantic space,which aims to express the term with a certain latent feature,instead of document,as an attribute.Specific research includes the construction of original term-document semantic space (TPSS),based on location weighting;term feature extraction,based on SVD;and hierarchy parse,based on term-feature semantic space (TFSS).The feasibility and validity of the proposed theoretical methods are verified by empirical study in this paper.On this basis,the hierarchical relationship of the patent terms in iron and steel metallurgy (I&SM) is parsed,and the result is incorporated into the ontology learning theory system,realizing the ontological and visualization of the patent knowledge in I&SM.%奇异值分解是矩阵分析中常用的分解技术,在高维数据的降维、去噪方面有着广泛的应用.本文将矩阵的奇异值分解技术应用到领域专利术语的层次关系解析中,其核心思想是术语语义空间的深度转换,旨在用某种潜在特征代替文档作为属性来表示术语.具体研究包括,基于位置加权的原始术语-文档语义空间的构建方法、基于奇异值分解的术语特征抽取方法、基于术语-特征语义空间的术语层次关系解析方法.本文对论述的理论方法进行了实证研究,证实了该方法的可行性和有效性,并在此基础上实现较大规模的钢铁冶金领域专利术语层次关系解析,将解析结果纳入到本体学习理论体系中,实现该领域专利术语的知识本体化与可视化.
    • 王汀; 冀付军
    • 摘要: 在进行大规模领域本体的构建时,基于手工方式的构建模式效率较低并且可行性较差.为了解决大规模领域本体的自动化构建问题,提出了一种领域主题词表与网络百科知识库相融合的两阶段领域本体自动化构建方案.第一阶段,进行主题词表至本体的粗映射,形成领域粗糙本体;第二阶段,采用改进的同义词词林与编辑距离相似度相结合的方式对百科知识与粗糙本体进行自动融合、自适应调整和扩充,形成含有丰富语义信息的、良构的领域本体.基于两阶段方法自动化地构建了大规模中国电子政务领域本体(Chinese E-Gov Ontology),从而验证该方法的可行性和有效性.%While constructing a large-scale domain ontology, the traditional manual construction method has low effi-ciency and feasibility. In order to solve the large-scale domain ontology automatic building problem, making use of the cross-domain coverage characteristics of the Chinese online encyclopedia and the e-government thesaurus, based on the improved TongYiCiCiLin similarity computing algorithms, this paper puts forward a two-stage automatic con-structing ontology solution by merging the domain thesaurus and online encyclopedia knowledge base together. Based on the proposed approach, this paper takes the Chinese e-government domain as an example and automatically builds a large-scale ontology as the foundation of Chinese Linked Open Government Data construction. Practice proves that the system has feasibility and robustness in achieving the goal of rapid and automatic building of large-scale domain ontology.
    • 翟社平; 马蒙雨; 马传宾; 高山; 郭琳
    • 摘要: 为了提高中文领域本体概念抽取的准确率和召回率,提出一种多策略的中文领域本体概念抽取方法.该方法使用模式匹配法改进原有的单字合并法,经词性过滤和缺陷检测筛选出概念集组成用户词典,并送入概念抽取系统进行二次分词获得候选概念集;利用词频-逆向文本频率(TFIDF)方法和信息熵融合得到TFIDFE方法,计算概念权重以获得领域概念集.实验结果表明,该方法在领域术语抽取的准确率、召回率和F值上均有较好的效果.%In order to improve the precision and recall rate of Chinese domain ontology concept extraction,a multi-strategy Chinese domain ontology concept extraction method is proposed in this paper.In this method,the method of pattern matching is used to improve the original Character Combine Method.A user dictionary is composed after screening concept set with word filter and defect detection,and then fed into the system for the second word segmentation to get candidate concept set.Fused from the TFIDF method and information entropy,the TFIDFE method is used to calculate the concept of weight to obtain the domain concept set.Experimental results show that the proposed method has a good effect on the accuracy,recall and F value of domain term extraction.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号