基于主题词表和 FCA的网页语义概念树构建研究

孙亚琳; 赵林林; 杨小平

首页> 中文期刊> 《计算机应用研究》 >基于主题词表和 FCA的网页语义概念树构建研究

基于主题词表和 FCA的网页语义概念树构建研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In order to guide users to use well and improving websites’quality and construcing the Web semantic model,this pa-per presented a new approach and framework of learning from Web pages,and used formal concept analysis (FCA)to build the semantic concept tree.Firstly,it used information extraction and natural language processing tools to extract and segment texts, and then identified feature words by statistical methods.Secondly,it transformed feature words into thesaurus terms by using search-engine-based similarity calculation.Thirdly,it formed a formal context,and reduced the context by using rules,clustering and other techniques.Finally,it constructed concept lattice by using some algorithm to get hierarchy,which then transformed into the concept tree.Experimental results show that the concept tree can be used as the basis of Web ontology model,and have a pro-found signification for semantic assessment.The proposed algorithm has a certain value and referenced significance.%针对用户使用网站效率低和网站质量差的问题，提出了利用形式概念分析（FCA）来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词，提取出描述文本语义的特征词；再以主题词表为参照，设计基于搜索引擎的词语相似度算法，将抽取的特征词全部转换成主题词表中主题词，对将抽取的语义信息转换成形式背景，利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格，实现概念树构建。实验结果表明，利用该方法构建的概念树可以作为网站本体模型的基础，对语义评估具有积极的意义，具有一定的应用价值和借鉴意义。

著录项

来源
《计算机应用研究》 |2014年第11期|3308-3315|共8页
作者
孙亚琳; 赵林林; 杨小平;
展开▼
作者单位

中国人民大学信息学院;

北京100872;

中国地质调查局发展研究中心信息工程室;

北京100037;

中国人民大学信息学院;

北京100872;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机网络;
关键词
本体; 语义概念树; 形式概念分析; 表; 词语相似度;

相似文献

中文文献
外文文献
专利

1. 协方差特征爬虫网页语义概念树构建方法 [J] . 梁武 ,苏燕 . 科技通报 . 2015,第4期
2. 基于简约知识组织系统的主题词表语义网络化研究——以《中国档案主题词表》为例 [J] . 段荣婷 . 中国图书馆学报 . 2011,第003期
3. 基于语义概念树和局部上下文分析的查询扩展 [J] . 杨海南 . 武汉理工大学学报：信息与管理工程版 . 2011,第001期
4. 基于概念树的语义相似度计算的研究 [J] . 江磊 ,郑彦 ,余志虎 . 广东通信技术 . 2010,第008期
5. 基于K-means与FCA的网页文本聚类算法的研究 [J] . 朱正国 . 计算机时代 . 2013,第009期
6. 基于概念树的Web语义结构评价 [C] . 杨小平 ,宇文姝丽 ,韩佳 . 中国计算机用户协会信息系统分会2011年第二十一届信息交流大会 . 2011
7. 基于主题词表和FCA的海事本体构建研究 [A] . 孙利 . 2010

基于主题词表和 FCA的网页语义概念树构建研究

摘要

著录项

相似文献

相关主题

期刊订阅