首页> 美国卫生研究院文献>other >The Fractal Patterns of Words in a Text: A Method for Automatic Keyword Extraction
【2h】

The Fractal Patterns of Words in a Text: A Method for Automatic Keyword Extraction

机译:文本中词的分形模式:一种自动关键词提取方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A text can be considered as a one dimensional array of words. The locations of each word type in this array form a fractal pattern with certain fractal dimension. We observe that important words responsible for conveying the meaning of a text have dimensions considerably different from one, while the fractal dimensions of unimportant words are close to one. We introduce an index quantifying the importance of the words in a given text using their fractal dimensions and then ranking them according to their importance. This index measures the difference between the fractal pattern of a word in the original text relative to a shuffled version. Because the shuffled text is meaningless (i.e., words have no importance), the difference between the original and shuffled text can be used to ascertain degree of fractality. The degree of fractality may be used for automatic keyword detection. Words with the degree of fractality higher than a threshold value are assumed to be the retrieved keywords of the text. We measure the efficiency of our method for keywords extraction, making a comparison between our proposed method and two other well-known methods of automatic keyword extraction.
机译:文本可以视为单词的一维数组。该数组中每个单词类型的位置形成具有一定分形维数的分形图案。我们观察到,负责传达文本含义的重要单词的维数与一个单词有很大不同,而无关紧要的单词的分形维数接近一个。我们引入了一个索引,该索引使用分形维数来量化给定文本中单词的重要性,然后根据其重要性对它们进行排名。此索引衡量原始文本中单词的分形模式相对于混排版本的差异。因为混排的文本是没有意义的(即,单词不重要),所以原始文本和混排的文本之间的差异可用于确定分形程度。分形程度可以用于自动关键词检测。分形程度高于阈值的单词被假定为文本的检索关键字。我们测量了我们的关键字提取方法的效率,将我们提出的方法与其他两种众所周知的自动关键字提取方法进行了比较。

著录项

  • 期刊名称 other
  • 作者

    Elham Najafi; Amir H. Darooneh;

  • 作者单位
  • 年(卷),期 -1(10),6
  • 年度 -1
  • 页码 e0130617
  • 总页数 18
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号