...
首页> 外文期刊>Mathematiques et Sciences Humaines (Print) >Représentations du texte pour la classification arborée et l’analyse automatique de corpus. Application à un corpus d’historiens latins
【24h】

Représentations du texte pour la classification arborée et l’analyse automatique de corpus. Application à un corpus d’historiens latins

机译:用于树分类和自动语料库分析的文本表示。应用于拉丁历史学家的语料库

获取原文
           

摘要

In this paper, we present different methods of automatic classification applied to a corpus of literary texts and we compare their different results; in particular we evaluate how each of them is suitable for exhibiting the generic classification of the corpus. We demonstrate that a topological approach of the texts which takes into account their linearity, i.e. the order of their micro- and macro-structures, results in better clustering than traditional quantitative methods which leave generally out of count this linear structure.
机译:在本文中,我们介绍了应用于文学文本语料库的不同自动分类方法,并比较了它们的不同结果。特别是,我们评估它们中的每一个如何适合展示语料库的通用分类。我们证明,考虑到文本的线性(即它们的微观结构和宏观结构的顺序)的文本拓扑方法比传统的定量方法更好地实现了聚类,而传统的定量方法通常不考虑这种线性结构。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号