首页> 外文会议>Language and technology conference >Automated Normalization and Analysis of Historical Texts
【24h】

Automated Normalization and Analysis of Historical Texts

机译:自动正常化和历史文本分析

获取原文

摘要

The paper presents an original method for processing historical texts. A historical text is converted into its modernized equivalent by a tool called diachronic normalizer, embedded into a linguistic toolkit. The solution has a few merits. Firstly, the toolkit architecture allows for imposing the morphological constraints on diachronization rules. Secondly, the diachronic normalizer may be launched in the pipeline together with other NLP tools, such as parsers or translators. Lastly, the toolkit makes it possible to efficiently apply, in the diachronic normalization, a long list of diachronic pairs, found out with the aid of word distribution vectors in historical corpora.
机译:本文提出了一种处理历史文本的原始方法。 历史文本被称为Diachronic Normalizer的工具转换为其现代化的等价物,嵌入到语言工具包中。 解决方案有一些优点。 首先,工具包体系结构允许对二次数据化规则施加形态约束。 其次,可以在管道中与其他NLP工具(例如解析器或翻译器)一起在管道中发射。 最后,工具包使得可以在历史记录中有效地应用,这是借助历史上的词汇分布向量发现的历史态度对。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号