首页> 外文会议>2014 IEEE/ACM Joint Conference on Digital Libraries >Detecting and modeling local text reuse
【24h】

Detecting and modeling local text reuse

机译:检测和建模本地文本重用

获取原文
获取原文并翻译 | 示例

摘要

Texts propagate through many social networks and provide evidence for their structure. We describe and evaluate efficient algorithms for detecting clusters of reused passages embedded within longer documents in large collections. We apply these techniques to two case studies: analyzing the culture of free reprinting in the nineteenth-century United States and the development of bills into legislation in the U.S. Congress. Using these divergent case studies, we evaluate both the efficiency of the approximate local text reuse detection methods and the accuracy of the results. These techniques allow us to explore how ideas spread, which ideas spread, and which subgroups shared ideas.
机译:文本通过许多社交网络传播,并为其结构提供证据。我们描述和评估有效的算法,以检测嵌入在较大集合中的较长文档中的重复使用段落的簇。我们将这些技术应用于两个案例研究:分析19世纪美国的免费转载文化以及美国国会将法案发展为立法。使用这些不同的案例研究,我们评估了近似本地文本重用检测方法的效率和结果的准确性。这些技术使我们能够探索思想如何传播,哪些思想传播以及哪些小组共享思想。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号