首页> 中文期刊> 《计算机科学与探索》 >互联网上信息报道的最早发布时间检测

互联网上信息报道的最早发布时间检测

         

摘要

准确提取网上信息报道的最早发布时间,对于使用计算机辅助的社会科学研究来说具有重要价值.数据表明,有40%的信息报道无法从网页中直接提取出文章发布时间,此时,如果单纯依靠搜集时间和HTTP协议提供的网页文件最后修改时间信息来估计文章发布时间,就会造成较大误差.提出了两种能够提高计算精度的方法:链接分析法和拷贝分析法.大数据量实验表明,这两种方法具有很小的出错概率,是切实可用的.其中,链接分析法能够在一定程度上减少计算误差.而拷贝分析法则具有决定性的作用.当一篇信息报道能在网上找到多个拷贝(转载)时,就会有很大的概率准确推断出该报道在网上的最早发布时间.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号