【24h】

A Cache-Based Distributed Terabyte Text Retrieval System in CADAL

机译:CADAL中基于缓存的分布式兆字节文本检索系统

获取原文
获取原文并翻译 | 示例

摘要

The China-America Digital Academic Library (CADAL) project aims to create a searchable collection of one million digital books freely available over the Internet. For this, a terabyte text retrieval system is required. This paper presents a cache-based, distributed terabyte text retrieval system, with fulltext retrieval, distributed computing and caching techniques. By distributing data by subject on different index servers, query searching is limited to specific index servers. With cache servers, response time is reduced. When queried, the system returns only highly relevant search results, to reduce the workload on the network. The prototype system shows the effectiveness of our design.
机译:中美数字大学图书馆(CADAL)项目旨在创建可搜索的100万册数字图书,这些图书可通过互联网免费获得。为此,需要一个TB的文本检索系统。本文提出了一种基于缓存的分布式兆字节文本检索系统,该系统具有全文检索,分布式计算和缓存技术。通过按主题将数据分布在不同的索引服务器上,查询搜索仅限于特定的索引服务器。使用缓存服务器,可以缩短响应时间。查询时,系统仅返回高度相关的搜索结果,以减少网络上的工作量。原型系统显示了我们设计的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号