首页> 外文学位 >Distributed search of biological databases using Hadoop/MapReduce.
【24h】

Distributed search of biological databases using Hadoop/MapReduce.

机译:使用Hadoop / MapReduce分布式搜索生物数据库。

获取原文
获取原文并翻译 | 示例

摘要

The main goals of this thesis research were to: 1. Make a computational platform/environment for thesis research. 2. Develop a MapReduce search algorithm that employs the scalability of a Hadoop cluster and the MapReduce functionalities to make the search of a biological database faster. 3. Implement the MapReduce search algorithm using the Java programming language, and running the consequent Java application in a Hadoop multi-node cluster in the cloud. 4. Compare execution times of - The MapReduce search program - The serial search programs -- Boyer-Moore Algorithm and Knuth-Morris-Pratt Algorithm.;13 GB of downloadable GenBank data was processed over the Hadoop framework installed on a 12-node cluster comprised of the Amazon EC2 t2.micro instance types. The execution time of the distributed search program is 46% faster than the execution times of the serial programs. Hence, the present search algorithms used for accessing the biological databases can incorporate the MapReduce programming model to improve their performances.
机译:本论文研究的主要目的是:1.搭建论文研究的计算平台/环境。 2.开发一种MapReduce搜索算法,该算法利用Hadoop集群的可扩展性和MapReduce功能来更快地搜索生物数据库。 3.使用Java编程语言实现MapReduce搜索算法,并在云中的Hadoop多节点集群中运行相应的Java应用程序。 4.比较以下各项的执行时间-MapReduce搜索程序-串行搜索程序-Boyer-Moore算法和Knuth-Morris-Pratt算法。;通过安装在12节点群集上的Hadoop框架处理了13 GB的可下载GenBank数据由Amazon EC2 t2.micro实例类型组成。分布式搜索程序的执行时间比串行程序的执行时间快46%。因此,用于访问生物数据库的当前搜索算法可以并入MapReduce编程模型以提高其性能。

著录项

  • 作者

    Fashola, Babatunde Olaide.;

  • 作者单位

    Morgan State University.;

  • 授予单位 Morgan State University.;
  • 学科 Bioinformatics.;Computer science.
  • 学位 M.S.
  • 年度 2015
  • 页码 99 p.
  • 总页数 99
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号