Hadoop
Hadoop的相关文献在2007年到2023年内共计3727篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、信息与知识传播
等领域,其中期刊论文2769篇、会议论文5篇、专利文献953篇;相关期刊809种,包括电脑知识与技术、计算机工程与应用、计算机科学等;
相关会议5种,包括2011图书馆信息技术的应用、服务和创新学术研讨会暨第3届数字图书馆与开放源代码软件(DLIB&OSS2011)学术研讨会、2011年底气象水文海洋仪器学术交流会、河北省计算机学会、电子学会、自动化学会、人工智能学会、计算机辅助设计研究会、软件与信息服务业协会、电子政务研究会、高新技术产业协会2011年联合学术年会(河北省物联网技术和产业发展高峰论坛)等;Hadoop的相关文献由7496位作者贡献,包括王伟、高阳、李伟等。
Hadoop
-研究学者
- 王伟
- 高阳
- 李伟
- 李鹏
- 刘勇
- 商琳
- 杨育彬
- 李天瑞
- 于洋
- 罗富财
- 郭美思
- 冯钧
- 刘斌
- 刘波
- 刘鹏
- 吴丹
- 吴楠
- 张岩
- 张治中
- 林承华
- 王俊平
- 王鹏
- 须成忠
- 高经郡
- 伍轶明
- 刘晶
- 张斌
- 张静娴
- 彭建烽
- 王德文
- 王涛
- 胡必波
- 赵志超
- 郭文忠
- 魏文国
- 何金栋
- 侯爱琴
- 冯兴杰
- 刘洋
- 吴丽进
- 吴奇石
- 唐志军
- 唐志贤
- 喻之斌
- 喻朝新
- 应毅
- 张伟
- 张强
- 张晓阳
- 张涛
-
-
聂文芳;
石建华
-
-
摘要:
学生行为数据能够全面、系统地反映大学生的行为规律和特征,对高校教育管理、学生自身发展具有重要的意义。面对海量的校园数据,如何从中有效挖掘有价值的信息已成为提升学生信息管理水平的重要内容。基于此,本文运用大数据处理和分析技术,针对高校当前海量数据进行采集、分析,并结合高校学生行为特征构建基于Hadoop的分布式计算平台。
-
-
蔡伊娜;
包先雨;
林燕奎;
彭锦学;
彭智彬;
林泳奇;
李俊霖;
郭云
-
-
摘要:
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F;值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
-
-
朱庆淦;
钟桂凤
-
-
摘要:
校园安全关系到学生的健康成长,与每个师生、家长和社会都有着密切的关系,保证校园的安全是每个学校及教育工作者应有的责任。校园的出入口作为校园的第一道防护关卡,需要无时无刻地记录每一位出入人员的动向,但如果依靠人力去实现,实施起来会带来极大的困难,如果借助于人脸识别技术,则能极大地减少校园安保人员的工作量,同时提高对出入人员身份验证的工作效率。基于已经发展并且成熟的人脸识别技术,结合大数据的主流框架——Hadoop来提升人脸识别的效率,使用大数据技术进行大范围人脸数据的管理,从而更好地将其应用到校园安保工作,对校园安全管理的优化具有十分重要的意义。
-
-
胡必波;
李满;
左文涛
-
-
摘要:
针对现代信息技术如何与具体课堂融合提升传统课堂教学问题,提出基于SPOC与对分课堂构建一种新型线上线下混合式教学模式,该教学模式取各种典型传统教学模式优点并结合互联网信息技术,以超星学习通平台为工具,实现在"以教为中心"和"以学为中心"之间的平衡。并以Hadoop大数据技术课程"社交网站日志大数据的处理与分析专题"为例开展实践,实施结果表明能够从线上和线下两方面增强学生接受度和认可度,加强大学生学习驱动力,提高课堂教学质量。
-
-
杨改改;
高贤强
-
-
摘要:
为解决传统的关系型数据库系统中农业数据的存储能力不足及管理困难的问题,本文提出一种基于微服务架构的农业数据云存储平台,系统基于SpringCloud微服务架构设计,服务模块功能单一,边界明确,服务之间相互解耦,可扩展性强,提升了开发和维护效率。采用Hadoop分布式集群,可实现海量农业数据的存储。该系统测试的结果表明,所构建的云存储平台性能稳定,可对农业大数据的存储和管理方法提供参考。
-
-
黄志;
苏传程;
苏晓红
-
-
摘要:
针对长时间序列、多站点和多气象要素的大数据量查询需求,现有的CIMISS(China Integrated Meteorological Information Sharing System)存在支撑能力严重不足的问题。本研究使用广西气象站点建站至今的历史地面气象记录月报表数据资料和现有Hadoop集群物理资源,重新设计数据ETL流程,构建Parquet格式数据集并完成HDFS转换存储;嵌入Spark的Broadcast广播变量,优化Spark集群执行参数,提高了集群的处理并行度和SparkSql的关联查询效率。结果表明,Parquet格式数据集的最高压缩比超过95%,一次性大数据量的查询效率比原来提升了1~5倍,并支持高并发访问,为各类相关预报预测业务的开展提供了有效的技术支撑。
-
-
李晓娜;
苏金善;
李瀚铭
-
-
摘要:
随着现代人越来越喜欢用图像记录生活,每日上传至互联网的图像都呈爆炸式增长。公安部门可以利用海量的图像数据实现网络追凶,但现实中摄像头采集到的图像以及上传至网络的图像,并非都是统一状态的图像,而是包含各种状态的图像,例如不同表情、不同动作、不同角度、不同程度的角度偏斜,不同年龄,以及有背景干扰的图像,其中部分图像会因使用的设备不同,导致上传至网络的图像既有灰白图像又有彩色图像。这些多模态图像为人脸的准确识别增加了难度,要将实际中采集到的图像从如此复杂且规模庞大的数据集中匹配与识别出来,是一件十分困难的事。针对以上问题,提出将改进后的开源人脸识别库,即face_recognition库与Hadoop平台中的MapReduce进行结合,在确保识别准确率的前提下提升人脸检测速度,实现对大规模、多模态图像的有效识别。实验证明,本文的方法能够有效解决大规模多模态图像的识别问题,实时性高,实用性强。
-
-
王天来;
王理;
孙连营;
殷梦霞
-
-
摘要:
随着互联网技术与建筑技术的发展,需监测与采集的建筑数据量越来越大、类型也越来越复杂,传统的数据存储与分析方式正面临着挑战。利用大数据技术构建建筑能耗大数据平台对建筑能耗相关数据进行存储,并基于建筑能耗大数据平台利用R语言建立多元线性回归模型、时间序列模型、神经网络模型对不同类型的建筑能耗数据进行分析研究。
-
-
吴永旺;
饶银辉;
庄伟涛;
子文江;
杨捍东;
余蓉;
洪晓斌
-
-
摘要:
针对无人船测试过程中数据量大、数据源多、数据记录分散等问题,提出一种面向无人船测试的多源数据HDFS存储优化方法。首先设计基于Hadoop的无人船测试云平台架构,分析无人船测试云平台的信息流;接着提出无人船测试多源数据容错机制及重复数据删除策略,优化无人船测试多源数据HDFS存储;最后对无人船测试多源数据进行HDFS存储实验。结果表明,Hadoop集群优化后比默认系统存储效率提升约20%,可满足无人船测试多源数据的存储需求。
-
-
温晓宇
-
-
摘要:
近年来,随着我国网络信息技术的快速发展,个性化推荐系统的应用范围也越来越广,为人们的工作和生活也带来了很多的便捷。许多公司都开始在网上发布招聘信息,人们也在网络上发布各种各样的求职信息,招聘求职的信息出现了大幅度增长,单一的岗位搜索功能已经没有办法满足招聘公司和求职者多元化的需求。该文对于岗位平台推荐系统进行深入分析,针对传统职位推荐系统中存在的问题,引入全新的过滤推荐技术,设计出个性化岗位推荐系统,以供借鉴。
-
-
李闯;
赵长海;
晏海华
- 《2010年全国高性能计算学术年会(HPC china2010)》
| 2010年
-
摘要:
地震层析是利用大量地震观测数据反演研究区域三维结构的一种方法.菲涅耳带层析成像考虑波频率的影响,具有较 高的分辨率,但所需的存储空间和计算量很大.本文基于MapReduce 编程模型,利用开源hadoop 软件设计并实现了具备高扩 展性、可容错的菲涅耳带地震层析成像并行算法.实验表明,在集群系统上,此算法可靠稳定,节点数较多时仍能保持较高的 加速比.
-
-
-
-
-
-
-
-
-