流式计算
流式计算的相关文献在2012年到2023年内共计222篇,主要集中在自动化技术、计算机技术、矿业工程、电工技术
等领域,其中期刊论文87篇、会议论文9篇、专利文献400859篇;相关期刊63种,包括黑龙江科学、通信学报、移动通信等;
相关会议9种,包括第十四届全国软件与应用学术会议、第五届全国情报学博士生学术论坛暨2015中国信息资源管理论坛、第十六届全国软件与应用学术会议等;流式计算的相关文献由552位作者贡献,包括于炯、鲁亮、李梓杨等。
流式计算—发文量
专利文献>
论文:400859篇
占比:99.98%
总计:400955篇
流式计算
-研究学者
- 于炯
- 鲁亮
- 李梓杨
- 蒲勇霖
- 卞琛
- 廖彬
- 范小朋
- 张译天
- 王红
- 齐林海
- 丁维龙
- 张军
- 戴文渊
- 杨强
- 涂威威
- 焦英翔
- 王跃飞
- 石光川
- 赵卓峰
- 陈雨强
- 刘莉
- 吕太之
- 孔祥翾
- 孙大为
- 孙小涓
- 康瑞
- 廖湖声
- 朱阿龙
- 李冰
- 王亦雄
- 田林
- 石慧彪
- 胡勇
- 胡玉新
- 苏航
- 郑纬民
- 须成忠
- 高红雨
- 丁玉
- 乔通
- 于洋
- 任军
- 何肖明
- 余道敏
- 佟继周
- 刘亚萍
- 刘伟伟
- 刘宇
- 刘武阳
- 刘露
-
-
吴小芳
-
-
摘要:
在大数据时代,数字化转型是企业发展战略的必然选择,而实时数仓建设则是数字化转型的重点。实时计算相对于传统的批处理,能够快速体现数据的价值,有着广泛的实时业务场景需求。本文提出一种基于Flink的实时数仓设计,并在DPI业务场景得到实践验证,有效支撑了运营商对业务请求次数、流量、活跃用户数、业务成功率等多维度指标需求,可为其他更广泛的实时业务场景落地奠定坚实的基础。
-
-
孟云飞
-
-
摘要:
为推动低延迟、高可靠性及可扩展的大数据流式计算系统的发展,介绍了大数据流式计算及其特征。与传统的批处理方法相比,其在时效性、有序性、数据量、数据处理速率、是否重现、移动对象、计算方式、常驻空间等方面都具有一定的优势。不足之处是精确度较低。通过实例介绍了典型的流式计算系统和关键技术,分析了大数据流式计算在系统容错性、负载均衡等方面面临的挑战。未来网络数据规模的扩大将给大数据流式计算带来更大的挑战,还需进一步对其关键技术进行深入研究,使大数据流式计算更好地推动社会经济发展。
-
-
吕非;
何鸣一;
宗伟康;
王立旭;
张磐
-
-
摘要:
物联网技术与配电网的不断融合对现有配电自动化主站提出了新的挑战。为了解决智能融合终端等新型物联网设备大规模接入的难题,通过研究即插即用、流式计算、时序数据存储等关键技术,在主站内建设物联接入服务实现设备的自动化接入与管理、海量采集数据的处理与存储。物联接入服务已在北京、江苏等地进行了初步应用,结果表明,所研制的服务组件能够大大缩短设备接入周期,推进了配电物联网的建设步伐。
-
-
冯勇;
李微;
袁雅涵
-
-
摘要:
本文基于山东省气象大数据云平台“天擎”,采用Storm流式处理技术,从数据收集、数据解码、数据入库、数据监控等方面设计数据处理原型,解决2021年4月标准格式切换后非考核地面气象自动站数据无法提供数据服务的难题,并与多线程处理程序进行时效对比,实践表明,基于Storm的数据处理程序更能满足现有业务系统对数据时效的要求。
-
-
王中华;
柴小丽
-
-
摘要:
随着大数据与人工智能技术的飞速发展,高性能,实时性的流式计算系统逐渐取代传统基于数据仓库的批量计算系统.Apache storm作为一款开源,高容错,实时处理的分布式大数据流式计算平台,支持任务平均分配策略,单机任务指定策略等多种任务分配方案.当任务拓扑结构中存在多个任务时,且集群中只有某些机器支持某一任务执行时,传统的任务调度方法只能实现将单一的任务分配给单一指定的机器,使得整个集群的资源没有充分的利用.通过调整任务调度策略,获得满足条件的机器队列,查看机器队列中可用工作节点,将指定任务均匀分配给可用工作节点,其他任务仍通过默认策略分配给集群中的剩余机器,实现多任务的分组调度策略.
-
-
蒲勇霖;
于炯;
鲁亮;
李梓杨;
国冰磊;
廖彬
-
-
摘要:
作为目前主流的大数据流式计算平台之一,Storm在设计之初以性能为目的进行研究而忽视了高能耗的问题,但是其高能耗问题已经开始制约着平台的发展.针对这一问题,分别建立了任务分配模型、拓扑信息监控模型、数据恢复模型以及能耗模型,并进一步提出了基于Storm平台的数据恢复节能策略(energy-efficient strategy based on data recovery in Storm,DR-Storm),包括吞吐量检测算法与数据恢复算法.其中吞吐量检测算法根据拓扑信息监控模型反馈的拓扑信息计算集群吞吐量,并通过信息反馈判断是否终止整个集群内拓扑的任务.数据恢复算法根据数据恢复模型选择备份节点用于数据存储,并通过拓扑信息监控模型反馈的信息判断集群拓扑是否进行数据恢复.此外,DR-Storm通过备份节点内存恢复集群拓扑内的数据,并根据大数据流式计算的系统延迟与能效评估DR-Storm.实验结果表明:与现有研究成果相比,DR-Storm在减少系统计算延迟、降低集群功率的同时,有效节约了能耗.
-
-
刘宇;
于炯;
蒲勇霖;
李梓杨;
张译天
-
-
摘要:
作为新一代大数据流式计算框架,Heron忽略了任务实例之间不同通信方式的差异以及节点资源利用率不均衡的问题导致系统性能下降.针对这一问题,设计了节点资源限制模型、通信开销优化模型和实例数据流关系模型,并在此基础上提出了Heron环境下基于实例重分配的传输负载优化策略(transmission load optimiza-tion strategy based on instance reallocation in Heron,TLIR-Heron).该策略包括节点资源限制算法和实例重分配算法,通过判定实例重分配条件并执行重分配算法将节点间数据流转换为节点内数据流,从而降低通信开销.实验结果表明,在三组拓扑测试下,TLIR-Heron相较于Heron默认调度策略能够降低节点间通信开销和系统的计算延迟,并提升了计算节点资源利用的均衡性.
-
-
蒲勇霖;
于炯;
鲁亮;
李梓杨;
卞琛;
廖彬
-
-
摘要:
作为流式大数据计算的主要平台之一,Storm在设计过程中由于缺乏节能的考虑,导致其存在高能耗与低效率的问题.传统的节能策略并未考虑Storm的性能约束,可能会对集群的实时性造成影响.针对这一问题,设计了资源约束模型、最优线程重分配模型以及数据迁移模型.进一步提出了Storm平台下的线程重分配与数据迁移节能策略(energy-efficient strategy based on executor reallocation and data migration in Storm,简称ERDM),包括资源约束算法与数据迁移算法.其中,资源约束算法根据集群各工作节点CPU、内存与网络带宽的资源占用率,判断集群是否允许数据的迁移.数据迁移算法根据资源约束模型与最优线程重分配模型,设计了数据迁移的最优化方法.此外,ERDM通过分配线程减少了节点间的通信开销,并根据大数据流式计算的性能与能效评估ERDM.实验结果表明,与现有研究相比,ERDM能够有效降低节点间通信开销与能耗,并提高集群的性能.
-
-
贾颉辉;
齐林海;
王红
-
-
摘要:
由于传统电压暂降传播研究方法是基于孤立时间断面的机理分析方法,无法揭示电压暂降在传播过程中的变化规律,文章提出一种基于数据驱动和流式计算的电压暂降传播特性研究方法,采用Bi-LSTM和Attention机制对电压暂降分类识别;构建基于Spark Streaming的多点并行模式识别框架,提取电压暂降实时传播轨迹;利用关联规则Apriori算法对海量电压暂降传播轨迹数据进行挖掘,规则有效性达到92.4%。该研究方法揭示了不同类型的电压暂降事件在不同电气环境下的传播特性,为电网公司制定治理决策提供了重要参考。
-
-
张奎;
付韬
-
-
摘要:
随着多接入边缘计算(MEC)与5G网络技术的融合,处理实时复杂数据变成边缘节点的重要任务.流式计算能够高效处理通过性数据,适合应用于边缘计算应用场景.对国内外相关工作进行了分析,并给出相关架构下评估边缘计算性能的若干关键指标.
-
-
Sun Xiaojuan;
孙小涓;
Shi Tao;
石涛;
Hu Yuxin;
胡玉新;
Tong Jizhou;
佟继周;
Li Bing;
李冰;
Song Yao;
宋蛲
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着空间科学重大发现的不断出现,空间科学卫星成为开展深空探测的重要手段,卫星探测数据是领域科学家开展研究的基础,因此地面应用系统数据处理的实时性要求越来越高.已有的空间科学卫星数据处理系统采用数据驱动合并作业调度的框架,数据处理实时性较差.近年来,流式计算由于适合大规模数据实时并发处理、具有分布式高效计算的特点,成为一个研究热点.本文采用流式计算思想提出了一种空间科学卫星数据实时处理方法,根据空间科学卫星数据处理特点对数据流进行抽象分析和重新定义,基于流计算框架Storm设计了数据流处理并行结构.应用本方法开发了卫星数据处理系统,对处理时间和吞吐率指标进行了测试分析,实验结果表明系统优化效果良好.
-
-
Liu Yuanqing;
刘元卿;
Chen Can;
陈灿;
Shen Hua;
沈华;
Zang Dawei;
臧大伟
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着大数据时代对数据实时性处理的需求不断提高,各大公司纷纷部署基于CPU计算平台的流式计算框架以满足推荐系统、计算广告等实时性应用的需求;但是当前基于CPU计算平台的流式计算系统在实时性和并发度上很难满足企业的需求.与传统CPU相比,FPGA具有高数据吞吐率、低延迟、低功耗、高灵活度等优势,基于FPGA这些特点本文提出了一种基于FPGA的流式计算加速框架,通过软硬件协同设计的方法来提高流式计算系统的并发度,并降低处理延迟.在硬件结构上,该计算框架将流式处理系统的核心操作通过硬件逻辑的方式映射到FPGA中,并通过FPGA中的轻量级通信协议接口实现多FPGA之间的直接通信,从而降低流式计算部件之间的通信延迟;在软件结构中,通过统一的编程接口和流量分配方式,实现流式计算框架的负载均衡等操作.经原型系统和模拟实验验证,该计算系统可以大幅度降低流式计算部件之间的数据交互延迟,在选取的测试模型中可以取得7.89倍的加速效果,处理延迟只有处理器系统的1/11.
-
-
ZHOU Wen;
周雯;
SHI Xuefei;
史雪菲;
WU Yijian;
吴毅坚;
ZHAO Wenyun;
赵文耘
- 《第十六届全国软件与应用学术会议》
| 2017年
-
摘要:
Storm支持流式数据的高性能实时计算,是一种广泛使用的流式计算框架.在Storm应用的开发中,开发人员需要针对不同的流式数据需求定制开发相应的计算模块,往往导致大量的重复工作,且难以适应数据需求的变动.如何根据流式数据格式和计算方式等数据需求,快速开发并配置相应的Storm计算环境,是提升大部分流式计算应用开发效率的重要问题.提出了流式数据需求描述方法,设计并实现了一种基于Storm的、由数据需求驱动的流式数据实时处理应用辅助开发框架,根据业务人员描述的领域数据需求自动生成符合数据处理需求的Storm实时数据处理应用.实验表明,该框架能帮助不具备Storm开发能力甚至非软件开发人员快速配置常见的基于Storm的流式计算应用,对于常见的流式数据实时处理需求具有一定的适应性.
-
-
-
WANG Yi-Xiong;
王亦雄;
LIAO Hu-gheng;
廖湖声;
KONG Xiang-Xuan;
孔祥翾;
GAO Hong-Yu;
高红雨;
SU Hang;
苏航
- 《第十四届全国软件与应用学术会议》
| 2015年
-
摘要:
复杂事件处理是支持大数据处理的流式计算平台的核心技术之一.CEStream语言作为一种新型的事件流处理语言,支持分布式环境下的复杂事件处理.该语言以XML等层次化数据作为数据模型,为复杂事件检测提供了一种正规树模式匹配功能,支持结构连接和正规式匹配.同时,针对分布式的多个事件流,能够将各个事件源模式匹配的结果按照时间顺序再一次进行正规式模式匹配,满足多源组合型复杂事件的检测需求,具有较强的事件处理能力.为了实现CEStream语言,研制了一个基于流数据处理集群和远端查询代理的执行引擎系统.该系统通过远程查询代理实现基于正规树模式的事件检测,通过流处理集群完成多源组合型复杂事件处理.实验表明该系统实现了CEStream语言,有效地限制了各个节点之间的通信量,充分利用集群的计算能力,整体性能能够满足应用需求.
-
-
-
- 《第五届全国情报学博士生学术论坛暨2015中国信息资源管理论坛》
| 2015年
-
摘要:
互联网时代,网络舆情的庞大数据规模和舆情分析的计算复杂性,使对网络舆情的分析和实时掌控变得愈发困难.面向快速、不断产生的流数据进行实时处理的分析模型,在时效性、突发性、无序性和无限性四个方面都更加符合网络舆情的自身特性.基于流式运算的网络舆情分析,具有平台优势,能够解决地方舆情分析中面临的技术门槛,提高经济效益,实现资源节约型、环境友好型的网络舆情分析。各地开展网络舆情工作时,仍存在无法通过有效的技术手段及时获取、充分利用与安全存储信息的情况;各部门或单位独立运作也增加了更高层机构区分、筛选和剔除信息的工作任务。平台服务中,各地无需反复建设,通过多地合作开发或者国家统一布局,在网络终端即可获取应用服务,提升资源利用率的同时降低了技术门槛。
-
-
-
马鸣
- 《中国地球物理学会信息技术专业委员会2018地球物理信息前沿技术研讨会》
| 2018年
-
摘要:
地球物理学的研究范围包括地质、地震、海洋、大气、空间、地电、地磁、重力和物探等多个学科领域,其研究过程包含了探测监测、资料传输、数据处理、成果展示等多个步骤.地球物理学在多个研究领域及其过程都表现出对大数据、云计算、人工智能等新技术的应用需求.在某些特定场景,如地震、大气、空间的监测,地球物理学监测数据的处理分析时效性会显得格外重要.地震监测预警尤其突出,目前的预警时效性通常以秒为衡量单位.
-
-
马鸣
- 《中国地球物理学会信息技术专业委员会2018地球物理信息前沿技术研讨会》
| 2018年
-
摘要:
地球物理学的研究范围包括地质、地震、海洋、大气、空间、地电、地磁、重力和物探等多个学科领域,其研究过程包含了探测监测、资料传输、数据处理、成果展示等多个步骤.地球物理学在多个研究领域及其过程都表现出对大数据、云计算、人工智能等新技术的应用需求.在某些特定场景,如地震、大气、空间的监测,地球物理学监测数据的处理分析时效性会显得格外重要.地震监测预警尤其突出,目前的预警时效性通常以秒为衡量单位.
-
-
-
-
-
- 上海凯岸信息科技有限公司
- 公开公告日期:2022.04.01
-
摘要:
本发明公开了一种基于分布式流式计算引擎的实时风控变量计算方法,在该计算方法中包括:数据源配置模块:用户配置各种计算依赖的数据源;变量定义模块:可以用SQL语言来开发各种变量;变量计算模块:根据计算的请求从预先配置的数据源中抓取数据,构建内存表,把相关的变量池中的所有SQL全部执行一遍,并输出计算结果;本发明提供的基于分布式流式计算引擎的实时风控变量计算方法,采用本发明研发的变量计算引擎和系统,熟悉SQL语言的人员(如业务人员和开发人员),都能通过系统来定义变量,大大缩短变量开发周期,节省成本。
-
-
-
-
-
-