随机森林算法
随机森林算法的相关文献在2005年到2023年内共计633篇,主要集中在自动化技术、计算机技术、电工技术、农业基础科学
等领域,其中期刊论文435篇、会议论文13篇、专利文献80942篇;相关期刊342种,包括山地学报、农业工程学报、农业机械学报等;
相关会议12种,包括第15届全国软件与应用学术会议(NASAC2016)、第三届CCF国际自然语言处理与中文计算会议、第十二届全国计算(机)化学学术会议等;随机森林算法的相关文献由2323位作者贡献,包括荆文龙、彭涛、李华等。
随机森林算法—发文量
专利文献>
论文:80942篇
占比:99.45%
总计:81390篇
随机森林算法
-研究学者
- 荆文龙
- 彭涛
- 李华
- 杨骥
- 刘杨晓月
- 刘贞报
- 夏小琳
- 张晨
- 张超
- 李勇
- 李强
- 王浩
- 胡瑾
- 胡秀珍
- 刘斌
- 刘鹏
- 孙林
- 张天龙
- 张海辉
- 李磊
- 林琳
- 梁慧玲
- 江波
- 王康
- 王林汝
- 王栋
- 蔡佳成
- 蔡冰
- 贺星
- 贾少春
- 赖燕华
- 赵敏
- 辛萍萍
- 陈涛
- Constantine A.Stamatopoulos
- Manish Kumar Jindal
- Munish Kumar
- Rupinder Pal Kaur
- 丁凯
- 万代
- 严月浩
- 严蕾
- 付晓伟
- 付波霖
- 代芹芹
- 任小甜
- 何健伟
- 何宏昌
- 何怡刚
- 何文杰
-
-
查道贵
-
-
摘要:
为了克服传统机器学习算法及其框架的弊端,深入分析了K-均值算法与随机森林分类算法,提出了改进的AKM与ARF算法,建立了基于Spark平台技术的AMLF机器学习应用框架.由验证结果可知,AKM算法在各数据集中的分类准确率皆接近100%,具有较强的数据聚类能力,再者AKM算法在各数据集中的加速比皆较高,因而可升级性亦较强.而ARF验证结果显示,其不仅分类准确率较高,且可升级性较强.
-
-
张文涛;
丑永新;
李鑫;
丁凯;
杨苗
-
-
摘要:
针对常用基于指纹、人脸等特征的身份识别技术存在容易伪造等问题,设计了一种基于脉搏信号的身份识别系统。该系统包括上位机和下位机模块,下位机以STM32为核心进行脉搏信号的AD转换和数据打包,并通过WiFi模块将数据无线发送到上位机。采用PC作为上位机,基于LabVIEW软件开发了人机交互界面,对接收的脉搏信号进行滤波、分割、模型参数识别、特征向量提取,并基于随机森林算法训练身份识别分类器。招募20名试验对象对所研制系统的准确性进行评估,结果表明身份识别的准确率达到95%。该系统的实现可以为基于脉搏信号的身份识别研究提供有益借鉴。
-
-
覃卫坚;
何莉阳;
蔡悦幸
-
-
摘要:
使用1991-2021年7-9月广西90个地面气象观测站降水量、NCEP/NCAR月再分析资料和国家气候中心BCC_CSM1.1气候模式回报资料,研究建立基于粒子群-神经网络、随机森林算法的广西后汛期降水气候预测模型,并对2016年-2021年预测进行应用试验。结果表明,基于粒子群-神经网络、随机森林算法的后汛期降水预测Ps得分比逐步回归方法分别提高了2.78分、2.5分,比气候模式分别提高了29.22分、28.94分,预测能力有明显的提升。
-
-
吕向林;
姬世保;
仇亚琴;
郝春沣;
杨月
-
-
摘要:
针对汾河流域河川径流量、河川基流量急剧减少和流域内生态环境恶化严重的问题,根据汾河流域上游控制站兰村水文站实测径流量数据,对比了数字滤波法、时间步长法对汾河流域基流分割的适用性,分析了基流变化特征及主要影响因素,并应用随机森林算法对影响因素重要性进行了评价。结果表明:数字滤波法(α=0.925)适宜汾河流域基流分割,可以客观反映汾河流域基流情况;河川基流量在1956—2016年呈极显著下降趋势,在2008年之后有所缓解,突变发生在1981年和2008年;汾河流域上游基流年内分布呈典型双峰型结构,峰值流量从之前的8月转移至3月,2000—2009年平均基流量仅为1956—1959年的1/8;降水量减少对基流量减少的贡献率仅为9.96%,不考虑气温影响时人类活动对基流量减少的贡献率为83.19%;人类活动中煤矿开采和地下水开采是造成基流减少的主要因素。
-
-
徐礼金;
贺艳芳
-
-
摘要:
针对无线传感网络攻击流量阻断存在攻击流量检测准确率较低、阻断效果较差的问题,构建了一种基于随机森林算法的无线传感网络攻击流量阻断模型。基于字符(单词)的词频矩阵,利用TF-IDF算法将有效载荷的特征自动提取出来;根据特征结果使用随机森林算法通过词频矩阵对网络流量实行分类,基于分类结果对网络中的流量攻击实现溯源,完成异常无线传感网络检测;利用流表的报文过滤实现无线传感攻击流量的阻断。实验结果表明,该模型在检测攻击流量时,准确率最高可达100%,调和平均数最高为99.18%,错误率最高仅为7.3%,假阳性率最高仅为5.5%,同时能够有效阻断网络攻击流量,在较短时间内将网络恢复至正常,具有良好的攻击流量检测效果和攻击流量阻断效果。
-
-
冯华伟
-
-
摘要:
对财务异常数据的准确识别是保障医疗财务系统正常运转的重要途径。传统的检测方法使用统计学方法进行验证,该方法虽可以直观快速地筛选出异常数据,但是无法处理当前海量的数字化数据。针对上述问题,文中对传统随机森林模型进行修正,加入方差项以增强模型效果。同时,使用深度RNN网络对经过随机森林处理后的数据进行训练。实验结果表明,加入方差项的随机森林模型的F1值相较于其他算法均有2%以上的提升。同时,准确率和召回率也维持在较高的水平,测得的AUC值在对比算法中也是最高的。由此证明,文中所提出的深度神经随机森林模型具有良好的识别性能,同时也可对异常财务数据进行有效的校验。
-
-
樊迪
-
-
摘要:
为找出翻译文本时因语义理解不够深入导致文本原本思想出现偏差的语句,提出基于随机森林的翻译文本误译语句自动识别方法。依据分类与回归树选择最优特征,将随机属性引入决策树训练中,基于随机森林对模型实施训练和分类,提高模型检测的准确性。通过特征选择利用二维信息熵自动识别误译语句,引入映射差分特征空间特征量,优化各差分特征的二维信息熵,确定差分特征识别的阈值,同时对冗余差分特征滤波,最终完成翻译文本误译语句自动识别。实验结果表明,该自动识别方法简单、高效、准确、适用性强。
-
-
吕中秋;
魏波
-
-
摘要:
针对传统检测方法存在振动信号重构误差大,导致检测误报警率高的问题,提出基于随机森林算法的机械加工过程设备叠加振动检测方法。对含有噪声的机械加工过程设备振动信号进行EMD分解,获取内蕴模态函数,通过自适应阈值进行信号重构,消除振动信号中的噪声。经过去噪后,采用随机森林算法将变量集划分为多个子集,在每个子集中通过典型变量分析方法,提取叠加振动数据的动态特征以及相关关系,通过不相关典型特性训练决策树,并且构建DOCRF模型,求解样本相似度,实现机械加工过程设备叠加振动检测。仿真实验结果表明,所提方法的检测振动信号的重构误差率在1.2%以下,误报警率均在0.18%以下,可以获取更加准确的检测结果。
-
-
马砺;
黄霄;
高建勋;
苗建敏;
张鹏宇
-
-
摘要:
为了对城市区域火灾进行预测和有效防控,以西安市某城区为例,对近3年火灾历史数据进行核密度分析和小波分析,研究该区域火灾事件时空分布规律,采用机器学习算法建模以预测该区域内火灾事件发生概率。结果表明:在区域空间上,中心城区火灾“热度”高,向郊区延伸“热度”呈现降低态势;在时间域上,火灾频次在14 a的时间尺度上周期性最强,在9 a时间尺度上呈现明显的季节波动性和周期性,冬季和夏季火灾频次较高;老旧小区、高层小产权房及餐饮场所火灾发生概率最大,其概率密度分别为:303.15,245.89,105.3;随机森林预测模型预测值与实际值吻合度较高(E_(RMSE)<0.068,E_(MAE)<0.0467,R^(2)=0.88),与传统的BP神经网络模型相比具有更高的预测精度和泛化能力,研究结果为城市火灾精准防控提供一定的参考价值。
-
-
邓玉睿;
程旭东;
唐芳;
周勇
-
-
摘要:
阐明真菌的生长机理对于减少储粮损失具有重要意义。在影响真菌孢子生长的因素中,最重要的因素是环境温度、稻谷含水量和储藏时间。因此,本研究基于实验数据建立了孢子数和温度、含水率和储藏天数等几个重要因素之间的多元线性回归模型。为了建立更准确的模型,我们将随机森林算法引入稻谷储藏过程中的真菌孢子数目预测模型,用于预测储藏过程中不同温度、含水率和储藏天数下的孢子数。对于随机森林模型,99%的预测值和其对应的原始数据可以达到同一数量级,对于预测孢子数具有很高的准确性。此外,我们绘制了预测曲面图,将环境条件控制在低风险区域可以有效降低稻谷在储藏过程中的霉变风险。
-
-
高洪利
- 《中国烟草学会2017年学术年会》
| 2017年
-
摘要:
卷烟销量预测是实现精益管理的一种有效技术手段.针对卷烟销量难以准确预测的问题,本文提出了一种基于随机森林模型的卷烟销量预测算法.通过分析得出卷烟销量的影响因素包括自身因素、宏观因素、突发因素和其他因素.在此基础上获得观测数据,对观测数据进行归一化和卡尔曼滤波,利用随机森林算法建立卷烟销量参数的回归预测模型,并提出了存在突发因素时的预测方法.利用2011年至2015年的北京市卷烟销售的实际数据,分别预测了《北京控制吸烟条例》出台前和出台后后的卷烟销量参数,验证了提出预测算法的有效性.依托预测结果,深入分析了《公共场所控制吸烟条例》对卷烟销量的影响,得出结论:相对于一类烟,《公共场所控制吸烟条例》对四类五类烟的影响较小.
-
-
GAO Lin;
高林;
LIU Ying;
刘英;
SHENG Zi-Hao;
盛子豪
- 《2016年第27届中国过程控制会议》
| 2016年
-
摘要:
单棵决策树有容易过度拟合的缺点,随机森林算法随机选择多个决策树构成森林,算法分类结果由这些决策树投票得到,在运算量没有显著提高的前提下提高了预测精度,是一种目前比较流行的组合分类器算法.随机森林算法不仅可以用来做分类,也可用来做回归预测,是机器学习、计算机视觉等领域内应用极为广泛的一个算法,但是在交通领域的应用较少.将随机森林分类算法用于交通状态判别,利用实测数据进行模型训练和验证,并用袋外数据计算判别准确度,实验结果表明该方法具有可行性,为交通状态判别提供了一种新思路.
-
-
白晓永;
李汇文;
王世杰
- 《中国矿物岩石地球化学学会第17届学术年会》
| 2019年
-
摘要:
明确区域乃至全球碳酸盐岩化学风化碳汇的量级、空间格局及演变特征对解决陆地遗失碳汇难题、碳循环系统收支不平衡等问题具有极其重要的意义.为此,本文利用长时间高精度生态气象水文栅格数据以及中国和周边44个流域的监测数据,基于随机森林算法及碳酸盐岩最大潜在溶蚀模型,对中国碳酸盐岩中最主要的岩石类型即石灰岩在2000—2014年的化学风化碳汇进行估算,并对其空间格局、演变特征及趋势进行系统分析.
-
-
霍龙浩;
吴茜;
李尧辉
- 《2018广东通信青年论坛》
| 2018年
-
摘要:
传统依赖单一紧急告警的监控手段存在一定的局限性.随着大数据技术发展及网络数据的丰富,新的故障监控、发现手段成为趋势.提出一种基于大数据机器学习算法的高价值故障特征关联挖掘方法,该方法通过计算告警网元是否工程网元、网元各级告警平均时长及告警量比平日增幅等11项关键属性,利用随机森林算法训练预测器,实现对实时网络数据的计算挖掘、预判输出高危网元,进而对高危网元进行核查处理.经过交叉验证,该方法预判准确率达88.06%,能有效从多维网络特征实现网络体检、高危网元挖掘,达到提升网络主动监控能力、增强网络稳定性的效果.
-
-
蔡丽华
- 《福建省电机工程学会2017年学术年会》
| 2017年
-
摘要:
随着"互联网+"时代的来临,对于有着庞大客户群的供电企业来说,建设并推广电子渠道尤为重要.本文提出了客户渠道偏好的研究思路和方法,结合业务现状、先进的IT技术和统计挖掘理论,利用RFM模型和随机森林算法,建立客户的事实渠道偏好模型和潜在电子渠道偏好模型,并结合业务特点和用户的业务使用习惯,设计差异化的引流措施和精准的营销方案,为供电企业实现优化渠道提高效率的目标提供支持.
-
-
徐廷喜;
吴斌;
黄小清;
杜志敏;
晋欣桥
- 《上海制冷学会2017年学术年会》
| 2017年
-
摘要:
空调系统制冷剂泄漏故障常用诊断方法是利用经验规则进行判断,论文首先利用经验规则表挑选机器学习特征,然后分别利用xgboost算法和随机森林算法训练诊断模型,并对比两种算法模型精度以及模型的泛化能力.两种算法模型的测试精度均达99%以上,且模型泛化误差均小于0.01,克服了常规机器学习模型过拟合的问题,并能够区分不同程度故障,有利于进一步指导研究多种故障类型问题.
-
-
-
-
CHEN Zhenpeng;
陈震鹏;
LU Xuan;
陆璇;
LI Huoran;
李豁然;
LIU Xuanzhe;
刘譞哲
- 《第15届全国软件与应用学术会议(NASAC2016)》
| 2016年
-
摘要:
近年来,随着智能手机的飞速发展,移动应用的数目也快速增长.预测用户的偏好不仅应用市场进行应用排名提供重要依据,同时更关系到应用开发者的实际获益.为此,本文选取应用的被卸载次数与其被下载次数的比值作为用户偏好的隐式反映,用户对应用的评价(喜爱率)作为用户偏好的显式反映.基于豌豆荚应用市场提供的2014年5月至9月的大规模真实用户使用数据,选取9795个安卓手机应用作为研究对象,进行分析.从7个维度定义了可能影响用户对应用偏好的30种特征,并对每个应用进行特征提取.基于定义的特征,使用随机森林算法训练分类器,按照卸载/下载比率或喜爱率的高低对应用进行划分,并找出显著影响卸载/下载比率、喜爱率的特征.
-
-
LIU Kan;
刘勘;
YUAN Yunying;
袁蕴英;
LIU Ping;
刘萍
- 《第三届CCF国际自然语言处理与中文计算会议》
| 2014年
-
摘要:
针对网络上机器用户大量散布谣言,发布虚假信息,误导网民舆论,严重影响网络环境的问题,以微博中的机器用户为研究对象,结合其自动化程度高、伪装能力强、信息发布有针对性的特点,从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标,利用信息熵、内容重复率等8个指标构建微博用户的特征向量,通过随机森林算法设计微博中机器用户的识别模型.最后,在真实的新浪微博数据集上进行验证,结果表明本模型识别机器用户的准确度达到96.7%,可以有效地区分微博中的机器用户和普通用户.