您现在的位置: 首页> 研究主题> K-means算法

K-means算法

K-means算法的相关文献在1998年到2022年内共计1392篇,主要集中在自动化技术、计算机技术、电工技术、无线电电子学、电信技术 等领域,其中期刊论文1331篇、会议论文43篇、专利文献51573篇;相关期刊580种,包括人天科学研究、科学技术与工程、电脑知识与技术等; 相关会议41种,包括第八届中国卫星导航学术年会、2017第十九届中国科协年会、辽宁省通信学会2015年信息网络与信息技术年会等;K-means算法的相关文献由3497位作者贡献,包括易云飞、黄敏、陈英等。

K-means算法—发文量

期刊论文>

论文:1331 占比:2.51%

会议论文>

论文:43 占比:0.08%

专利文献>

论文:51573 占比:97.40%

总计:52947篇

K-means算法—发文趋势图

  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 荀超; 陈伯建; 吴翔宇; 项康利; 林可尧; 肖芬; 易杨
    • 摘要: 现有方法预测电力短期负荷时忽略了对其进行聚类优化处理,导致预测耗时较长,短期负荷预测精度偏低。为此,提出一种基于改进K-means算法的电力短期负荷预测方法。该方法利用改进后的K-means算法聚类处理电力负荷大数据,使用聚类后获得的训练样本构建循环神经网络RNN拓扑结构,然后通过对RNN神经网络模型设置最优权值,实现电力负荷的短期预测。实验结果表明,所提方法具有高预测效率和高短期负荷预测精准度。
    • 高巍; 马辉; 李大舟; 王淮中
    • 摘要: 传统的聚焦爬虫不能很好地处理所爬取的数据,很难从原始数据中提取有价值的信息,同时,大量冗余的数据对计算机的存储能力带来了挑战.本研究提出了一种基于抽取式文本摘要技术的爬虫算法,将改进的TextRank算法应用于网络爬虫中,从而解决用户如何在快速浏览和吸收特定领域新闻所有内容的同时节约计算机内存资源的问题.本研究用Glove模型训练数据集,对文本进行词向量表示,将k-means算法思想融入TextRank算法中,提出一种改进的TextRank模型.实验结果表明:提出的改进的TextRank模型抽取得到的摘要质量优于传统TextRank和TopicModel模型,其综合评价指标达到了52.21%,比TopicModel模型高10.29%,比传统TextRank模型高15.55%;结合了抽取式文本摘要技术的聚焦爬虫与传统聚焦爬虫爬取的文件占用空间比为1:12,解决了爬虫会占用大量计算机资源的问题.
    • 丁知平; 林昆
    • 摘要: 大数据背景下,数据量规模化的增长,数据的采集、传输、存储等环节都会存在数据泄露的安全隐患。从大数据的基本原理、现状出发,对数据信息的隐私安全做了相关应研究,并在此基础上,提出了一种改进的差分隐私直方图发布算法来对数据信息进行隐私保护。
    • 叶枫; 朱彩霞
    • 摘要: 近年来,如何提高不平衡数据分类精度的问题受到广泛关注。对于不平衡数据问题主要从数据集和算法两方面来解决。研究提出一种基于k-means++聚类算法和过采样的堆叠算法(K-SMO-Stacking)。在Stacking集成算法基础上将k-means++聚类算法应用到分类过程当中,形成新的少数类和多数类,用过采样方法生成更多更密集的少数类样本,均衡数据集后再进行回归训练。实验在多份金融不平衡数据集上进行验证,结合AUC、F1-score和G-mean主流评价指标,结果显示该算法在不平衡金融数据中的分类性能有显著提高。
    • 刘浩然; 范伟伟; 徐永胜; 林文树
    • 摘要: 【目的】探索不同树种在样地和单木尺度上无人机激光雷达点云数据的单木分割效果,选取哈尔滨城市林业示范基地阔叶林(水曲柳)和针叶林(樟子松)两块样地为研究对象,对样地内树木点云进行单木分割并评价其分割效果,为后续单木结构参数的提取提供数据支持,同时丰富森林资源信息的调查手段。【方法】通过无人机激光雷达获得样地树木点云数据,然后分别采用改进的K均值聚类算法和基于相对间距的阈值分割算法对水曲柳和樟子松样地进行单木点云数据分割。其中,水曲柳样地点云数据处理采用改进的K均值聚类算法,通过树干点云位置推算初始聚类中心,减少因树冠重叠导致的错误分割;樟子松样地点云数据处理则采用基于相对间距的阈值分割算法,通过设定多条阈值规则并利用动态最大值滤波器对树顶进行精确探测,提高算法的分割精度。最后,基于样地和单木点云完整度两个方面对点云数据分割效果进行评价。【结果】1)从样地尺度来看,水曲柳和樟子松样地单木识别率分别为0.91和0.87,相应的调和值(F)分别为0.91和0.88,结果显示单木分割的整体效果较好。水曲柳样地召回率(r)为0.87,精确率(p)为0.95,算法分割过程中产生的错误分割较少。樟子松样地算法分割的单木也多为正确分割(r=0.82、p=0.94),其分割误差主要来自于单木欠分割,过分割现象相对较少。2)从单木点云分割的完整程度来看,水曲柳样地的单木平均正确分割率为75.6%,点云平均欠分割率为24.3%,平均过分割率为18.5%,单木点云的最大错误分割率为31.8%,不同单木之间分割精度有较大差异;樟子松样地的单木分割精度较稳定,平均正确分割率达84.1%,平均欠分割和过分割率分别为16.3%和9.0%,表明单木点云不存在大量错误分割的情况。【结论】基于树木形态结构特征改进了两种优化单木点云数据分割算法,两种算法下分割的森林样地单木精度在不同评价尺度中表现均较好,对林中树木出现的树冠重叠、遮挡、偏移等现象均有一定的辨别能力,实现了森林样地树木点云数据的单木精确分割。
    • 王琛焱; 徐珑婷
    • 摘要: 针对电动汽车的充电需求以及未知的实时电价,探讨完整的充电方案,提出一种电动汽车充电站能量管理在线算法,建立由风能、太阳能及电网供电的充电站充电成本优化问题。在电价、风能和太阳能发电量等系统信息已知的条件下,采用离线算法即遗传算法搜索成本最小化问题的全局最优解。由于遗传算法需要已知所有时隙的系统信息,但这些信息是随机分布的,因此提出仅依赖当前信息的在线算法,即基于K-means聚类算法的在线能量管理方案。仿真结果表明,提出的K-means在线算法获得的平均成本优于遗传离线算法,且K-means在线算法收敛速度更快。因此,在电价、风能和太阳能发电量未知的情况下,采用K-means在线算法可控制充电成本。
    • 姚柳成; 邹智宏
    • 摘要: 智能网联背景下的车联网数据分析与应用对提升交通智能化有重要影响。为了加快交通智能化进程,文章对车联网数据应用过程中存在的数据冗余问题进行研究。以采集的车联网数据为研究对象,驾驶行为特点分类辨识为研究目标。采用相关分析与主成分分析方法对数据进行冗余筛选与降维,使用k-means聚类算法对驾驶行为特点进行分类辨识。研究结果表明,使用数据降维的方法可以降低车联网数据的相关冗余性,驾驶行为特点分类辨识结果表明其特点可分为三类驾驶行为。研究提升了车联网数据的应用价值,也为交通智能化提供了相关的支持。
    • 赵万旗; 孙皓月
    • 摘要: 该文以某小区居民的智能电表用电功耗数据为研究对象,结合K-means聚类算法对其进行聚类,分析居民的用电行为规律。首先对居民原始用电功耗数据进行特征归一化处理,然后采用肘方法确定初始聚类数,最后,利用聚类算法对该小区居民的用电负荷特征曲线进行聚类,分析其用电行为。实验结果表明,K-means算法在对居民用电负荷曲线聚类时具有较高的准确度,电网企业能够据此分析居民用电行为,提供用电个性化服务。
    • 顾偲雯; 沈新逸; 王加安; 句爱松
    • 摘要: 学生的学习成绩是其对课程学习的掌握程度的一个重要体现,也是反映教师教学效果好坏的一个标准。怎样使用学生某一阶段的成绩提炼分析出有用的信息来提高之后的教学方案与学生成绩有着至关重要的意义。在此背景下,文章将k-means算法与基于分层方法的层次聚类应用于学生成绩的分析中。相比传统的成绩评价标准弥补了其不能根据外部影响而进行灵活改变的短板。最后比较两种算法的优缺点并对学生的综合成绩与单科成绩进行分析,通过宏观分析找出影响学生成绩的因素和各类学生在不同学科上的薄弱点。
    • 张帅; 曲娜; 郑天芳; 胡从强; 李玮祯
    • 摘要: 在正常工作和发生故障时对常见的电阻、电感串并联电路以及整流电路使用Cassie电弧模型进行simulink仿真,得到了不同电路和不同状态时的电流数据。在线性负载电路中,电弧故障电流具有明显的零休特征,但是非线性负载电路不具有此特征。应用快速傅里叶算法进一步分析了其不同状态下的电流谐波变化。利用k-means聚类算法理论建立了电弧故障检测模型,将电流的奇数高次谐波占基波分量作为特征值带入算法,并通过70组数据对模型进行测试,测试结果证明了该模型的有效性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号