您现在的位置: 首页> 研究主题> 离群点

离群点

离群点的相关文献在1986年到2022年内共计287篇,主要集中在自动化技术、计算机技术、电工技术、无线电电子学、电信技术 等领域,其中期刊论文234篇、会议论文8篇、专利文献86139篇;相关期刊144种,包括吉林大学学报(理学版)、电子学报、电脑知识与技术等; 相关会议8种,包括2013年贵州省计算机学会年会、2010年中国自动化学会华东六省一市学术年会、第二十届全国数据库学术会议等;离群点的相关文献由788位作者贡献,包括张忠平、王靖、范英铭等。

离群点—发文量

期刊论文>

论文:234 占比:0.27%

会议论文>

论文:8 占比:0.01%

专利文献>

论文:86139 占比:99.72%

总计:86381篇

离群点—发文趋势图

离群点

-研究学者

  • 张忠平
  • 王靖
  • 范英铭
  • 贾润达
  • 马慧芳
  • 周傲英
  • 孙志挥
  • 彭勃
  • 李威
  • 毛志忠
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 郑剑; 冷碧玉
    • 摘要: 针对异常离群点对k-means‖算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means‖算法。标记离群点,降低离群点对k-means‖算法聚类精确度的影响,将差分隐私应用于k-means‖聚类算法中保护聚类数据隐私。在选择聚类初始中心点和迭代求取均值中心点的过程中,应用拉普拉斯机制注入噪声,解决数据隐私泄露的问题。通过隐私预算动态变化对聚类结果准确性的影响及同类算法对比实验分析验证,DPk-means‖算法能够提供更高的隐私保护水平且保证聚类结果的准确性。
    • 王超; 杨洁
    • 摘要: 电力负荷具有复杂性、分散性以及时变性等特点,变电站负荷特性分类能够为典型变电站的负荷建模提供依据。其中大数据分析及聚类分析方法在电力负荷特性分析中发挥了重要作用。论文对比了各类聚类分析方法,针对k-means算法对于孤立数据(离群点)敏感等缺点,考虑到变电站负荷数据的分散性,提出一种改进型k-means算法。该算法首先剔除离群点,再找出最佳聚类中心数目并进行分类。实验结果表明,该算法可以使变电站负荷特性的聚类效果进一步提高,提高电力负荷分析与建模的精准度。
    • 王森; 刘琛; 邢帅杰
    • 摘要: 聚类分析是数据挖掘的重要技术,而在5G时代,海量的数据维度高、数据集大,利用K-means算法易受离群点的影响,且K值、初始聚类中心的选取影响聚类结果的稳定性和准确率,甚至导致聚类陷入局部最优,对K-means算法的改进受到众多研究者的关注。主要对K-means聚类的研究现状进行归纳总结。首先,介绍K-means算法的思想原理;其次,针对初始聚类中心点的选取、K值确定、离群点对现有改进算法进行基于密度和距离的分类总结,并对各个改进算法的优势和缺陷进行分析;最后对K-means算法未来可能的研究方向和趋势进行展望。
    • 季静静
    • 摘要: 研究基于TCM-KNN算法的网络入侵检测方法,分析与预处理网络入侵数据,提取数据特征,结合深度行为分析方式,构建网络入侵行为检测模型,引入TCM-KNN算法,计算网络入侵离群点,设计网络入侵检测步骤,实现网络入侵检测方法设计。
    • 李青青; 马慧芳; 李举; 李志欣; 姜彦斌
    • 摘要: 社区搜索是备受关注的网络分析任务之一,旨在搜寻包含查询节点的局部社区.现有大多数社区搜索方法多面向简单网络且仅能定位查询节点所在社区,未能在搜索过程中考虑用户偏好.为实现利用用户偏好指导搜索过程并搜寻用户感兴趣的多社区,设计了属性网络中结合用户偏好的社区搜索和离群点检测方法,旨在通过较少的查询节点有效的捕获用户偏好并自动探索网络中的社区,同时识别社区中离群点.具体而言,通过编码查询节点及其邻居间的显式交互关系和相似属性以突出局部结构,利用其来挖掘潜在查询节点候选集成员.在查询节点候选集上定义平均划分相似度以推断属性子空间为用户潜在兴趣.采用属性和结构约束来搜索网络中的多社区和离群点.此外,真实数据集和人工数据集上的大量实验证明了所提方法的有效性.
    • 张忠平; 李森; 刘伟雄; 刘书霞
    • 摘要: 针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距离乘积的方式自动选取聚类中心。此外,定义了向心相对距离、快速密度峰值聚类离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与一些经典和新颖的算法进行对比实验,从正确性和时间效率上验证了所提算法的有效性。
    • 张忠平; 邓禹; 刘伟雄; 张玉停
    • 摘要: 针对现存离群点检测算法和剪枝方法存在算法精确度较低和剪枝程度小的问题,提出了一种基于近邻差波动因子的离群点检测方法。该方法首先依据离群点的相互k近邻(MUN)点数远小于参数k这一特点,提出了一种基于近邻关系的剪枝方法;然后提出近邻差的概念来刻画数据对象与其邻居点的分布特征,在变化的参数k下,离群点和正常点的近邻差的变化不同;最后采用近邻差波动衡量每个数据点的离群程度,进而检测出离群点。人工数据集和真实数据集下的实验结果表明,该算法能够有效且较为全面地检测出离群点
    • 龚思聪; 徐洁; 万鸣华
    • 摘要: 样本点的边界信息对于分类具有重要意义。针对于边界Fisher分析(MFA)和局部敏感判别分析(LSDA)构造本征图和惩罚图所利用的样本点边界信息,在一些情况下并不能很好地表征不同类样本点的可分性,提出了一种新的图嵌入降维算法——边界流形嵌入(MME)。MME算法根据样本点的标签信息,寻找距离每个样本点最近的异类边界子流形,再返回本类中寻找距离异类边界子流形最近的同类边界子流形,从而定义出不同类样本间密切联系的同类边界邻域和异类边界邻域。通过最大化所有成对的边界子流形之间的距离,MME算法可以得到更具有鉴别意义的低维特征空间。同时,MME算法能将徘徊在边界的离群点收入到边界邻域里,这对减弱离群点给算法带来的负面的影响有一定的帮助。在人脸数据库上的实验结果表明了MME算法提取的低维特征能够提升分类的准确率。
    • 罗晓媛; 赵丽艳; 刘君; 邹栋
    • 摘要: 在大量的网络数据中,可能隐藏着少许攻击序列,离群点是由异常机制产生,不服从数据的普遍分布规律,设计一个基于神经网络的多尺度时序数据离群点挖掘方法.采用对象与其类别聚类中心的相似度来测量对象属于聚类的程度,确定检测对象的邻域,采用神经网络技术对多尺度时序数据离群点挖掘,初始化BP神经网络,基于网络的实际输出和预期输出,判断网络的停止条件,不断迭代上述基于神经网络的计算过程,直至所有的离群点挖掘完毕,以此完成多尺度时序数据离群点挖掘.实验结果表明,提高了挖掘准确性,还提高了离群点挖掘效率.
    • 赵福龙
    • 摘要: 针对井下作业人员轨迹数据信息多维度和稀疏性等问题,提出了基于离群点的异常轨迹筛选ZFMTRAOD算法,首先通过对轨迹子段建立R-tree索引提升检索速度,然后利用离群检测思想对邻域半径内轨迹子段的数量和平均时间判断轨迹是否异常,最后利用井下作业人员的轨迹数据对算法的性能进行比较,发现基于离群点的井下人员轨迹分析算法不仅能判别出井下作业人员异常轨迹的类型,还提高了异常轨迹判别的准确率.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号