离群点
离群点的相关文献在1986年到2022年内共计287篇,主要集中在自动化技术、计算机技术、电工技术、无线电电子学、电信技术
等领域,其中期刊论文234篇、会议论文8篇、专利文献86139篇;相关期刊144种,包括吉林大学学报(理学版)、电子学报、电脑知识与技术等;
相关会议8种,包括2013年贵州省计算机学会年会、2010年中国自动化学会华东六省一市学术年会、第二十届全国数据库学术会议等;离群点的相关文献由788位作者贡献,包括张忠平、王靖、范英铭等。
离群点—发文量
专利文献>
论文:86139篇
占比:99.72%
总计:86381篇
离群点
-研究学者
- 张忠平
- 王靖
- 范英铭
- 贾润达
- 马慧芳
- 周傲英
- 孙志挥
- 彭勃
- 李威
- 毛志忠
- 王茜
- 颜学峰
- 万迪明
- 严云洋
- 于杰华
- 任俊霞
- 何玉敖
- 何鸣
- 储汪兵
- 冯梦园
- 冯结青
- 刘丛
- 刘伎昭
- 刘伟雄
- 刘安斐
- 刘明术
- 刘昱
- 刘海姣
- 刘继文
- 刘艳哲
- 刘颖
- 史集猛
- 吴保元
- 吴博
- 吴国庆
- 周洋
- 唐志刚
- 孙优贤
- 孟维亮
- 季明明
- 宋玮琼
- 尹新亮
- 崔莉
- 张亚萍
- 张俊宝
- 张健沛
- 张先飞
- 张小斐
- 张强
- 张晓鹏
-
-
郑剑;
冷碧玉
-
-
摘要:
针对异常离群点对k-means‖算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means‖算法。标记离群点,降低离群点对k-means‖算法聚类精确度的影响,将差分隐私应用于k-means‖聚类算法中保护聚类数据隐私。在选择聚类初始中心点和迭代求取均值中心点的过程中,应用拉普拉斯机制注入噪声,解决数据隐私泄露的问题。通过隐私预算动态变化对聚类结果准确性的影响及同类算法对比实验分析验证,DPk-means‖算法能够提供更高的隐私保护水平且保证聚类结果的准确性。
-
-
王超;
杨洁
-
-
摘要:
电力负荷具有复杂性、分散性以及时变性等特点,变电站负荷特性分类能够为典型变电站的负荷建模提供依据。其中大数据分析及聚类分析方法在电力负荷特性分析中发挥了重要作用。论文对比了各类聚类分析方法,针对k-means算法对于孤立数据(离群点)敏感等缺点,考虑到变电站负荷数据的分散性,提出一种改进型k-means算法。该算法首先剔除离群点,再找出最佳聚类中心数目并进行分类。实验结果表明,该算法可以使变电站负荷特性的聚类效果进一步提高,提高电力负荷分析与建模的精准度。
-
-
王森;
刘琛;
邢帅杰
-
-
摘要:
聚类分析是数据挖掘的重要技术,而在5G时代,海量的数据维度高、数据集大,利用K-means算法易受离群点的影响,且K值、初始聚类中心的选取影响聚类结果的稳定性和准确率,甚至导致聚类陷入局部最优,对K-means算法的改进受到众多研究者的关注。主要对K-means聚类的研究现状进行归纳总结。首先,介绍K-means算法的思想原理;其次,针对初始聚类中心点的选取、K值确定、离群点对现有改进算法进行基于密度和距离的分类总结,并对各个改进算法的优势和缺陷进行分析;最后对K-means算法未来可能的研究方向和趋势进行展望。
-
-
季静静
-
-
摘要:
研究基于TCM-KNN算法的网络入侵检测方法,分析与预处理网络入侵数据,提取数据特征,结合深度行为分析方式,构建网络入侵行为检测模型,引入TCM-KNN算法,计算网络入侵离群点,设计网络入侵检测步骤,实现网络入侵检测方法设计。
-
-
李青青;
马慧芳;
李举;
李志欣;
姜彦斌
-
-
摘要:
社区搜索是备受关注的网络分析任务之一,旨在搜寻包含查询节点的局部社区.现有大多数社区搜索方法多面向简单网络且仅能定位查询节点所在社区,未能在搜索过程中考虑用户偏好.为实现利用用户偏好指导搜索过程并搜寻用户感兴趣的多社区,设计了属性网络中结合用户偏好的社区搜索和离群点检测方法,旨在通过较少的查询节点有效的捕获用户偏好并自动探索网络中的社区,同时识别社区中离群点.具体而言,通过编码查询节点及其邻居间的显式交互关系和相似属性以突出局部结构,利用其来挖掘潜在查询节点候选集成员.在查询节点候选集上定义平均划分相似度以推断属性子空间为用户潜在兴趣.采用属性和结构约束来搜索网络中的多社区和离群点.此外,真实数据集和人工数据集上的大量实验证明了所提方法的有效性.
-
-
张忠平;
李森;
刘伟雄;
刘书霞
-
-
摘要:
针对密度峰值聚类算法需要人工设置参数、时间复杂度高的问题,提出了基于快速密度峰值聚类离群因子的离群点检测算法。首先,使用k近邻算法代替密度峰值聚类中的密度估计,采用KD-Tree索引数据结构计算数据对象的k近邻;然后,采用密度和距离乘积的方式自动选取聚类中心。此外,定义了向心相对距离、快速密度峰值聚类离群因子来刻画数据对象的离群程度。在人工数据集和真实数据集上对所提算法进行实验验证,并与一些经典和新颖的算法进行对比实验,从正确性和时间效率上验证了所提算法的有效性。
-
-
张忠平;
邓禹;
刘伟雄;
张玉停
-
-
摘要:
针对现存离群点检测算法和剪枝方法存在算法精确度较低和剪枝程度小的问题,提出了一种基于近邻差波动因子的离群点检测方法。该方法首先依据离群点的相互k近邻(MUN)点数远小于参数k这一特点,提出了一种基于近邻关系的剪枝方法;然后提出近邻差的概念来刻画数据对象与其邻居点的分布特征,在变化的参数k下,离群点和正常点的近邻差的变化不同;最后采用近邻差波动衡量每个数据点的离群程度,进而检测出离群点。人工数据集和真实数据集下的实验结果表明,该算法能够有效且较为全面地检测出离群点。
-
-
龚思聪;
徐洁;
万鸣华
-
-
摘要:
样本点的边界信息对于分类具有重要意义。针对于边界Fisher分析(MFA)和局部敏感判别分析(LSDA)构造本征图和惩罚图所利用的样本点边界信息,在一些情况下并不能很好地表征不同类样本点的可分性,提出了一种新的图嵌入降维算法——边界流形嵌入(MME)。MME算法根据样本点的标签信息,寻找距离每个样本点最近的异类边界子流形,再返回本类中寻找距离异类边界子流形最近的同类边界子流形,从而定义出不同类样本间密切联系的同类边界邻域和异类边界邻域。通过最大化所有成对的边界子流形之间的距离,MME算法可以得到更具有鉴别意义的低维特征空间。同时,MME算法能将徘徊在边界的离群点收入到边界邻域里,这对减弱离群点给算法带来的负面的影响有一定的帮助。在人脸数据库上的实验结果表明了MME算法提取的低维特征能够提升分类的准确率。
-
-
罗晓媛;
赵丽艳;
刘君;
邹栋
-
-
摘要:
在大量的网络数据中,可能隐藏着少许攻击序列,离群点是由异常机制产生,不服从数据的普遍分布规律,设计一个基于神经网络的多尺度时序数据离群点挖掘方法.采用对象与其类别聚类中心的相似度来测量对象属于聚类的程度,确定检测对象的邻域,采用神经网络技术对多尺度时序数据离群点挖掘,初始化BP神经网络,基于网络的实际输出和预期输出,判断网络的停止条件,不断迭代上述基于神经网络的计算过程,直至所有的离群点挖掘完毕,以此完成多尺度时序数据离群点挖掘.实验结果表明,提高了挖掘准确性,还提高了离群点挖掘效率.
-
-
赵福龙
-
-
摘要:
针对井下作业人员轨迹数据信息多维度和稀疏性等问题,提出了基于离群点的异常轨迹筛选ZFMTRAOD算法,首先通过对轨迹子段建立R-tree索引提升检索速度,然后利用离群检测思想对邻域半径内轨迹子段的数量和平均时间判断轨迹是否异常,最后利用井下作业人员的轨迹数据对算法的性能进行比较,发现基于离群点的井下人员轨迹分析算法不仅能判别出井下作业人员异常轨迹的类型,还提高了异常轨迹判别的准确率.
-
-
XU Yuan-yuan;
许圆圆;
SONG Bing;
宋冰;
TAN Shuai;
谭帅;
SHI Hong-bo;
侍洪波
- 《2016年第27届中国过程控制会议》
| 2016年
-
摘要:
在开展过程监控的离线建模的工作中,当训练数据集含有离群点时,高斯混合模型(Gaussian Mixture Model,GMM)不能准确刻画多模态数据特征.为解决GMM易受离群点影响的问题,本文提出了LoOP-GMM的过程监控方法.首先,用局部离群概率(Local Outlier Probability,LoOP)算法在数据预处理阶段检测并剔除训练数据集中的离群点,并用GMM算法建立离线模型,同时根据后验概率将训练数据集进行聚类.其次,考虑到在线样本的离群概率,构造一个新的全局概率指标作为统计量并用于多模态过程故障监控.最后,通过数值仿真和连续搅拌釜反应器(Continuous Stirred Tank Reactor,CSTR)过程验证了本文所提方法的有效性.
-
-
-
周红福;
钱卫宁;
魏藜;
周傲英
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本文针对高维种属属性的数据集,提出了一种有效的在子空间中进行局部离群点检测的EDOLOIS算法.算法利用子空间和原空间固有的数学关系,结合LOF定义的特点,利用原空间的原始数据来高效地计算出子空间的局部离群系数.理论分析表明,EDOLOIS算法能够很好地利用原空间已经算计算出的数据,来推算出子空间的局部离群系数,从而较好地克服了"维度灾难"和"组合爆炸"问题对离群点发现问题的影响;理论上,EDOLOIS算法能够以小得多的时间复杂度发现所有子空间中的局部离群点.
-
-
苏雪峰;
吴斌;
王柏
- 《2003中国计算机大会》
| 2003年
-
摘要:
离群点挖掘(outliermining)是一项有趣而重要的数据挖掘任务.现有的离群点挖掘方法,一般不能有效地预测并控制目标结果的范围.本文提出了一种基于群体智能的离群点挖掘算法SIOM(Swarm Intelligence based Outlier Mining),通过两个简单的聚类过程,准确、有效地发现离群数据,并可以通过主要参数的调整,有力地控制目标结果的范围.我们将这一算法应用于电信行业欺诈用户的发现,验证了算法的正确性和有效性,并分析了SIOM算法基于群体智能思想的优势和特点.
-
-
-
Yanjuan Zhu;
朱延娟;
Shuangwu Shi;
史双武
- 《第十届海峡两岸航空航天学术研讨会》
| 2016年
-
摘要:
针对模糊支持向量机在故障诊断中对离群点和噪声十分敏感的缺点,提出了最小化数据集在超平面法向离散度的模糊支持向量机.通过最大化两类样本间的几何间隔和最小化数据集在分类超平面法向的离散度,不仅保证了数据集的可分性,同时减小了离群点和噪声出现的概率,提高了故障诊断的正确率.此外,提出了基于样本点到超平面距离的非线性隶属度计算方法,能够适应分布几何形状不规则的数据集,进一步提高了故障诊断的正确率.
-
-
-
马卓军;
何玉敖
- 《第十届全国结构工程学术会议》
| 2001年
-
摘要:
本文提出了辨识土建结构系统物理参数的突加荷载激振-振动反分析法,并用线性再平均技术筛选被噪声污染的结构物理参数样本,剔除离群点,提高了辨识精度;在辨识的基础上进行了结构响应预测.数字仿真结果表明,此方法简便易物,准确可靠.