您现在的位置：首页> 研究主题> 不平衡数据

不平衡数据

不平衡数据的相关文献在1990年到2023年内共计533篇，主要集中在自动化技术、计算机技术、经济计划与管理、电工技术等领域，其中期刊论文390篇、会议论文8篇、专利文献626644篇；相关期刊196种，包括中国卫生统计、计算机工程、计算机工程与科学等；相关会议7种，包括中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015）、第十一届全国计算语言学学术会议、2009年全国模式识别学术会议暨首届中日韩模式识别学术研讨会等；不平衡数据的相关文献由1454位作者贡献，包括刘三阳、李克文、王蕾等。

不平衡数据—发文量

期刊论文>

论文：390篇占比：0.06%

会议论文>

论文：8篇占比：0.00%

专利文献>

论文：626644篇占比：99.94%

总计：627042篇

不平衡数据—发文趋势图

不平衡数据
-研究学者

刘三阳
李克文
王蕾
何田中
刘万里
王喆
黄再祥
李冬冬
胡峰
薛贞霞
陈丽芳
代琪
余红梅
刘双印
周斌
宋燕
张岩波
方滨兴
李军
李树栋
李雄飞
杨云
殷丽华
王乐
王舒梵
田志宏
罗艳虹
葛志强
贾焰
郑建华
韩伟红
黄子中
万静
严涛
乔少杰
于洪
刘文英
周旭
姜新盈
季梦遥
尹红
张永清
张涛
强冰冰
曲朝阳
曹路
朱巧明
杨明
杨杰明
王中卿

不平衡数据
-相关主题

不平衡数据
-相关期刊

不平衡数据
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2023
(2)
2022
(84)
2021
(94)
2020
(45)
2019
(46)
2018
(34)
2017
(30)
2016
(16)
2015
(20)
2014
(9)
2013
(14)
2012
(16)
2011
(8)
2010
(8)
2009
(5)
2008
(12)
2007
(2)
2006
(2)
2005
(1)
2000
(1)
1990
(1)

期刊

收录数据库

作者

刘三阳
(7)
李克文
(7)
王蕾
(7)
何田中
(6)
刘万里
(6)
王喆
(6)
黄再祥
(6)
李冬冬
(5)
胡峰
(5)
薛贞霞
(5)
陈丽芳
(5)
代琪
(4)
余红梅
(4)
刘双印
(4)
周斌
(4)
宋燕
(4)
张岩波
(4)
方滨兴
(4)
李军
(4)
李树栋
(4)
李雄飞
(4)
杨云
(4)
殷丽华
(4)
王乐
(4)
王舒梵
(4)
田志宏
(4)
罗艳虹
(4)
葛志强
(4)
贾焰
(4)
郑建华
(4)
韩伟红
(4)
黄子中
(4)
万静
(3)
严涛
(3)
乔少杰
(3)
于洪
(3)
刘文英
(3)
周旭
(3)
姜新盈
(3)
季梦遥
(3)
尹红
(3)
张永清
(3)
张涛
(3)
强冰冰
(3)
曲朝阳
(3)
曹路
(3)
朱巧明
(3)
杨明
(3)
杨杰明
(3)
王中卿
(3)

关键词

申请/权力人

;

1. 基于先验概率的加权神经网络模型
- 邓柙；吕王勇；代娟；陈雯；李思奇
- 摘要：针对不平衡分类问题中各类别规模差异较大导致的较小类别分类精度不高的情况,提出基于先验概率的加权神经网络模型.为了提高较小类别在迭代神经网络中的重要性,以每一类样本的先验概率的倒数作为该类数据的权重,将该权重加入神经网络的目标损失函数中,并基于新构造的目标函数进行网络迭代,加强对少数类别的代价敏感学习,从而提高对小类别样本的识别率.最后利用真实分类数据进行实证分析,与经典神经网络对比,证明模型的有效性与实用性.
2. 基于特征优化生成对抗网络的在线交易反欺诈方法研究
- 张浩；康海燕
- 摘要：为了降低在线交易欺诈数据的不平衡性对欺诈检测效果的影响,提出了一种基于特征优化生成对抗网络的在线交易反欺诈方法.该方法建立了WGAN网络包括生成模型和判别模型,对数据进行Key特征选取,在数据生成过程中进行Gumbel-softmax技巧采样输出,优化生成数据质量和提高训练稳定性;交替训练判别模型和生成模型直至模型收敛;接着将收敛的生成模型作为样本生成器生成少数类样本对原始数据进行平衡处理;利用平衡处理后的数据训练分类模型并进行模型评估.通过实验证明,该方法生成数据的效果优于SMOTE及其变种方法.
3. 基于集成学习的上市公司高送转预测实证研究
- 张田华；罗康洋
- 摘要：我国证券市场中高送转题材股备受中小投资者的追捧,但市场中也存在着借高送转概念炒作的乱象,如何利用上市公司的财务数据挖掘真正有潜力的股票无疑具有重要意义。采用2158家制造业上市公司7年的财务指标作为研究数据,利用采样、特征选择以及集成学习算法构建上市公司高送转预测模型并进行实证研究。结果显示:采样和特征选择方法均能有效提高集成预测模型的性能;相较于数据集中的冗余信息,数据不平衡问题对模型预测准确率的影响更显著;ADASYN+mRMR+XGBoost组合模型取得了最好的预测结果,高送转样本的分类准确率达到84.96%,建议投资者优先选用该组合模型对上市公司的高送转情况进行预测。
4. 基于变分自编码器潜变量语义提炼的样本生成方法
- 王俊杰；焦柯；彭子祥；谭丽红；王文波
- 摘要：人工智能的逐步应用对行业的生产效率和技术变革影响显著,传统行业因样本收集难度大、成本高、涉及个人隐私等原因,进行深度学习时,面临着小样本和不平衡数据问题.现有的样本扩充方法存在着生成效果不能兼顾广泛性和合理性等问题.为此,提出一种基于变分自编码器潜变量语义提炼的样本扩充算法,利用神经网络的权重作为输入特征与潜变量相关性的度量,获取输入特征与变分自编码器潜变量的依赖关系,为潜变量赋予语义提供重要依据,实现显式控制潜变量的不同维度,生成满足总体分布且在原训练集未包含的样本.在对民用建筑结构安全数据库的样本扩充结果表明,该方法能有效生成特定属性的样本,能一定程度上解决小样本问题和不平衡数据问题.
5. 基于聚类融合和过采样的不平衡金融模型研究
- 叶枫；朱彩霞
- 摘要：近年来,如何提高不平衡数据分类精度的问题受到广泛关注。对于不平衡数据问题主要从数据集和算法两方面来解决。研究提出一种基于k-means++聚类算法和过采样的堆叠算法(K-SMO-Stacking)。在Stacking集成算法基础上将k-means++聚类算法应用到分类过程当中,形成新的少数类和多数类,用过采样方法生成更多更密集的少数类样本,均衡数据集后再进行回归训练。实验在多份金融不平衡数据集上进行验证,结合AUC、F1-score和G-mean主流评价指标,结果显示该算法在不平衡金融数据中的分类性能有显著提高。
6. 基于Hellinger距离的不平衡漂移数据流Boosting分类算法
- 张喜龙；韩萌；陈志强；武红鑫；李慕航
- 摘要：数据流中的不平衡问题会严重影响算法的分类性能,其中概念漂移更是流数据挖掘研究领域的一个难点问题。为了提高此类问题下的分类性能,提出了一种新的基于Hellinger距离的不平衡漂移数据流Boosting分类BCA-HD算法。该算法创新性地采用实例级和分类器级的权重组合方式来动态更新分类器,以适应概念漂移的发生,在底层采用集成算法SMOTEBoost作为基分类器,该分类器内部使用重采样技术处理数据的不平衡。在16个突变型和渐变型的数据集上将所提算法与9种不同算法进行比较,实验结果表明,所提算法的G-mean和AUC的平均值和平均排名均为第1名。因此,该算法能更好地适应概念漂移和不平衡现象的同时发生,有助于提高分类性能。
7. 不平衡数据分类的改进k-GSMOTE方法
- 徐玲玲；迟冬祥(指导)；黄彦乾；曹钧烨
- 摘要：以不平衡数据分类为背景,针对生活和生产中存在的不平衡数据分类问题进行讨论研究和实验分析,在几何合成少数类过采样技术(GSMOTE)的基础上,结合k-means聚类算法,提出了一种改进的k-GSMOTE过采样方法。该方法在使用GSMOTE过采样前,对不平衡数据进行聚类划分,有效地缓解了GSMOTE采样方法难以处理类内不平衡数据的局限问题,将k-GSMOTE过采样方法用于经典的不平衡数据集上进行实验验证。结果表明:分类器的分类性能得以明显提升。
8. 结合注意力机制与几何信息的特征融合框架
- 董奇达；王喆；吴松洋
- 摘要：不平衡问题在现实世界中普遍存在,而不平衡数据的分布不平衡性会严重影响模型的性能。不平衡数据通常从两方面影响模型性能:一方面是数量上的不平衡导致多数类的数据对参数有更多的更新,导致模型更加偏向多数类;另一方面是少数类样本特别少,多样性不足从而导致模型表征能力不足。针对上述问题,提出了一个结合注意力机制与几何信息的特征融合框架。具体而言,该模型首先通过预训练使模型学习数据的语义信息和判别性信息,并结合注意力机制发掘模型对不同类别数据的关注点。在第二阶段,模型通过几何信息挖掘边界特征,并且结合第一阶段得到的注意力权重对边界特征进行融合,从而对少数类的数据进行补充。基于长尾CIFAR10,CIFAR100和KDDCup99数据集的实验结果表明,所提的结合注意力机制与几何信息的特征融合框架能够有效提升对不平衡数据的分类性能,并且对于不同类型的数据,包括图像数据和结构化数据,都能有效提高分类性能。
9. 基于WKFCM⁃SMOTE和随机森林的风电机组故障诊断
- 孙海蓉；曹瑶佳；张雨晴
- 摘要：针对风电机组运行数据中故障数据占比小,不平衡数据集影响故障诊断精度与诊断结果的问题,提出一种基于加权模糊核C均值(WeightedKernelFuzzyC⁃means,WKFCM)算法改进的合成少数类过采样技术(SyntheticMinorityOvers⁃amplingTechnique,SMOTE)算法,结合随机森林算法实现风电机组故障诊断。使用随机森林的袋外误差进行数据特征排序和选取,采用WKFCM⁃SMOTE算法进行故障数据集扩充,基于随机森林算法搭建故障诊断模型,并对模型参数进行网格搜索优化。试验结果表明,基于该模型的风电机组故障诊断比传统方法准确率更高。
10. 不平衡数据的Takagi-Sugeno-Kang模糊分类集成模型
- 张壮；王士同
- 摘要：集成学习是非线性系统的主流建模方法之一。但当常规的集成TSK模糊模型直接用于不平衡数据集时,其学习性能容易受到数据不平衡性的影响,因而常常会导致泛化能力差。为解决这一问题,基于TSK模糊模型提出了一种对不平衡数据处理的分类集成模型。基本思想是:首先利用SMOTE过采样方法对不平衡样本集做预处理,使得类别分布相对平衡,再引入AdaBoost方法对集成TSK模糊模型进行学习,集成时根据权值大小对样本进行随机采样,并通过多次训练对权值进行迭代更新,最后将生成的各个模型结果根据特定的加权方法结合,产生最终输出,使各模型得到充分的训练,进而提升整个集成TSK模糊模型的泛化能力。由此,提出了对应的不平衡数据的集成TSK模糊模型,并使用模型在多个数据集上进行实验,采用均方误差和精度对模型进行评估均有较好的效果,然后改变模型数量和规则数量等参数探究它们对模型性能的影响,并使用图像表示它们的变化情况,实验结果证明了所提出的集成学习算法的有效性。

1. 不平衡-平衡变换器和平衡-不平衡变换器
- 上海埃德电子股份有限公司
- 公开公告日期：2021.03.05
- 摘要：本发明提供了一种不平衡‑平衡变换器，包括不平衡‑平衡变换线圈，不平衡‑平衡变换线圈包括磁环，同轴电缆均匀绕制于磁环上；同轴电缆包括同轴设置的内、外导体，内、外导体之间设有绝缘填充层；不平衡‑平衡变换线圈通过支架固定于屏蔽盒中心；屏蔽盒一端设置第一连接器，另一端设置第二、三连接器；同轴电缆一端的内、外导体分别焊接到第一连接器的内、外导体上，同轴电缆另一端的内、外导体分别焊接到第二、三连接器的内导体上。本发明还提供了一种平衡‑不平衡变换器，由不平衡‑平衡变换器的输入端和输出端对调构成。本发明用同轴电缆产品来制造变换器，能维持变换器的输入和输出阻抗为同轴电缆的阻抗始终保持不变，且方便制作。
2. Marchand平衡‑不平衡转换器和使用Marchand平衡‑不平衡转换器的功率放大器
- 安普林荷兰有限公司
- 公开公告日期：2017.03.29
- 摘要： Marchand平衡‑不平衡转换器具有宽度小于两个次级传输线的初级传输线。两个次级传输线还具有不同宽度和长度。这种布置提供了传输线宽度和长度之间的失衡。已经发现这种宽度和长度的失衡能够改善幅度不平衡和相位不平衡。
3. 平衡‑不平衡变换器、推挽式放大器电路及四LC元件平衡‑不平衡变换器
- 安华高科技通用IP(新加坡)公司
- 公开公告日期：2016.11.16
- 摘要：本发明涉及一种平衡‑不平衡变换器、一种推挽式放大器电路及一种四LC元件平衡‑不平衡变换器。一种平衡‑不平衡变换器包含：不平衡端口，其具有单端端子；平衡端口，其具有第一及第二差分端子；及第一及第二串联谐振LC电路。所述第一串联谐振LC电路连接于所述第一与第二差分端子之间且包含串联连接的第一类型的第一元件及第二类型的一个元件。所述第二串联谐振LC电路连接于所述单端端子与接地之间且包含串联连接的所述第一类型的第二及第三元件以及所述第二类型的所述一个元件。所述第二类型的所述一个元件由所述第一及第二串联谐振LC电路共享。所述第一差分端子连接于所述第二类型的所述一个元件与所述第一类型的所述第三元件之间。
4. 平衡不平衡变换器和平衡不平衡变换器的操作方法
- 马维尔国际贸易有限公司
- 公开公告日期：2015.08.19
- 摘要：一种平衡不平衡变换器包括第一卷绕导体组，所述第一导体组包括第一回路部分和第二回路部分。所述第一回路部分和所述第二回路部分传导耦合，并形成第一8字形结构。所述平衡不平衡变换器进一步包括第二卷绕导体组，所述第二导体组包括第三回路部分和第四回路部分。所述第三回路部分和所述第四回路部分传导耦合，并形成第二8字形结构。所述第一回路部分和所述第三回路部分感应耦合。所述第二回路部分和所述第四回路部分感应耦合。
5. 平衡-不平衡转换器以及使用此平衡-不平衡转换器的电子装置
- 松下电器产业株式会社
- 公开公告日期：2012.07.25
- 摘要：本发明提供一种平衡-不平衡转换器，其中，第一不平衡侧线路(23)和第二平衡侧线路(24)实质地配置在同一平面上，第一不平衡侧线路(21)配置在第一平衡侧线路(23)的上方并且与第一平衡侧线路(23)保持规定距离，第二不平衡侧线路(22)配置在第二平衡侧线路(24)的下方并且与第二平衡侧线路(24)保持所述规定距离。利用这样的结构，第一不平衡侧线路(21)和第二不平衡侧线路(22)之间的距离增大，流经第一不平衡侧线路(21)的电流和流经第二不平衡线路(22)的电流的相互抵消被极大地抑制。
6. 不平衡-平衡变换器和平衡-不平衡变换器
- 上海埃德电子股份有限公司
- 公开公告日期：2019-03-19
- 摘要：本发明提供了一种不平衡‑平衡变换器，包括不平衡‑平衡变换线圈，不平衡‑平衡变换线圈包括磁环，同轴电缆均匀绕制于磁环上；同轴电缆包括同轴设置的内、外导体，内、外导体之间设有绝缘填充层；不平衡‑平衡变换线圈通过支架固定于屏蔽盒中心；屏蔽盒一端设置第一连接器，另一端设置第二、三连接器；同轴电缆一端的内、外导体分别焊接到第一连接器的内、外导体上，同轴电缆另一端的内、外导体分别焊接到第二、三连接器的内导体上。本发明还提供了一种平衡‑不平衡变换器，由不平衡‑平衡变换器的输入端和输出端对调构成。本发明用同轴电缆产品来制造变换器，能维持变换器的输入和输出阻抗为同轴电缆的阻抗始终保持不变，且方便制作。
7. Marchand平衡-不平衡转换器和使用Marchand平衡-不平衡转换器的功率放大器
- 恩智浦有限公司
- 公开公告日期：2014-12-24
- 摘要： Marchand平衡-不平衡转换器具有宽度小于两个次级传输线的初级传输线。两个次级传输线还具有不同宽度和长度。这种布置提供了传输线宽度和长度之间的失衡。已经发现这种宽度和长度的失衡能够改善幅度不平衡和相位不平衡。
8. 平衡-不平衡变换器、推挽式放大器电路及四LC元件平衡-不平衡变换器
- 安华高科技通用IP(新加坡)公司
- 公开公告日期：2014-12-24
- 摘要：本发明涉及一种平衡-不平衡变换器、一种推挽式放大器电路及一种四LC元件平衡-不平衡变换器。一种平衡-不平衡变换器包含：不平衡端口，其具有单端端子；平衡端口，其具有第一及第二差分端子；及第一及第二串联谐振LC电路。所述第一串联谐振LC电路连接于所述第一与第二差分端子之间且包含串联连接的第一类型的第一元件及第二类型的一个元件。所述第二串联谐振LC电路连接于所述单端端子与接地之间且包含串联连接的所述第一类型的第二及第三元件以及所述第二类型的所述一个元件。所述第二类型的所述一个元件由所述第一及第二串联谐振LC电路共享。所述第一差分端子连接于所述第二类型的所述一个元件与所述第一类型的所述第三元件之间。
9. 一种不平衡数据的分类及数据不平衡特征的选取方法
- 扬州千代科技有限公司
- 公开公告日期：2021-06-18
- 摘要：本发明涉及一种不平衡数据的分类及数据不平衡特征的选取方法，S1，在采集的数据样本中采用有放回的随机抽样的方式多次采样稀释负类样本，将每次抽取的负类样本和全部的正类样本组成多个新的样本集，使其当中正负类别的样本数目相当；S2，对样本集进行选择，基于随机森林子空间分类即不平衡数据的分类来选择相关性特征；S3，将上一步选出的特征子集合并成一个特征合集；S4，统计特征合集中各个特征出现的次数形成数据集，并根据其特点设定出现频率的阈值，出现次数超过该阈值的特征就认为是好的特征，其余的特征认为是不好的特征。该发明提高了特征选取的精度，能更好的体现出数据样本所反映出的问题。
10. 基于不平衡分类指标与集成学习的不平衡数据分类方法
- 西安电子科技大学
- 公开公告日期：2015-09-30
- 摘要：本发明公开了一种基于不平衡分类指标与集成学习的不平衡数据分类方法，主要解决现有技术在不平衡数据上少数类分类精度低的问题。其实现步骤为：(1)选定训练集和测试集；(2)初始化训练样本权重；(3)根据训练样本权重选取部分训练样本对弱分类器进行训练，并用训练好的弱分类器对所有训练样本进行分类；(4)计算弱分类器在训练集上的分类错误率，将错误率与设定的阈值进行比较，并优化错误率；(5)根据错误率计算弱分类器投票权重，并更新训练样本权重；(6)判断弱分类器的训练是否达到最大迭代次数，若达到最大迭代次数，根据弱分类器及其投票权重计算强分类器；否则，返回(3)。本发明提高了少数类的分类精度，可用于不平衡数据的分类。

不平衡数据

不平衡数据—发文量

不平衡数据—发文趋势图

不平衡数据-研究学者

不平衡数据-相关主题

不平衡数据-相关期刊

不平衡数据-相关会议

不平衡数据
-研究学者

不平衡数据
-相关主题

不平衡数据
-相关期刊

不平衡数据
-相关会议