虚拟样本
虚拟样本的相关文献在2000年到2022年内共计128篇,主要集中在自动化技术、计算机技术、一般工业技术、力学
等领域,其中期刊论文65篇、会议论文10篇、专利文献84701篇;相关期刊54种,包括韩山师范学院学报、金陵科技学院学报、科学技术与工程等;
相关会议6种,包括第25届全国灰色系统学术会议、2012全国高性能计算学术年会、中国电子学会可靠性分会第十届学术年会等;虚拟样本的相关文献由373位作者贡献,包括Che-Jung Chang、Chien-Chih Chen、Der-Chiang Li等。
虚拟样本—发文量
专利文献>
论文:84701篇
占比:99.91%
总计:84776篇
虚拟样本
-研究学者
- Che-Jung Chang
- Chien-Chih Chen
- Der-Chiang Li
- 利德江
- 张哲荣
- 陈建智
- 汤健
- Yao-San Lin
- Yen-Chuan Chang
- 向洋
- 张卫华
- 张延全
- 徐圆
- 朱群雄
- 李东
- 杨静宇
- 林耀三
- 董林鹭
- 谷朝臣
- 贺彦林
- 贾美英
- Chien-Ting Chen
- Jhih-Wei Chen
- Tung-I Tsai
- Yu-Mei Hsueh
- 丁汉
- 严思杰
- 乔俊飞
- 于力
- 于海丹
- 何良华
- 侯磊
- 关新平
- 刘卓
- 刘文培
- 刘金海
- 刘靳
- 匡民兴
- 卞璐莎
- 叶雪荣
- 吕燕燕
- 吴开杰
- 吴志伟
- 周晓杰
- 唐辉
- 姚永芳
- 姬红兵
- 孙欣
- 孙鹏
- 张晨民
-
-
刘秋芳;
褚小立;
陈瀑;
李敬岩
-
-
摘要:
提供了一种快速测定石脑油分子水平组成的方法,以石脑油的族组成(PINA)和单体烃组成的实验室气相色谱分析数据样本为基础,建立了石脑油的单体烃分布比例库;采用样本增强(DA)法生成大量虚拟样本,以石脑油近红外光谱(NIR)作为输入变量,结合偏最小二乘法(PLS)建立了石脑油PINA组成预测模型,利用K-近邻回归法(KNR)建立了石脑油单体烃分布比例预测模型。预测结果表明,在数据样本范围内,利用所建模型可以快速测定石脑油的单体烃分子组成。
-
-
王民华;
牛显
-
-
摘要:
目前采空区遗煤自燃预测模型的外推泛化能力不强,主要原因是模型训练数据集数量较少以及监测过程和方法等造成的数据分布特征不明显;采用WGAN-GP模型生成虚拟样本,对实测数据集特征分布进行重构增强;通过参数相关性计算,生成虚拟数据集各参数间相关性系数变化均未超过15%;采用1倍实测数据集数量的扩容虚拟样本,进行模型的学习训练。结果表明:各模型的预测性能均有提高,其中R~2指标GA-BPNN模型提高12%,GA-SVM模型提高4%,RF模型提高3%;MAE指标均降低,GA-BPNN模型降低0.67°C,GA-SVM模型降低了0.54°C,RF模型降低0.33°C;RMSE指标均降低,GA-BPNN模型降低0.41°C,GA-SVM模型降低0.46°C,RF模型降低0.39°C;增强扩容的数据集对3种预测模型的性能都有提高,其中GABPNN模型预测性能提高幅度最大。
-
-
严永奇;
李政民卿;
于晓峰
-
-
摘要:
在基于机器视觉的粗糙度测量系统中,最为关键的是建比图像信息与粗糙度关联指标的预测模型,充足的样本量是建立有效预测模型的基础。针对以上问题,文章提出了虚拟样本在粗糙度视觉测量中的应用方法,对通过图像采集系统与粗糙度测量仪获得对应粗糙度值的原始样本,分别采用重采样、奇异值重构、正三角重构加权融合的虚拟样本生成方法扩充样本量,基于灰度共生矩阵提取样本纹理特征,结合神经网络建空并训练图像信息与粗糙度关联指标的预测模型,结果表明:扩充样本量可有效提高粗糙度视觉测量的准确率,奇异值重构法提高了10.3%、重采样法提高了12%、正三角重构加权融合法提高了16.5%,证明了虚拟样本生成方法应用于粗糙度视觉测量中的可行性,为粗糙度的在机检测提供理论基础。
-
-
姚直言;
赵学龙;
戚湧;
严悍
-
-
摘要:
在传统司法领域,刑期判决不可避免地会受到法官主观判断的影响,从而使得在相似案情的情况下判决结果有所不同,甚至极端情况会出现矛盾,即量刑偏差问题.通过大量样本应用神经网络进行刑期预测在一定程度上可以改善量刑偏差的问题,但是由于量刑偏差对数据集质量的影响,从而使得直接使用神经网络进行刑期预测的效果不佳.为减少训练神经网络所需要的大量样本数据以及量刑数据偏差干扰,提出了一种基于先验知识生成虚拟样本与BP神经网络结合进行刑期预测的方法.以预测盗窃罪刑期为对象,在小样本上进行实验,结果证明此方法可以有效改善BP神经网络在小样本刑期预测上的表现,可以使刑期预测相对准确率提升8%,平均绝对误差降低四个月,减少了主观误差对刑期判决的影响,为小样本刑期预测提供一种有效的方法.
-
-
贺许龙;
张蕾;
周涵;
王鑫磊;
苗准
-
-
摘要:
采用催化重整装置的工业原料组成数据训练产品预测决策树回归模型.由于工业数据样本范围比较集中,利用该模型在预测芳烃收率时,会存在过拟合现象,造成其适用性较差,因而借助多元高斯概率分布方法构建重整进料虚拟样本,并利用H YSYS机理模型计算虚拟进料样本对应的芳烃收率数据,改进工业数据常见的小样本问题.结果表明,将虚拟数据与真实数据混合用于决策树回归模型的训练后,模型对检验样本的平均绝对误差由1.4097降至0.6318,说明虚拟样本可以用于模型训练,提升了数据驱动模型的适用性.
-
-
傅雪;
陈春晓;
李东升;
陈志颖
-
-
摘要:
随着医学成像技术的快速发展,医学图像在临床检测及科研领域得到了广泛的应用.针对临床图像数据集不完备的情况,本文提出了基于密集连接的自逆生成对抗网络用于实现核磁共振T1加权图像和T2加权图像相互生成的模型.该模型在自逆循环对抗生成网络的生成器模块中引入密集连接块结构,并采用U-net的多尺度融合框架,实现了T1与T2加权图像的互相生成.实验采用BraTS 2018数据集进行验证,生成图像的峰值信噪比与结构相似度最高分别可以达到22.78和0.8.基于密集连接块的生成器与基于U-net及ResNet的生成器模型的对比实验结果表明,基于密集连接块的生成模型性能更优.本文提出的基于密集连接自逆生成对抗网络的MR图像生成方法可以较好地改善T1或T2加权像缺失的问题,为临床论断提供更多的信息.
-
-
韦旭勤
-
-
摘要:
本文使用了全新的图像表示方法用于生成虚拟图像,并根据稀疏表示的思想实现了一个图像分类算法.首先,在分类测试样本时,使用图像分类算法分别获得原始图像和虚拟图像对应的分类得分;其次,使用一种简单高效的得分融合方案获得测试样本的最终分类得分;最后,实现测试样本的分类.本文将该图像分类算法应用于人脸识别,并在多个公开的人脸数据库上进行了实验.实验结果表明,本文提出的算法在人脸识别准确率方面取得了非常有竞争力的结果.
-
-
朱振宇;
白小众;
徐磊;
侯磊;
刘金海;
谷文渊;
孙欣
-
-
摘要:
电耗预测是原油管道运行能耗管理的重要依据,有助于输油企业制定批量调度与负荷分配等运行方案。相较于工艺计算和统计分析等传统预测方法,机器学习方法在处理高维、非线性的管道运行数据时具有更优的预测效果。但由于数据获取成本很高、数据存在安全保密性等原因,往往将造成可获取的管道数据集是小样本,以此建立的模型预测精度难以满足实际生产需求。为提高模型在小样本集情况下的预测能力,通过利用数据生成理论提出一种自取法和支持向量机相结合的管道运行电耗预测模型。利用自取法对原始小样本集数据进行扩充,根据原始数据集的分布规律生成虚拟样本,填充样本信息间隔,避免出现过拟合问题;使用粒子群算法对支持向量机的超参数进行优化,提高模型的拟合能力。以国内某保温原油管道的两站场为例进行建模预测分析,预测结果表明,相较于只利用原始数据集,添加虚拟样本后多数预测值更加贴近真实值,且当两站场分别加入50组虚拟样本后,其月度电耗预测结果的平均绝对误差(MAE)分别降低了32.38%和29.74%,证明通过向原始数据集中添加虚拟样本以扩充数据集规模,能够有效降低预测误差,提高模型的拟合能力,这为管道数据获取成本过高、企业重视数据安全等原因造成的可用样本不充足问题提供了一种新的解决思路。
-
-
朱振宇;
白小众;
徐磊;
侯磊;
刘金海;
谷文渊;
孙欣
-
-
摘要:
电耗预测是原油管道运行能耗管理的重要依据,有助于输油企业制定批量调度与负荷分配等运行方案.相较于工艺计算和统计分析等传统预测方法,机器学习方法在处理高维、非线性的管道运行数据时具有更优的预测效果.但由于数据获取成本很高、数据存在安全保密性等原因,往往将造成可获取的管道数据集是小样本,以此建立的模型预测精度难以满足实际生产需求.为提高模型在小样本集情况下的预测能力,通过利用数据生成理论提出一种自取法和支持向量机相结合的管道运行电耗预测模型.利用自取法对原始小样本集数据进行扩充,根据原始数据集的分布规律生成虚拟样本,填充样本信息间隔,避免出现过拟合问题;使用粒子群算法对支持向量机的超参数进行优化,提高模型的拟合能力.以国内某保温原油管道的两站场为例进行建模预测分析,预测结果表明,相较于只利用原始数据集,添加虚拟样本后多数预测值更加贴近真实值,且当两站场分别加入50组虚拟样本后,其月度电耗预测结果的平均绝对误差(MAE)分别降低了32.38%和29.74%,证明通过向原始数据集中添加虚拟样本以扩充数据集规模,能够有效降低预测误差,提高模型的拟合能力,这为管道数据获取成本过高、企业重视数据安全等原因造成的可用样本不充足问题提供了一种新的解决思路.
-
-
-
-
Tung-I Tsai;
蔡东亦;
Jhih-Wei Chen;
陈志玮;
Che-Jung Chang;
张哲荣;
Chien-Chih Chen;
陈建智;
Der-Chiang Li;
利德江
- 《第25届全国灰色系统学术会议》
| 2014年
-
摘要:
如何从资料中撷取出有意义的资讯,统计理论在过往扮演着重要的角色,然囿于其对于母体假设的基本限制,已无法因应现实世界中各种不同面向的资料,因此资料探勘与类神经网路等机械学习方法于近二十年来有着长足的蓬勃发展.其中在分类问题方面,相较于单一分类器的学习程序,集成法的提出可以有效减少过度配适问题的发生,如拔靴集成法、多模激发法等,其藉由拔靴法生成多个子训练样本集以建构多个子分类器,并将结果进行整合,虽能增进单一分类器的分类正确率,但其改善效果仍属有限,乃因此些子分类器系针对属性值与训练样本相同的子训练样本集进行重复性的学习之故.为使子分类器能够对拔靴样本以外的属性值进行学习,本研究拟采盒须图进行训练样本的值域推估并藉以生成虚拟样本以充实子训练样本集.本论文目前规划使用公开资料库UCI上所取得之资料进行测试,冀能提升拔靴集成法对于测试样本的分类正确率.
-
-
-
Yao-San Lin;
林耀三;
Yen-Chuan Chang;
张延全;
Che-Jung Chang;
张哲荣;
Chien-Chih Chen;
陈建智;
Der-Chiang Li;
利德江
- 《2016中国消防协会科学技术年会》
-
摘要:
在过往小样本学习方法中,虚拟样本产生法虽已被证实能有效提升机械学习算法的学习结果,然而对于如何确认所产生之虚拟样本的质量并未有明确的定义,如扩散神经网络虽有考虑属性相关性于样本生成过程,然而该方法却仅局限于属性间的相关性必须大于0.9时,而又如整体趋势扩散(mega-trend-diffusion,MTD)技术则是在假设属性间独立情况下,于产生样本过程并未考虑此间关联性,而导致所产生之虚拟样本超出母体范围.虽小样本信息不足尽信,然小样本数据本属母体之部分集合,若能因而据此而生成保有小样本特性之虚拟样本,则可确保其合理性.因此本研究依此概念提出一套虚拟样本筛选机制,藉由小样本属性间的关联性来进行样本筛选.本研究以MTD为例,于实验结果显示,经筛选过后的虚拟样本除能保有小样本之信息外,于使用多元线性回归、以及倒传递类神经网络建模后,对于预测准确度能有更佳的改善.
-
-
Tung-I Tsai;
蔡东亦;
Jhih-Wei Chen;
陈志玮;
Che-Jung Chang;
张哲荣;
Chien-Chih Chen;
陈建智;
Der-Chiang Li;
利德江
- 《第28届全国灰色系统学术会议》
-
摘要:
如何从资料中撷取出有意义的资讯,统计理论在过往扮演着重要的角色,然囿于其对于母体假设的基本限制,已无法因应现实世界中各种不同面向的资料,因此资料探勘与类神经网路等机械学习方法于近二十年来有着长足的蓬勃发展.其中在分类问题方面,相较于单一分类器的学习程序,集成法的提出可以有效减少过度配适问题的发生,如拔靴集成法、多模激发法等,其藉由拔靴法生成多个子训练样本集以建构多个子分类器,并将结果进行整合,虽能增进单一分类器的分类正确率,但其改善效果仍属有限,乃因此些子分类器系针对属性值与训练样本相同的子训练样本集进行重复性的学习之故.为使子分类器能够对拔靴样本以外的属性值进行学习,本研究拟采盒须图进行训练样本的值域推估并藉以生成虚拟样本以充实子训练样本集.本论文目前规划使用公开资料库UCI上所取得之资料进行测试,冀能提升拔靴集成法对于测试样本的分类正确率.
-
-
Yao-San Lin;
林耀三;
Yen-Chuan Chang;
张延全;
Che-Jung Chang;
张哲荣;
Chien-Chih Chen;
陈建智;
Der-Chiang Li;
利德江
- 《第28届全国灰色系统学术会议》
-
摘要:
在过往小样本学习方法中,虚拟样本产生法虽已被证实能有效提升机械学习算法的学习结果,然而对于如何确认所产生之虚拟样本的质量并未有明确的定义,如扩散神经网络虽有考虑属性相关性于样本生成过程,然而该方法却仅局限于属性间的相关性必须大于0.9时,而又如整体趋势扩散(mega-trend-diffusion,MTD)技术则是在假设属性间独立情况下,于产生样本过程并未考虑此间关联性,而导致所产生之虚拟样本超出母体范围.虽小样本信息不足尽信,然小样本数据本属母体之部分集合,若能因而据此而生成保有小样本特性之虚拟样本,则可确保其合理性.因此本研究依此概念提出一套虚拟样本筛选机制,藉由小样本属性间的关联性来进行样本筛选.本研究以MTD为例,于实验结果显示,经筛选过后的虚拟样本除能保有小样本之信息外,于使用多元线性回归、以及倒传递类神经网络建模后,对于预测准确度能有更佳的改善.
-
-
-
-
朱宁波;
唐德燕
- 《2012全国高性能计算学术年会》
| 2012年
-
摘要:
在人脸识别领域中,最近提出的快速而又简单的稀疏描述人脸识别算法(SR)能够得到很好的识别效果,但算法依然有提高的空间.为了在人脸识别中用较少的时间得到很好的识别精度,本文提出了在稀疏描述人脸识别中使用并行计算来降低其时间复杂度的算法,即基于并行计算与虚拟样本的稀疏描述人脸识别算法.大量的实验表明,在样本比较大时,文章提出的方法能够更加高效准确的对人脸进行识别.
-
-
Chien-Chih Chen;
陈建智;
Chien-Ting Chen;
陈建颋;
Yu-Mei Hsueh;
薛玉美;
Che-Jung Chang;
张哲荣;
Der-Chiang Li;
利德江
- 《第28届全国灰色系统学术会议》
-
摘要:
小样本学习问题,常发生于系统建置初期数据稀少、取得困难或以及取得成本过高等环境却必须从事学习之情况,因此如何从中撷取更多有意义的信息,于近年已成为研究的课题.在过往学习方法中,虚拟样本产生法已验证为有效的方法之一,然其中如整体趋势以及盒须图等扩散技术却并未针对数据进行事前分析,对于母体推论虽考虑偏态但缺漏母体存在多峰可能.因此本研究藉由模糊分群法将数据进行概略分群,并透过模糊侧影系数决定最适分群数,以学习小样本分布状况之事前信息,并基于此进行样本分配的重建,从而改善产生之虚拟样本质量.实验部分,本研究以两笔电子制造业真实案例进行方法验证,其结果显示当小样本加入本研究方法所产生之虚拟样本后,于交互验证下确实较整体趋势扩散技术有更佳之预测准确度.