不确定数据
不确定数据的相关文献在1987年到2022年内共计225篇,主要集中在自动化技术、计算机技术、科学、科学研究、电工技术
等领域,其中期刊论文177篇、会议论文21篇、专利文献644637篇;相关期刊81种,包括东北大学学报(自然科学版)、电子设计工程、计算机工程等;
相关会议14种,包括2014湖北省计算机学会学术年会、第30届中国数据库学术会议、中国计算机学会第一届CCF大数据学术会议等;不确定数据的相关文献由482位作者贡献,包括毛伊敏、王国仁、王勇等。
不确定数据—发文量
专利文献>
论文:644637篇
占比:99.97%
总计:644835篇
不确定数据
-研究学者
- 毛伊敏
- 王国仁
- 王勇
- 张阳
- 陈凤娟
- 李松
- 李小勇
- 王意洁
- 董一鸿
- 贾焰
- 万静
- 何云斌
- 王丽珍
- 陈华辉
- 吴爱华
- 周傲英
- 孙永佼
- 曹科研
- 李晨
- 杨树强
- 袁野
- 赵秦怡
- 赵雷
- 钱江波
- 陆叶
- 黑韶敏
- 刘卫明
- 卢印举
- 周斌
- 唐常杰
- 张晓峰
- 李忠利
- 杨宁
- 林瀚
- 王媛
- 王广东
- 王悦
- 王文标
- 王晓伟
- 王爽
- 祁亚斐
- 邱卫东
- 郑皎凌
- 韩东红
- 马恺
- 高云君
- Li Xiaoyong
- SUN Zhi-xin
- Wang Yijie
- XIONG Xiao-xiao
-
-
杨本钊
-
-
摘要:
面向真实山体数据(山脊梁变形位移数据为主,边坡地下水位等20项相关数据为辅)进行分析,在利用DSA优化最小二乘支持向量机(LSSVM)的核心参数的方法基础上,提出响应效率(Response Efficiency)概念,利用CFSFDP聚类方法以不确定数据降雨量为核心数据,将其他数据分为少雨、中雨、多雨三个不同时间分组数据,再对不同时间区域的数据进行预测,使有了时间延迟的聚类数据在DSA-LSSVM模型上有明显改善。
-
-
王志飞;
陆亿红
-
-
摘要:
传统的模糊方法已无法解决数据本身不确定性的问题,犹豫模糊集方法却行之有效.原有的犹豫模糊层次聚类算法没有考虑犹豫模糊集对权值的影响,缺乏合理的权重计算方法,并且算法的时间复杂度和空间复杂度都为指数级.为了更有效地解决聚类分析问题,本文提出一种凝聚中心犹豫度恒定的模糊层次聚类算法(FHCA),首先设计了一种基于数据集本身信息的权重公式,可以得到更加合理的权重分配.此外还提出了新的簇中心的计算公式,不仅使聚类过程中,簇中心的犹豫度具有不变性,还将原有算法的时间复杂度以及空间复杂度从指数级降至线性级,并且聚类的质量不劣于原有的聚类算法.
-
-
李峰
-
-
摘要:
剪枝策略(pruning mechanisms)是频繁模式挖掘算法常用方法之一,通过该策略可以快速克服工业生产中可能发生的金融危机,从而最大限度地提高制造业的生产能力.现有的剪枝策略算法仅考虑每个产品的利润信息,不考虑产品的权重,所以效率低下.提出了一种新的剪枝挖掘算法.通过基于低估值的约束和组件权重的挖掘索引器进行的有效剪枝挖掘,不但考虑了利润信息,而且考虑了权重信息.实验表明,该方法能节省大量的运行时间,大幅提高挖掘效率.
-
-
-
李峰
-
-
摘要:
大多数真实世界的数据都是局部收集,分区组织的,因此真实数据一般具有分布式特性.通过挖掘这些数据将提供决策者辅助决策信息.提出了一种基于不确定数据的频繁模式分布式挖掘算法,该算法在构建不确定数据生成交易决策树的基础上,提出了在分布式环境下,顺序执行和并行执行分别处理决策树的方法和技巧.实验结果表明,该算法可节省大量的处理时间,提供可靠的辅助决策信息.
-
-
朱玲
-
-
摘要:
针对滑坡危险性预测中降雨等不确定因素难以衡量,及现有的预测方法大多属于无监督的传统聚类方法,不能有效利用先验信息的问题,为有效提高预测精度,首先提出一种不确定数据距离-uv距离,它实现了不确定因素降雨的有效刻画;其次将半监督聚类应用于滑坡危险性预测,引入uv距离,设计了一种基于不确定数据的半监督动态K-均值算法,其有效利用了先验信息,并通过设置隶属度阈值实现了数据集的动态划分,有效提高了预测精度.研究区的实验结果证明了uv距离及算法的有效性.
-
-
邹志文;
张翅
-
-
摘要:
针对实际应用中不确定Top-k查询算法效率不够高等问题,在分析可能世界模型的基础上,提出了新的参数化Top-k查询算法(ETK算法).该算法对数据概率和分值进行约束,返回Top-k概率和分值乘积最大的前k条数据,综合考虑数据概率和分值两个属性.为了提高算法的效率,提出了基于数据分值约束、数据存在概率和数据支配关系的剪枝技术.将所提出的算法与以往算法进行对比,且在不同参数下进行了试验.结果表明:在处理不确定数据时,所提出的算法在时间性能上有较好的提升.
-
-
毛伊敏;
刘银萍;
梁田;
毛丁慧
-
-
摘要:
针对谱聚类融合模糊C-means(FCM)聚类的蛋白质相互作用(PPI)网络功能模块挖掘方法准确率不高、执行效率较低和易受假阳性影响的问题,提出一种基于模糊谱聚类的不确定PPI网络功能模块挖掘(FSC-FM)方法.首先,构建一个不确定PPI网络模型,使用边聚集系数给每一条蛋白质交互作用赋予一个存在概率测度,克服假阳性对实验结果的影响;第二,利用基于边聚集系数流行距离(FEC)策略改进谱聚类中的相似度计算,解决谱聚类算法对尺度参数敏感的问题,进而利用谱聚类算法对不确定PPI网络数据进行预处理,降低数据的维数,提高聚类的准确率;第三,设计基于密度的概率中心选取策略(DPCS)解决模糊C-means算法对初始聚类中心和聚类数目敏感的问题,并对预处理后的PPI数据进行FCM聚类,提高聚类的执行效率以及灵敏度;最后,采用改进的边期望稠密度(EED)对挖掘出的蛋白质功能模块进行过滤.在酵母菌DIP数据集上运行各个算法可知,FSC-FM与基于不确定图模型的检测蛋白质复合物(DCU)算法相比,F-measure值提高了27.92%,执行效率提高了27.92%;与在动态蛋白质相互作用网络中识别复合物的方法(CDUN)、演化算法(EA)、医学基因或蛋白质预测算法(MGPPA)相比也有更高的F-measure值和执行效率.实验结果表明,在不确定PPI网络中,FSC-FM适合用于功能模块的挖掘.
-
-
毛伊敏;
陈华彬;
李忠利;
张灿龙
-
-
摘要:
针对滑坡危险性预测中降雨等不确定因素不能有效刻画及处理和现有的OPTICS-PLUS聚类算法需要设置密度阈值、时间复杂度高等问题进行了研究,为了提高滑坡危险性预测准确率,提出一种不确定NNSB-OP-TICS聚类算法并应用于滑坡预测中.首先对OPTICS-PLUS算法扩张策略进行优化,避免了人工设置密度阈值,提高了算法效率;然后根据降雨量数据的分布特征,综合EW型距离公式和云模型理论,提出EC型距离公式,有效处理不确定数据降雨量;最后将不确定NNSB-OPTICS聚类算法应用于延安市宝塔区滑坡危险性预测中,建立滑坡危险性预测模型,滑坡预测精度达到89.7%.实验结果表明,该方法能够有效提高滑坡危险性预测精度,具有较高的可行性.
-
-
胡健;
朱玲;
毛伊敏
-
-
摘要:
针对滑坡预测聚类研究中由于难以确定传统聚类算法需要预先设置的簇个数和无法精准衡量不确定因素降雨量导致预测效果欠佳的问题,提出一种新的聚类算法——不确定PAHT(partition algorithm on the hierarchical thinking)算法.该算法引入一种不确定数据模型——M-D距离,有效刻画了不确定的雨量数据;并结合层次聚类思想,通过找出最佳阈值p*自动确定k值.以延安宝塔区为实例进行对比实验,实验结果验证了不确定M-D距离和PAHT算法的有效性及不确定PAHT算法在滑坡危险性预测上的可行性.
-
-
杨志邦
- 《浙江省信号处理学会2015学术年会》
| 2015年
-
摘要:
由于数据来源的多样性,数据本身具有了不确定属性,从不确定数据中查询目标信息是数据服务需要解决的重要问题.本文在不确定数据模型基础上,定义了一种不确定Top-k查询操作,然后设计相应的查询策略,提出了面向不确定数据的Top-k查询算法,快速响应数据查询需求.理论分析和仿真实验验证了本文算法的正确性和有效性.
-
-
-
-
Chen Aidong;
陈爱东;
Liu Guohua;
刘国华;
Fei Fan;
费凡;
Zhou Yu;
周宇;
Wan Xiaomei;
万小妹;
Yun Hui;
貟慧
- 《第30届中国数据库学术会议》
| 2013年
-
摘要:
云计算为大数据提供了展示和共享的平台为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item sets,UFI-DM)和关联规则生成子算法(algorithm forgenerating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性.
-
-
-
-
Zhang Hui;
张慧;
Zheng Jiping;
郑吉平;
Han Qiuting;
韩秋廷
- 《第29届中国数据库学术会议》
| 2012年
-
摘要:
应用需求的发展衍生各种查询类型,Top-k查询是交互环境下一种重要查询类型.由于数据的不确定性,传统数据上的Top-k查询技术和方法不能直接应用于不确定数据查询.在已有不确定数据上Top-k查询算法的基础上,提出基于二叉树的不确定数据上Top-k查询算法BTreeU-Topk;为了提高算法执行效率,对二叉树进行修剪操作进而提出BTreeOPTU-Topk和BTreePU-Topk算法.实验结果表明,BTreeU-Topk,BTreeOPTU-Topk以及BTreePU-Topk算法在不同数据分布以及k值增长时均优于现有算法.
-
-
ZHANG Wei;
张炜;
ZHAI Qiu-ying;
翟秋瑛
- 《2012中国计算机大会》
| 2012年
-
摘要:
在不确定数据的处理中,不确定图作为典型的数据模型得到了广泛的关注,研究的内容包括基于不确定图的子图匹配、最近邻查询及连接查询等,本文研究基于距离阈值的不确定图可达性查询,即给定不确定图及图中任意两点s、t和距离阈值d,返回s和t的d可达的概率.提出一种基于随机抽样的可达性查询处理算法.定义了一种不确定图可能图实例的分类树模型.为了提高图实例分类的获取效率,提出基于双向遍历的优化分类树模型.设计了基于图实例类抽样的可达性查询处理算法并通过理论分析和实验验证了算法的性能.
-
-
Wang Yijie;
王意洁;
Li Xiaoyong;
李小勇;
Yang Yongtao;
杨永滔;
Qi Yafei;
祁亚斐;
Wang Guangdong;
王广东
- 《第29届中国数据库学术会议》
| 2012年
-
摘要:
当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务、移动对象管理网上购物和市场监控等各种实际应用中.不确定Skyline查询作为不确定数据管理的一个重要方面,由于其在决策制定、市场分析、环境监控和数据挖掘等方面的重要作用,近年来在数据库和网络计算领域受到广泛关注.首先,概述了各种不确定数据类型上的Skyline查询定义,包括离散、连续概率分布模型以及不完全数据上的Skyline查询定义;其次,分析了不确定Skyline查询的特点,并在此基础上综述了现有的各种不确定数据集上的集中式和分布式Skyline查询方法,重点分析了各种算法的原理和优缺点;再次,介绍了不确定数据流上的Skyline查询定义并综述了各种不确定数据流上的Skyline查询方法;最后,基于最新研究动态指出了未来不确定Skyline查询研究的趋势.
-
-
段磊;
唐常杰;
杨宁;
左劼;
王悦;
郑皎凌;
徐开阔
- 《第28届中国数据库学术会议》
| 2011年
-
摘要:
干预规则挖掘是近年从干预实践中提出的新型数据挖掘任务,旨在利用数据挖掘技术探测干预事件,发现最佳干预时机和力度,提供促进事物向期待状态转化的决策支持。文中以四年的研究实践为背景,介绍干预规则挖掘的研究沿革和现状,给出了干预规则挖掘的任务分类。从三个角度,即干预效果预测、干预方法发现和未知干预探测三方面,介绍干预规则挖掘的研究问题、困难和成果,展望了干预规则挖掘未来研究方向。
-
-
-
-
-
-
-
- 杭州西湖新基建数字技术有限公司
- 公开公告日期:2022-12-02
-
摘要:
一种不确定数据结构的数据增删改的接口方法,属于数据结构技术领域,其包括以下步骤:步骤S1,数据库表结构感知及存储;定时或按需遍历查询配置库中的所有数据库中所有表结构,同步表的名称和注释以及表结构信息并存储到配置库;步骤S2,信息提取、校验并进行数据库操作:对外暴露一整套对数据的增删改查的接口,并提供数据传输标准,符合标准的数据将被解析并进行校验,校验通过后对对应数据库执行对应的操作,操作完毕后返回对应操作的结果数据;步骤S3,日志记录。本方法通过提供一套统一的数据处理接口方式,可以在不需要改变服务的情况下,适应业务数据结构的变动,无需再次对基础数据服务的接口进行开发。
-
-
-
-