首页> 中国专利> 一种根据用户非功能性需求搜索Web服务的方法

一种根据用户非功能性需求搜索Web服务的方法

摘要

本发明涉及软件工程技术领域,尤其涉及一种根据用户非功能性需求搜索Web服务的方法。本发明处理用户的需求文本,抽取出其中的关键词;使用本体对所获得的关键词进行语义歧义消解;识别其中代表用户非功能性需求的关键词,将其映射到对应的Web服务质量属性上;逐个收集候选Web服务中上述待分析质量属性的数据,使用云变换方法得到对应的原子概念集合;将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合;从中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念,根据对应的云模型生成查询的组合约束条件。本发明利用云模型的定性定量转换,减少专家主观差异性和环境条件差异性对查询的影响,返回更贴近用户期望的结果。

著录项

  • 公开/公告号CN102193994A

    专利类型发明专利

  • 公开/公告日2011-09-21

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201110103757.X

  • 申请日2011-04-22

  • 分类号G06F17/30(20060101);

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人张火春

  • 地址 430072 湖北省武汉市武昌区珞珈山武汉大学

  • 入库时间 2023-12-18 03:13:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-28

    未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL201110103757X 申请日:20110422 授权公告日:20130724

    专利权的终止

  • 2013-07-24

    授权

    授权

  • 2011-11-23

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20110422

    实质审查的生效

  • 2011-09-21

    公开

    公开

说明书

技术领域

本发明涉及软件工程技术领域,尤其涉及一种根据用户非功能性需求搜索Web服务的方法。

背景技术

20世纪90年代后期,在电子商务应用的直接推动下,Web服务技术出现并迅速发展为基于互联网构造跨域分布应用的主流技术。通过将不同层次的应用和数据资源抽象成统一的表述形式并提供标准的使用方法,Web服务技术能有效支持服务提供者将自己的应用和数据资源以服务的方式提供给用户,而无需考虑具体的实现细节,如编程语言、开发环境、运行平台等;同时,在面向服务的体系结构(Service-oriented Architecture,SOA)支撑下,用户可以在互联网环境中根据自己的需要选择所需的Web服务。

由于具有良好的互操作性和松散耦合性,互联网上的Web服务资源日益丰富。比如,截止到2010年底,著名的Seekda网站拥有的注册Web服务超过2.8万个,其中天气预报、汇率转换、邮件地址确认是最常使用的三类Web服务。面对互联网上不断增长的Web服务资源,对于用户而言,可供选择的Web服务数量繁多而不是稀缺将会是一种新的烦恼,因此按需服务搜索就成为一个亟待解决的关键技术问题[1]

针对用户的功能性需求,根据抽取出的重要词汇进行基于关键字的搜索,是目前Web服务选择的基本方法,但是结果的准确性有待提高。针对上述问题,研究人员通过构造本体(ontology),将语义信息引入到Web服务的表征[2,3]和发现[4,5]上,利用明确的概念命名空间和概念间等价、相似等关联关系消除歧义,从语义的角度提升搜索结果的准确性。在此基础上,随着社会化标注(social annotation)技术[6]的兴起,利用大众用户的个性化标签(tag)构造分众分类法(folksonomy)[7],来替代领域专家构建的本体进行大众化的精细分类,是近年来一种新的研究趋势。虽然更加人性化,但考虑到一些用户在标注时的随意性,该方法在语义精确性方面较前述方法还有所欠缺[8]。如何把专业化的领域本体和大众化的分众分类法结合起来进一步提高搜索结果的准确性和合理性,将是今后研究关注的重点。

另一方面,用户对于Web服务的非功能性需求通常是模糊和不确定的,很难像功能性需求那样,可以通过结构化和量化的词汇来描述清楚,导致搜索结果往往不太符合用户的实际要求。针对上述问题,一种比较常见的解决方案是,将用户的非功能性需求人工或半自动地转化为Web服务的非功能性属性约束条件[9,10],从而过滤掉多余的候选Web服务。在具体实现时,研究人员一般采用服务质量(Quality of Service,QoS)中对应的非功能性属性的量化数据作为约束条件的限定值[11]。互联网环境瞬息万变,Web服务的QoS值也会随之发生变化,为适应这种动态变化,情境感知(context-aware)[12]的和QoS感知[13]的服务选择方法及其优化方法[14,15]被相继提出,以期满足真实互联网环境中用户的实时要求。但是,上述方法侧重于动态情境下Web服务QoS的量化和评价,而缺乏将这种随机的定量数据与用户的非功能性需求中的模糊定性概念进行转换和匹配的研究。

为解决该问题,研究人员尝试引入模糊数学相关方法,如模糊逻辑(fuzzy logic)[16]、模糊集合(fuzzy set)[17]、粗糙集合(rough set)[18]等,对Web服务的QoS进行描述和评价,辅助用户进行决策。这些方法均采用精确的隶属函数来表示模糊概念,但事实上不同的人对相同的词汇的理解是不同的,具有明显的随机性和不确定性。因此,在定性概念与定量数据进行匹配时,需要进一步考虑隶属度的不确定性,而非依靠传统的专家先验知识或针对训练集的统计分析结果,因为这些方法往往存在主观差异性、环境条件差异性等问题。

云模型(Cloud model)[19]利用计算机程序实现的正向云发生器所生成的离散云滴(clouddrop)构成的整体模型来表达定性概念,基于概率测度空间自动形成隶属度,是一种问题求解的非解析方法,适合用于解决上述问题。在形式化表达上,云模型用期望、熵(entropy)和超熵(hyper entropy)三个数字特征表达定性概念,其中,期望是云滴在论域空间分布的中心,即最能够代表定性概念的点;熵是定性概念的不确定性度量,既反映了能够代表这个定性概念的云滴的离散程度,又反映了论域空间中可被概念接受的云滴的取值范围;超熵是熵的不确定性度量,即熵的熵,由熵的随机性和模糊性共同决定。现实世界中正态分布的普遍性与钟形隶属函数的普遍性,共同奠定了正态云模型普适性的理论基础[20],使得云模型方法在知识表示、数据挖掘和知识推理等领域获得了成功应用。

文中涉及的参考文献如下:

[1]Liu Y,Ngu A H and Zeng L.QoS Computation and Policing in Dynamic Web ServiceSelection[A].In Proceedings of the 13th International Conference on World Wide Web(WWW2004)[C],New York,USA,May 17-20,2004,pp.66-73.

[2]满君丰,邱银安,陈青,等.语义Web服务框架模型研究[J].计算机集成制造系统,2005,11(10):1372-1379.

[3]牟帅,黄映辉,李冠宇.语义Web服务的OWL-S描述及其应用[J].计算机技术与发展,2009,19(1):13-16.

[4]吴健,吴朝晖,李莹,等.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(04):595-602.

[5]华进,钱雪忠.基于语义的Web服务发现模型研究[J].计算机工程与设计,2008,29(9):2394-2396.

[6]Wu X,Zhang L and Yu Y.Exploring Social Annotations for the Semantic Web[A].InProceedings of the 15th International Conference on World Wide Web(WWW 2006)[C],Edinburgh,Scotland,May 23-26,2006,pp.417-426.

[7]Spiteri L F.Structure and form of folksonomy tags:The road to the public library catalogue[J].Webology,2007,4(2):Article 41.

[8]刘丹.近年来国外Folksonomy的改进研究进展[J].图书情报工作,2010,54(8):55-59.

[9]刘晓光,金烨.网络服务自动化中基于非功能性条件约束的服务选择研究[J].计算机集成制造系统,2006,12(2):297-301.

[10]Stephan R-M,Yu H and Marcel T.Service Selection Based on Non-functional Properties[A].In Proceedings of the Workshops of the 5th International Conference on Service OrientedComputing(ICSOC 2007)[C],Vienna,Austria,September 17,2007,pp.128-138.

[11]李研,周明辉,李瑞超,等.一种考虑QoS数据可信性的服务选择方法[J].软件学报,2008,19(10):2620-2627.

[12]Sensoy M and Yolum P.A context-aware approach for service selection using ontologies[A].In Proceedings of the 5th International Joint Conference on Autonomous Agents andMultiagent Systems(AAMAS 2006)[C],Hakodate,Japan,May 8-12,2006,pp.931-938.

[13]Wang X,Vitvar T,Kerrigan M,et al.A QoS-Aware Selection Model for Semantic WebServices[A].In Proceedings of the 4th International Conference on Service Oriented Computing(ICSOC 2006)[C],Chicago,USA,December 4-7,2006,pp.390-401.

[14]张成文,苏森,陈俊亮.基于遗传算法的QoS感知的Web服务选择[J].计算机学报,2006,29(7):1029-1037.

[15]冯在文,何克清,李兵,等.一种基于情境推理的语义Web服务发现方法[J].计算机学报,2008,31(8):1354-1363.

[16]阳辉.一种支持QoS约束的Web服务模糊匹配方法[J].信息系统工程,2009,21(8):52-55.

[17]Wang P.QoS-aware web services selection with intuitionistic fuzzy set under consumer’svague perception[J].Expert Systems with Applications,2009,36(3):4460-4466.

[18]Yu L and Luo S.Discovery of services in context using rough sets[A].In Proceedings ofthe 2009 Joint Conferences on Pervasive Computing(JCPC 2009)[C],Taipei,China,December 3-5,2009,pp.299-304.

[19]李德毅,杜鹢.不确定性人工智能[M].北京:国防工业出版社,2005.

[20]李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34.

发明内容

针对上述存在的技术问题,本发明的目的是提供一种根据用户非功能性需求搜索Web服务的方法,利用云模型方法处理用户不确定和模糊的非功能性需求,消除影响现有方法准确性的一些主观因素(如专家先验知识),通过定性概念与定量数据的转换,返回更贴合用户认知常识的结果。

为达到上述目的,本发明采用如下的技术方案:

一种根据用户非功能性需求搜索Web服务的方法,包括:

(1)对用户的需求文本以句子为单位进行分词处理,抽取出其中的关键词;

(2)根据用户的语境,使用预先定义的本体对所获得的关键词进行语义歧义消解;

(3)从上述消除了歧义的关键词中识别出代表用户非功能性需求的关键词,将它们分别映射到对应的Web服务质量属性上;

(4)逐个收集候选Web服务中上述待分析质量属性的量化数据,使用云变换方法得到对应的以期望、熵和超熵三个数字特征表述的原子概念集合;

(5)通过概念的合并和综合,将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合;

(6)从上述每个候选概念集合中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念,根据它们各自对应的云模型生成查询的组合约束条件。

所述的步骤(4)进一步包括以下子步骤:

(4.1)根据收集的某一具体Web服务质量属性的数据生成其频率分布函数;

(4.2)将频率分布中的局部极大值点对应的属性值作为原子概念的期望,计算用于拟合频率分布并以此为期望的云模型的熵和超熵;

(4.3)在原频率分布中减去该原子概念对应的数值部分,继续寻找局部极大值点;

(4.4)重复(4.2)和(4.3),直到剩余的数据出现频率小于云变换允许的误差阈值。

所述的步骤(5)进一步包括以下子步骤:

(5.1)选择指定原子概念集合内当前概念层次中相距最近的两个概念;

(5.2)如果这两个概念对应的云模型期望曲线相交,则将它们合并为一个新的综合概念;

(5.3)用生成的综合概念替换掉当前概念层次中原来的两个概念;

(5.4)重复(5.1)至(5.3),直到达到合适的概念粒度。

所述的Web服务质量属性的定义遵循ISO/IEC 9126和OASIS(Organization for theAdvancement of Structured Information Standards)的Quality Model for Web Services。

所述的中文分词遵循《实用现代汉语语法》和《现代汉语语料库文本分词规范》,英文分词遵循《Unicode Standard Annex#29:Unicode Text Segmentation》。

所述的中文分词工具是ICTCLAS(Institute of Computing Technology,Chinese LexicalAnalysis System),英文分词工具是Z parser。

所述的本体使用W3C(World Wide Web Consortium)的OWL(Web Ontology Language)规范进行描述。

所述的本体解析和推理工具是Jena。

所述的Web服务来源于可访问的Web服务注册中心或注册库。

所述的合适粒度是指最后形成的概念层次中包含的概念数遵循“7±2”法则。

本发明具有以下优点和积极效果:

1)用户模糊的非功能性需求转化为筛选条件时,对应Web服务质量属性的约束条件无需人为输入确定的阈值或明确的隶属函数,而由真实Web服务数据的频率分布决定,能有效地消除专家先验知识的主观差异性和针对训练集的统计分析结果的环境条件差异性;

2)由于用户认知能力的差异,他们对所提出的非功能性需求的期望是不同的,通过与真实Web服务数据生成的变粒度的定性概念进行匹配,突出了用户的个性化特点,因而更贴合用户的实际需求,在一定程度上提高了查询的准确率。

附图说明

图1是本发明实施例的总体流程图;

图2是Web服务质量属性概念树图;

图3是概念合并时截断熵的示意图;

图4是候选Web服务的可用性数据的频率分布曲线图;

图5是使用云模型期望曲线拟合频率分布曲线的结果及误差分析图;

图6是通过云变换方法得到的28个原子概念对应的云模型图;

图7是两个原子概念合并成一个新概念的示意图;

图8是逐步合并原子概念得到合适粒度的候选概念集合的过程图;

图9是逐步合并原子概念对应的云模型得到合适粒度的候选概念集合的过程图。

具体实施方式

下面以具体实施例结合附图对本发明作进一步说明:

本发明提出的一种根据用户非功能性需求搜索Web服务的方法,具体步骤如下:

(1)对用户的需求文本以句子为单位进行分词处理,抽取出其中的关键词:

首先,对用户输入的需求文本进行分析,判断是中文还是英文;其次,对于中文输入以“。”为分隔符进行分句,对于英文输入以“.”为分隔符进行分句,如果没有上述字符则默认为是一句话;然后,使用ICTCLAS(http://ictclas.org/)遵循《实用现代汉语语法》和《现代汉语语料库文本分词规范》对中文句子进行分词处理,使用开源软件工具Z parser(http://sourceforge.net/projects/zpar/)遵循《Unicode Standard Annex #29:Unicode TextSegmentation》对英文句子进行分词处理;最后,过滤掉高频噪音词,如中文的“的”、“了”等,英文的“is”、“of”等。

(2)根据用户的语境,使用预先定义的本体对所获得的关键词进行语义歧义消解:

本体是共享的概念模型的形式化的规范说明,它明确和形式化定义概念及概念间的关系,提供了词汇含义无歧义理解的公共语义基础。词汇的语义歧义是指一词多义和多词一义的情况,例如,中文的“番茄”和“西红柿”虽然是不同的词汇,但实际上是指同一个事物,可以通过本体概念的等同关系,将“西红柿”映射为“番茄”;英文的“doctor”可以指博士,也可以指医生,应根据用户的真实语境确定其具体的含义,即赋予该词汇对应的本体概念明确的命名空间,如确定“doctor”的上位词为“career”、下位词为“patient”。

首先,判断待分析的关键词是中文还是英文;其次,使用开源软件工具Jena(http://jena.sourceforge.net/)解析相应的预先定义的使用OWL规范描述的本体;然后,对多词一义的情况进行处理,利用本体中定义的等同关系将相关的关键词映射为其等价概念,例如,由于术语翻译的差异,中文的“可理解性”和“易懂性”实际上都对应着英文的“understandability”;最后,对一词多义的情况进行处理,利用本体的推理机制,结合关键词的上下文语境,赋予它对应的本体概念明确的命名空间。

(3)从上述消除了歧义的关键词中识别出代表用户非功能性需求的关键词,将它们分别映射到对应的Web服务质量属性上:

首先,根据ISO/IEC 9126和OASIS的Quality Model for Web Services规范,构造Web服务质量属性概念树,如图2所示,这些概念分为功能性(包括适用性、正确性、互操作性和安全性4个子属性,其中安全性又包括保密性、完整性和隐私性3个子属性)、性能(包括响应时间、时延和吞吐量3个子属性)、稳定性(包括可用性、成功率和可达性3个子属性)、可靠性、费用和可管理性(包括易用性和可维护性2个子属性,其中易用性包括可理解性和可操作性2个子属性,可维护性包括可分析性、可伸缩性和可测试性3个子属性)六大类属性;其次,将上述概念(如“可用性”)与所有消除了歧义的关键词(如“高可用”)逐一进行(中文或英文的)字符串模糊匹配;然后,根据匹配程度,识别出代表用户非功能性需求的关键词,及其对应的Web服务质量属性概念;最后,如果无匹配对象或用户没有提出明确的非功能性需求,则默认用户的非功能性需求为使用免费的和高可用性的Web服务。

(4)逐个收集候选Web服务中上述待分析质量属性的量化数据,使用云变换方法得到对应的以期望、熵和超熵三个数字特征表述的原子概念集合:

在确定了要分析的Web服务质量属性后,从可访问的Web服务注册中心或注册库中收集候选Web服务的待分析质量属性的数据。该Web服务注册中心或注册库可以是企业构建供内部使用的,也可以是互联网上能公共访问的,如Seekda网站(http://webservices.seekda.com/)。Web服务的注册可采用OASIS的UDDI(Universal Description,Discovery,and Integration)、ISO/IEC 11179或ISO/IEC 19763-7,但不仅限于上述标准。通过代表用户功能性需求的关键词,查询Web服务注册中心或注册库,从而得到所需的候选Web服务。

该步骤所述的从量化数据到原子概念集合的云变换方法进一步包括以下子步骤:

(4.1)根据收集的某一具体Web服务质量属性X的数据D生成其频率分布函数f(x);

其中,f(x)=FREQUENCY(D),即对属性X的论域中的每一个可能属性值x,计算D中含有该属性值的记录个数,为方便计算可将f(x)进行归一化处理,使得f(x)的值介于0和1之间。

(4.2)将频率分布f(x)中的局部极大值点(即峰值位置)对应的属性值xi作为原子概念ci的期望Exi,计算用于拟合频率分布并以此为期望的云模型的熵Eni和超熵Hei

其中,使用云模型的期望曲线来拟合f(x)得到ci(期望为Exi)的Eni,拟合方法可采用最小二乘法、遗传算法或启发式方法等;对于根据云模型期望曲线确定隶属于ci的属性值集合Di利用不带确定度的逆向云算法求得相应的Hei,计算过程如下:

(4.2.1)计算Di中数据d的均值一阶绝对中心矩和方差其中K为Di中数据样本的规模;

(4.2.2),Hei=S2-π2×l2.

(4.3)在原频率分布中减去该原子概念ci对应的数值部分,继续寻找局部极大值点;

其中,新的频率分布函数x∈Di

(4.4)重复(4.2)和(4.3),直到剩余的数据出现频率小于云变换允许的误差阈值ε。

其中,ε用于控制熵的构造和迭代拟合次数,通常由用户指定或根据经验给定,其值越小,拟合的精度越高,生成的云模型越多,即对应的原子概念越多。

(5)通过概念的合并和综合,将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合:

假设从Web服务质量属性X的数据D中获得的原子概念集合C为{ci(Exi,Eni,Hei)},该步骤所述的通过概念的合并和综合得到合适粒度的候选概念集合C′,进一步包括以下子步骤:

(5.1)选择指定原子概念集合C内当前概念层次中相距最近的两个概念;

其中,两个概念c1和c2的距离dist(c1,c2)=|Ex1-Ex2|。

(5.2)如果这两个概念对应的云模型期望曲线相交,则将它们合并为一个新的综合概念c′;

其中,假设新概念c′(Ex′,En′,He′)由概念c1和c2合并而成,那么且截断熵En1′和En2′的计算过程如下:

(5.2.1)设和分别是c1和c2的期望曲线,令如图3所示,即和是和的不重叠部分,在和的交点部分截开得到;

(5.2.2),En1=12πUyc1dx,En2=12πUyc2dx.

为了计算方便,新概念c′的三个数字特征可通过He′=max(He1,He2)近似求得。

(5.3)用生成的综合概念c′替换掉当前概念层次中原来的两个概念c1和c2

(5.4)重复(5.1)至(5.3),直到达到合适的概念粒度。

其中,合适粒度是指最后形成的概念层次中包含的概念数遵循“7±2”法则,符合人类认知心理的特点。

(6)从上述每个候选概念集合中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念,根据它们各自对应的云模型生成查询的组合约束条件:

针对某个待分析的Web服务质量属性X,用户根据自己的认知水平从对应的候选概念集合C′中,选择一个与相应的代表其非功能性需求的关键词最匹配的概念c′,生成对应的约束条件[Ex′-En′,Ex′+En′],即X的约束值应介于Ex′±En′之间。然后,将各个待分析的Web服务质量属性的约束条件组合起来,形成查询条件,返回合适的Web服务给用户。

实施例

下面将结合一个中文用户的实际搜索案例来详细描述本发明的实施过程。

首先,执行步骤(1)和(2),对用户的需求文本以句子为单位进行分词处理,抽取出其中的关键词,并根据用户的语境,使用预先定义的本体对所获得的关键词进行语义歧义消解。

用户使用搜索引擎时,一般会输入尽量简单的查询条件,而且不会有“。”等句子结束符。考虑到上述因素,假设用户的搜索需求为“高可用的免费外汇牌价服务”。将此需求文本默认为是一句话,遵循《实用现代汉语语法》和《现代汉语语料库文本分词规范》,使用ICTCLAS工具来进行分词(如图1中的“分词处理”步骤所示),得到“高可用”、“的”、“免费”、“外汇”、“牌价”和“服务”6个词汇。由于是对Web服务进行搜索,可以将“服务”一词过滤掉,同时过滤掉“的”这种高频噪音词,得到“高可用”、“免费”、“外汇”和“牌价”4个关键词,如图1中的“去除高频噪音词”步骤所示。使用Jena工具解析预先定义的、使用OWL规范描述的本体,其中的概念“牌价”属于中国改革开放以前的特殊词汇,是指国家以挂牌方式公布的价格,经常与“外汇”、“批发”、“零售”等概念一起使用。在这里与“外汇”一词搭配,实际上是指专业的“货币汇率”(foreign exchange rates)概念,如图1中的“歧义消解”步骤所示。

其次,执行步骤(3),从获得的关键词中识别出代表用户非功能性需求的关键词,并将它们分别映射到对应的Web服务质量属性上。

将图2中的Web服务质量属性概念与获得的5个关键词进行字符模糊匹配(如图1中的“字符匹配”步骤所示),识别出代表用户非功能性需求的关键词“高可用”和“免费”,并将其映射到对应的Web服务质量属性概念“可用性”(availability)和“费用”(cost)上,如图1中的“映射为”步骤所示。由于“免费”不属于模糊概念,直接将其转化为查询的约束条件“费用为0”。

然后,执行步骤(4),逐个收集候选Web服务中上述待分析质量属性的量化数据,使用云变换方法得到对应的以期望、熵和超熵三个数字特征表述的原子概念集合。

Seekda网站是目前互联网上能公开访问的著名Web服务注册中心,截至2011年2月,注册的Web服务超过2万8千个,包括符合W3C的WSDL(Web Services Description Language)规范以及Web API(Application Programming Interface)规范的各类Web服务。通过关键词“外汇牌价”的等价概念“货币汇率”,共搜索到199个seekda网站上的相关注册Web服务,如图1中的“Web服务注册库查找”步骤所示。

逐个收集它们的“可用性”数据,构造频率分布函数,如图4所示。其中,横坐标表示可用性的值(单位为%),纵坐标表示该值出现的概率,即出现次数除以候选Web服务的规模。从图4可以看出,候选Web服务的可用性的值大多数集中在97%到100%之间。高频率出现的数据值对定性概念(如“高可用性”)的贡献一般大于低频率出现的数据值。如图1中的“云变换”步骤所示,根据步骤(4)描述的方法,首先将频率分布f(x)中的局部极大值点对应的属性值100作为原子概念c1的期望Ex1;然后,使用云模型的期望曲线通过启发式方法来拟合f(x)得到c1的En1为0.01,拟合结果及误差分析如图5(其中横纵坐标的定义与图4中的一样)所示;接着,对于根据云模型期望曲线确定隶属于c1的可用性值集合,利用不带确定度的逆向云算法求得相应的He1为0.001;最后,在原频率分布中减去该原子概念c1对应的数值部分,如果大于误差阈值ε(这里ε设置为0.001),继续寻找局部极大值点。重复执行上述步骤,得到28个代表可用性高低的原子概念,它们对应的云模型如图6所示(其中横纵坐标的定义与图4中的一样),相应的三个数字特征值如表1所示。

表1 28个原子概念对应的云模型的数据特征值

接着,执行步骤(5),通过概念的合并和综合,将所获得的原子概念集合逐一转化为对应的合适粒度的候选概念集合。

对于原子概念集合C内的28个原子概念,按照期望值从小到大排列,c14和c27(排列序号见表1)是当前概念层次中相距最近的两个概念,而且它们对应的云模型的期望曲线相交,因此将它们合并成一个新的综合概念,过程如图7(其中,横坐标表示可用性的值,单位为%;纵坐标为概念合并的次数,0为初始状态,包含28个原子概念)所示。通过步骤(5.2)中介绍的期望、熵和超熵的近似计算方法,得到新概念c′(55.51,0.579,0.1),并用它替换掉当前概念层次中原来的两个概念c14和c27。如图1中的“概念合并”步骤所示,重复执行上述步骤,如图8(其中横纵坐标的定义与图7中的一样)所示,图9是从云模型三个数字特征值的角度,进一步展现图8所示的合并过程。经过20次合并后得到8个候选概念,大致符合人类认知心理的“7±2”法则。从可用性的角度理解这8个概念的含义,如表2所示。

表2 8个候选概念的含义

最后,执行步骤(6),从上述每个候选概念集合中分别选出一个与相应的代表用户非功能性需求的关键词最匹配的概念,根据它们各自对应的云模型生成查询的组合约束条件。

针对Web服务的可用性数据,在获得的8个候选概念中,c(97.05,1.439,0.1)是与代表用户非功能性需求的关键词“高可用”最匹配的,因此对可用性的约束条件可量化为[95.61,100],如图1中的“定性定量转换”步骤所示。这里,考虑到实际使用中Web服务的可用性越高越好,所以将上界设定为100而非期望与熵的和98.49。然后,将“可用性值大于95.61”和“费用为0”作为查询的组合约束条件,对搜索到的Seekda网站上的199个与“货币汇率”相关的Web服务进行筛选(如图1中的“筛选”步骤所示),返回给用户相应的结果。

以上实施例仅供说明本发明之用,而非对本发明的限制,有关技术领域的技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变换或变型,因此所有等同的技术方案,都落入本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号