首页> 中国专利> 从一个或多个数据存储位置获得用户特定关注数据的概念利用

从一个或多个数据存储位置获得用户特定关注数据的概念利用

摘要

提供一种从已被编索引的较大数据集获得关注数据的计算机实施的方法,所述方法包括经由计算设备的用户接口定义与概念相关联的属性集。与所述概念相关联的每个属性被映射至与编索引后的数据相关联的属性,且基于与所述概念相关联的属性至与所述编索引后的数据相关联的属性的映射来检索与所述概念相关的关注数据。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-29

    未缴年费专利权终止 IPC(主分类):G06F16/903 专利号:ZL2014800450641 申请日:20140812 授权公告日:20200110

    专利权的终止

  • 2020-01-10

    授权

    授权

  • 2016-04-27

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140812

    实质审查的生效

  • 2016-03-30

    公开

    公开

说明书

对相关申请的交叉参考

本申请要求2013年8月15日提交的美国临时专利申请第61/866,202号的优先权;且要求2013年8月15日提交的美国临时专利申请第61/866,258号的优先权;其每一者的全文以引用的方式并入本文中。

技术领域

本发明的实施例涉及数据管理,具体地说,涉及提供一种对在一个或多个数据存储库内管理的数据编索引并检索所述数据以便按期望细节级别且基于用户偏好来提供数据的机制。

背景技术

法律文件、归因于法务存储措施或含有对律师问题的答复而可需要保留的文件以及商业或法规文件是许多行业需要数据挖掘及控制辅助的实例市场划分。由于公司产生的数字数据量正每年以显著速率(例如,60%至120%)增长,因此信息技术(IT)主管及职员在控制与管理所述数据相关联的成本时承受极大压力。可藉由理解正被管理的数据、需要被保留的数据及可被安全且永久地删除的数据的类型来完成期望成本目标。

此外,鉴于存储库内的大量数据,针对特定用途高效地存取数据及关于数据的信息(或元数据)是困难的。具体地说,一个用户可需要存取不同于另一用户的需要的特定数据子集(例如,用户可需要找到属于Fred但不属于Jane的文件)。可要求用户将业务概念(例如,身份、部门、供应商等)手动地转换成存取该业务概念所要求的特定类型数据(或元数据)所需的过滤器及其他工具,此可为冗长且低效的过程。

发明内容

根据本发明的一个实施例,提供一种从已被编索引的较大数据集获得关注数据的计算机实施的方法,所述方法包括经由计算设备的用户接口定义与概念相关联的属性集。与所述概念相关联的每个属性被映射至与编索引后的数据相关联的属性,且基于与所述概念相关联的属性至与编索引后的数据相关联的属性的映射来检索与所述概念相关的关注数据。

附图说明

通常,各图中的类似参考数字用以指定类似组件,这些附图是:

图1为本发明的实施例的实例计算环境的图解说明;

图2为根据本发明的实施例的创建信息集的实例方式的流程图;

图3为根据本发明的实施例的用于选择源信息集的实例图形用户接口屏幕的示意性说明;

图4为根据本发明的实施例的用于选择用于从源信息集创建信息集的过滤器的实例图形用户接口屏幕的示意性说明;

图5为根据本发明的实施例的用于键入信息集的名称及其他元数据的实例图形用户接口屏幕的示意性说明;

图6为根据本发明的实施例的对由信息集指定的数据应用操作的实例方式的流程图;

图7为根据本发明的实施例的用于选择用以对由信息集指定的数据应用的操作的实例图形用户接口屏幕的示意性说明;

图8为根据本发明的实施例的展示生成并定义概念以用于从数据存储库获得与所述概念相关联的期望数据的管理流程的流程图;

图9为根据本发明的实施例的展示用户选择概念以从数据存储库获得期望数据的流程图;

图10为根据本发明的实施例的展示在图1的计算环境中实施的概念引擎实施概念以生成一个或多个数据集的方式的流程图;

图11至图13提供根据本发明的实施例的用于选择并使用概念的实例图形用户接口屏幕的示意性说明。

具体实施方式

本发明的实施例关于各种数据存储库内数据的管理,同时允许数据在这些存储库中保持完好。关于数据的信息(或元数据)被提取,且被插入至与数据存储库的数据分离地存储的索引中。

本发明的实施例包括用于从数据存储库检索信息及元数据的构架。经由被验证为可检索数据且在一些实例中改变数据的适配器存取个体数据存储库。用户可提供其自己的用于定义信息集(或所管理数据子集)以包括用户关注的信息的规则,且指示对所定义信息集的参考,藉此允许实现跨越不同访问方法及不同存储库的存取规则。举例而言,用户可对存储于UNIX文件系统及WINDOWS文件系统中的数据感兴趣。用户可命名并存储具有所要结果数据的信息集以便稍后存取该数据。

藉由将基于所收集的信息的过滤器应用于所管理数据来创建信息集内的数据。此所收集信息提供一定程度的理解,从而使得用户能够识别对于使用状况是特定的或感兴趣的数据。

本发明的实施例进一步允许实现收集用于做出决策或执行任务的特定数据,而不必理解关于底层的特定数据放置及数据访问方法的细节。具体地说,本发明的实施例可如本文中进一步详细地描述而利用概念来生成信息集,所述概念定义并表示信息的类别或类型,信息的类别或类型表示用户关注的一个或多个业务对象。概念由描述并区分概念的组成项(constituent)的属性集来定义,且属性被映射至藉由对一个或多个数据存储库进行数据收集而获得的编索引后的数据的属性。组成项也与所定义概念相关联,且利用所定义的概念及相关联的组成项来实施信息集的创建。

本发明的实施例可确保效率,其中昂贵或耗时的操作仅在必要时执行且仅对受管理的总体数据的指定子集执行。举例而言,信息技术(IT)职员可藉由仅从文件、电子邮件、共同协作或其他服务器收集系统元数据而开始。所收集的信息包括与信息相关联的一个或多个索引,所述信息用以将所定义的概念的属性映射至索引内的属性,以便允许用户存取信息集内的与特定概念对应的数据。

本发明的实施例提供若干优点,所述优点包括(但不限于):外部用户能够定义当概念应用至其特定情境或情形(亦即,使用状况)时概念的含义;根据本发明定义概念向用户提供了一种在不需要知晓最初存储数据的方式及地点的细节的情况下检索关于数据的信息的方式;以及所定义概念促进对于编索引后的数据(来自数据收集)的复杂查询的执行,因此减少存储及用以检索对特定查询的答案的时间(以及使用户免受与概念相关联的复杂性的困扰)。

本文中最初描述实例实施例,从而展示可如何利用实例系统架构来生成信息集(如图1中所描绘)。接着,用于定义并利用用于存取数据存储库内的数据的概念的实例实施例在获得信息集的内容上下文中予以描述。然而,请注意,本发明不限于这些实例实施例,因为如本文中所描述地使用概念从数据存储库获得与所述概念相关的数据亦可利用其它合适技术来实施。

在图1中说明与本发明的实施例一起使用的一个实例环境。所述环境提供针对在数据存储库内保持完好的数据的数据管理。具体而言,所述环境包括应用服务器系统(或应用堆栈)2000、网关系统2100、一个或多个数据服务器系统2200,及一个或多个客户端或终端用户系统以使得用户和/或管理员能够存取各种数据管理服务。应用服务器系统、网关系统、数据服务器系统及客户端系统可彼此远离,且经由网络通信。网络可藉由任何数目的任何合适通信介质(例如,广域网(WAN)、局域网(LAN)、因特网、企业内部网络等)来实施。备选地,这些系统可彼此皆在本地,且经由任何适当本地通信介质(例如,局域网(LAN)、硬联机、无线链路、企业内部网络等)通信。

应用服务器系统(或应用堆栈)提供基于浏览器的图形用户接口(GUI)的骨干,且持有并提供关于应用对象的信息(例如,元数据、状态信息等)。应用服务器包括管理组件2010及数据组件2020。管理组件提供各种管理任务(例如,卷、数据源、系统信息集、使用状况特定的过滤器、动作、信息集、工作流程、仪表板等的配置)。这些任务可由各种用户(例如,信息技术(IT)专家、数据管理专家及主题专家等)来执行。数据组件提供针对终端用户的数据管理任务(例如,信息集创建、数据扩充的执行等)。

网关系统2100充当应用服务器系统(或应用堆栈)2000与数据服务器系统2200之间的网关,且将来自应用服务器系统的命令中继至数据服务器系统。数据服务器系统向网关系统注册并连接至网关系统,其中网关系统维护关于已注册且连接的数据服务器系统的最新信息。网关系统进一步持有关于应用级对象的额外(且在一些状况下)更详细的元数据及状态信息,且还维护从数据服务器系统聚集的某些类型的数据。

一个或多个数据服务器系统2200可驻留于各种本地或远程位置(例如,远程办公室、全球办公室等)以存取数据管理服务的客户或消费者的数据。数据服务器系统可被水平地扩展以满足处理需要。数据服务器系统具有到其数据驻留于的许多类型的客户或消费者数据源的连接器。这些连接器具有质询、收集且在某些状况下修改数据源的内容的能力。另外,每一数据服务器维护其已自被指派给数据服务器系统的客户数据服务器收集的任何数据的索引。数据服务器系统依据收集数据、执行动作、执行搜索及更深数据分析而执行大部分处理及计算。因此,数据服务器系统提供对客户或消费者数据的存取,以允许实现对所述数据的管理,同时客户数据在客户数据存储库或服务器系统内保持完好。

应用服务器系统2000、网关系统2100、数据服务器系统2200及客户端系统可藉由优选配备有以下各项的任何常规或其他计算机系统来实施:显示器或监视器、基本件(例如,包括至少一个处理器、一个或多个存储器和/或内部或外部网络接口或通信设备(例如,调制解调器、网络卡等))、可选输入设备(例如,键盘、鼠标或其他输入设备),及任何市售且定制软件(例如,服务器/通信软件、数据及管理组件、浏览器/接口软件等)。这些系统可包括一个或多个模块或单元来执行下文所描述的本发明实施例的各种功能。各种模块可由任何数量的软件和/或硬件模块或单元的任何组合来实施,且可驻留于应用服务器、网关、数据服务器和/或客户端系统的存储器内以供系统处理器执行。

信息集提供已由数据服务器系统2200编索引的数据的虚拟数据“容器”。举例而言,信息集可具有对包括于索引中的记录的参考或句柄的列表的形式。信息集可表示所述数据中的一些或全部,且可为不可改变的。用户可基于特定选择准则过滤另一信息集的内容来从该另一信息集导出新信息集。信息集可被使用及重新使用以对所述数据执行广泛的多种操作(例如,复制数据、删除数据等)。随着底层索引被更新或重新创建,可创建新信息集以反映这些改变。因此,信息集可及时地提供用户的数据的“快照”。

用户接口(UI)可允许用户定义准则的规则(例如,指定身份、部门、组织、供应商、产品、监管人、对象性质、属性等)以封装编索引后的数据,创建满足准则的编索引后的数据的信息集,调整准则以形成新信息集,对信息集执行集合运算(例如,比较、识别改变、并集、交集、补集、对称差等),呈现运算的结果的报告,及将准则转换成具有过滤器的适配器以检索满足准则的数据。

藉由将用户定义的准则应用至整个索引或索引的至少一子集的搜索表达式中且使用信息集识别向满足准则的每一对象加标记而创建信息集。此外,亦创建并存储满足准则的对象的列表或表。随后的使用经由先前存储的列表提供对数据的快速存取。换言之,信息集可被视作对索引中的对象的参考的表。在一个实施例中,索引中的每一对象具有对象id,且信息集表具有对象id的列表。对象id可被单调地指派有整数、初始分配指针,或提供唯一识别的任何其他方式。

在图2至图5中说明根据本发明的实施例的从源信息集创建信息集的方式。最初,在步骤202处,用户经由由客户端系统2300的Web浏览器提供的基于浏览器的图形用户接口屏幕300(图3)选择源信息集。举例而言,用户接口屏幕300可包括用于按名称选择信息集的下拉式列表控件310。用户可从所有数据对象生成新信息集(例如,藉由选择所有数据对象的系统信息集作为源信息集),或从先前生成的信息集创建新信息集。

用户接口屏幕300可进一步包括概述信息312(例如,信息集中对象的总数、信息集的以兆字节计的大小、创建的数据及时间、描述等)、使得用户能够查看所选择信息集的细节(例如,世系(ancestry)、执行日志、数据对象)的“细节”单选按钮选项320,及其他信息和/或控件。举例而言,用户可审阅名为“仅Word文件(Worddocsonly)”的信息集的世系330,以确认信息集是通过从含有所有数据对象的系统提供的信息集选择具有“.doc”、“.docx”或指示word文档的任何其他合适扩展名的文件而从该系统提供的信息集创建的。

在步骤204处,用户选择过滤器以进一步缩减源信息集的内容。举例而言,用户可选择屏幕400(图4)的“创建(Create)”单选按钮选项420,以显示现有过滤器的库430,并选定用于选择在2013年1月之前创建的文件的过滤器432。用户可藉由致动“创建新信息集(CreateNewInfoset)”按钮440而选定使用所选择源及过滤器来创建新信息集。

在步骤206处,用户对新信息集命名,并开始其生成。举例而言,用户可在对话屏幕510(图5)的文本框520中键入名称,且可使用文本框530键入信息集的其他元数据,例如,描述。当用户保存此信息时,信息集的生成开始。具体地说,在步骤207处,客户端系统2300的浏览器将定义新数据集的用户输入传送到应用服务器系统2000的Web服务。在步骤208处,用户可通过使用屏幕300选择新信息集且周期性地刷新屏幕以查看(例如)概述信息312、状态信息、事件历史、可用动作等来监视生成信息集的进度。

在步骤210处,应用服务器2000的Web服务验证用户输入并向客户端系统2300的浏览器报告任何错误。在步骤212处,应用服务器2000的Web服务将元数据及状态信息存储于其数据库(应用服务器数据库110)中。在步骤214处,应用服务器2000的Web服务命令网关2100开始创建信息集。在步骤216处,应用服务器2000的Web服务亦开始针对正被创建的信息集的状态轮询,以便了解处理及最终状态的任何改变。

在步骤220处,网关2100判定待执行的工作的范围。具体地说,网关2100判定哪些数据服务器2200将参与执行工作。此情形可使用源信息集(例如,源数据驻留于其中)的元数据来判定。在步骤222处,网关存储新信息集的元数据,且在其自己的数据库(网关数据库120)中准备参与的数据服务器2200的详细状态信息。在步骤224处,网关命令每一参与的数据服务器开始信息集创建。数据服务器可同时且独立于彼此地执行其所指派工作。

在步骤230处,数据服务器2200向将属于新信息集的对象加标记。具体地说,数据服务器生成对对象的参考并将参考存储于数据服务器数据库130中,所述对象是源信息集的成员且亦满足过滤器表达式。数据服务器基于存储于其索引中的信息来判定成员关系。因此,在创建新信息集的过程期间,用户的实际数据驻留于的数据源并未被存取。为了效率,数据服务器可将成员关系生成划分成可并行地执行的较小任务。

每当较小加标记任务中的一者完成时,数据服务器2200在步骤232处向网关2100进行通知。在步骤234处,网关接收这些通知。作为响应,网关在网关数据库210中更新新信息集的详细状态信息。当应用服务器2000的Web服务在步骤216处请求更新时,此更新后的状态信息接着被发送至Web服务。

在步骤236处,数据服务器2200生成关于新信息集的内容的聚集后的信息,并将所述信息存储于数据服务器数据库130中。可以以(例如)多维数据结构(本文中被称作立方体(cube))存储此信息。为了效率,数据服务器可将立方体生成划分成可并行地执行的较小任务。在步骤238处,每当较小立方体生成任务完成时,数据服务器通知网关2100。网关在步骤240处接收这些通知,且更新网关数据库120中的信息集的详细的状态信息。当在步骤216处Web服务请求更新时,此更新后的状态信息接着被发送至应用服务器2000的Web服务。

当每一参与的数据服务器上的每一较小任务结束且状态信息在网关处且在应用服务器层级被更新时,信息集生成被视为完成。

图6及图7中说明根据本发明的实施例的对由信息集指定的数据应用操作的方式。最初,在步骤601处,用户经由由客户端系统2300的Web浏览器提供的基于浏览器的图形用户接口屏幕700(图7)选择信息集。举例而言,用户接口屏幕700可包括用于按名称选择信息集的下拉式列表控件310。用户接口屏幕700可进一步包括“行动(Act)”单选按钮选项720以呈现待应用的预定义动作的列表方框730。在步骤602处,用户选择期望动作(例如,删除、导出、移动、复制等)。举例而言,用户可从列表方框730选择删除操作732。用户可(例如)使用动作创建/编辑界面定义定制动作。在步骤603处,用户通过致动“执行动作(RunAction)”按钮740来发起动作。在一个实施例中,用户确认其意图以在额外步骤中执行动作(例如,响应于弹出对话框)。用户可通过在浏览器中周期性地刷新执行日志的视图而在604处监视动作的状态。

在步骤605处,应用服务器2000的Web服务验证用户输入,且将任何错误报告给客户端系统2300的网页客户端。在步骤606处,应用服务器2000的Web服务存储元数据及简要状态信息于应用服务器数据库110中。在步骤607处,应用服务器2000的Web服务命令网关2100开始执行指定动作。在步骤608处,应用服务器2000的Web服务发起针对正被执行的动作的状态轮询以便得知动作完成的时间。

在步骤609处,网关2100通过识别数据服务器2200中将实际上必须进行工作的特定数据服务器来判定工作的范围。将信息集的可用成员关系信息用于此用途。在步骤610处,网关将关于动作的元数据及状态信息存储于其网关数据库120中。在步骤611处,网关命令每一参与的数据服务器开始执行动作。数据服务器可同时且独立于彼此地执行其所指派工作。在步骤612处,网关亦发起轮询过程以便检测数据服务器处的任何严重情形(例如,电力中断)。

在步骤613处,数据服务器通过自其数据库(数据服务器数据库130)读取成员关系标记及额外参数来创建针对指定信息集的成员的迭代器(iterator)。迭代过程接收识别待执行的操作的参数。当请求下一项目时,已被执行操作的项目被绕过,且返回需要操作的下一项目。在步骤614处,数据服务器对于信息集的每一成员对象执行指定动作。应用动作要求数据服务器经由客户端网络140挂载客户的数据150驻留于(和/或应被传送到)的服务器,且在操作160处基于动作的类型来复制、删除、移动或导出受影响的对象。数据服务器可使用多个过程来对同时对多个对象进行动作。在步骤615处,对成员对象的动作的结果被作为审核记录写入数据服务器数据库130中。在步骤616处,当信息集的最终对象的处理完成时,数据服务器向网关进行通知。

在步骤617处,网关接收此通知,且更新网关数据库120中动作的状态信息。在步骤608处,当Web服务请求更新时,此更新后的状态信息接着被馈送至应用服务器2000的Web服务。

当每一参与的数据服务器结束(或已停止做出响应)且状态信息在网关处且于Web服务级别被更新时,动作被视为完成。

在步骤618处,用户可经由信息集的“例外状况查看(ExceptionsView)”来查看具有所选择类型的例外状况的细节。在步骤619处,应用服务器2000的Web服务请求网关返回所请求类型的例外状况及失败的对象的细节。在步骤620处,网关取回所请求的信息。在信息已被缓存于本地网关数据库120中的状况下,网关自其本地网关数据库120检索所请求的信息。否则,在步骤621处,网关请求参与所述动作的执行的数据服务器提供信息,在该状况下,参与的数据服务器基于数据服务器数据库130中的审核记录而识别并返回所请求的例外状况及细节。

可藉以生成信息集的一种方式是基于由用户定义且因此对于该用户对来自一个或多个数据存储库的数据的需要是特定的概念。概念由用户利用合适GUI来定义,以表示用户关注的数据的类别或类型,诸如身份(例如,雇员)、部门、组织、供应商、产品、项目、监管人等。举例而言,用户可基于一个或多个特定公司或其他业务实体的雇员、数据的监管人、与一个或多个业务实体相关联的供应商、与一个或多个业务实体相关联的项目等来定义概念。基于与概念相关联的属性集来定义概念。举例而言,公司的雇员的概念可具有与该概念相关联的属性,诸如用户名称、名、姓、雇员ID、雇员电子邮件地址等。定义概念的属性描述并区分该概念的个体组成项(例如,雇员概念的个体雇员)。所定义概念及其属性保存于合适位置(例如,在数据组件2020中或应用服务器系统2000的其他合适存储位置)中。应用服务器系统2000可支持针对不同用户的任何合适数目的不同概念,其中概念可由用户(例如,经由合适GUI)创建/生成,和/或在数据组件2020内被预定义。

在生成概念之后,组成项可被定义并与概念相关联,以基于组成项来限制对与概念相关联的数据的搜索。在雇员概念的实例实施例中,组成项可以是用户关注的一个或多个特定公司或其他业务实体的雇员的活动目录,其中活动目录可从外部源(例如,与关注的业务实体相关联的数据存储库)导入,或以任何其他合适方式获得(例如,通过定义在雇员数据中迭代以生成雇员集的迭代器)。概念的所定义组成项可被收集成群组,以供用户在搜索与概念相关联的数据时聚集使用。

所定义并存储的概念用以识别一个或多个存储库处的关注数据,其中数据被维护于存储库处(每个存储库具有其自己的存取接口)。在一种使用状况情境下,用户定义或选择概念(使用与用户相关联的GUI),识别组成项及映射。数据存储库(例如,针对公司的雇员的数据存储器)定义规则以用以存取特定数据。在存储库处可存在大型数据记录主体(corpus),包括字处理文档、电子邮件、文件、目录等。基于概念的属性及所识别的组成项的用户供应的规则可被映射至存储库的编索引后的数据。可使用查询及过滤器(例如,数据范围、数据的类型等)来检索与编索引后的数据相关的信息。

这允许不同用户提供针对其概念的不同定义以检索这些用户特别关注的数据。举例而言,不同客户可具有针对雇员及监管人的不同定义。针对定义的信息可以以特定格式包括于文档中(例如,word文档可包括识别与该文档相关联的雇员或供应商的特定输入项)。通过允许客户生成如本文中所描述的概念,客户可定义对于其公司如何运作特定的信息,且可接着执行查询以用于基于对对于公司的形式唯一的信息进行分类的概念从与公司相关联的数据存储库存取数据。

可以任何合适方式从存储库收集所识别的关注数据。将具有过滤器的适配器用于从存储库检索数据-该适配器已与利用所述概念的检索查询及与所述概念相关联的一个或多个组成项相关联。

现参看图8至图10的流程图来描述用于使用属性生成/定义概念、将概念映射至编索引后的数据、选择概念的组成项,及利用概念引擎生成与具有所选择组成项的概念相关的信息集的技术。

参看图8,描述发生于应用服务器2000处的处理步骤的管理流程,其中在8010处最初藉由数据属性来定义概念。概念可由用户利用(例如)与用户的客户端设备相关联的GUI来预定义(例如,最初加载于数据组件2020内的一个或多个概念)以供选择,用户的客户端设备与应用服务器2000交互。备选地,利用GUI,用户可藉由最初定义待与概念相关联的属性来创建概念。举例而言,在将概念用以定义一个或多个业务实体的雇员的情境下,与雇员概念相关联的属性可为(例如)名、姓、雇员ID、雇员电子邮件地址等。具有属性的所定义概念可被保存(例如,在应用服务器200处的合适存储器位置处)以供同一和/或其他用户稍后使用。在8015处,定义所述概念的至待搜索的数据存储库的编索引后的数据(例如,藉由一个或多个数据服务器系统2200从一个或多个存储库进行数据收集而获得的编索引后的数据)的映射。具体地说,概念的属性(例如,雇员概念的名、姓等)被映射至编索引后的数据的属性。举例而言,在用户需要从一个或多个数据存储库获得电子邮件数据的情境下,雇员概念的名及姓属性可被映射至电子邮件字段(例如,将雇员的名及姓映射至电子邮件数据的收件人及发件人字段)。可由应用服务器2000基于具有属性的概念及编索引后的数据自动地执行映射。

在8020处,概念的组成项被添加或导入且与概念一起被保存,其中这些组成项可由定义概念的用户选择。如关于图9的过程步骤所描述,用户可选择待应用至概念的所关注组成项。举例而言,在雇员概念的情境下,组成项可为雇员的一个或多个指定集合,诸如来自公司A的有效雇员名册或来自公司A、B及C的在特定分部工作的所有雇员(例如,如由雇员ID所定义)等。组成项的导入可通过存取包括组成项数据的合适数据存储位置来完成(例如,存储于公司的数据库处的公司的有效雇员名册)。组成项数据的添加或导入可以是管理过程中的进行中处理,其中组成项数据基于任何改变(例如,公司的有效雇员名册的改变)而连续更新。

参看图9,描绘用户流程,其展示与用户选择用于从一个或多个数据存储库获得关注数据的概念相关联的过程步骤。在8025处,使用GUI,用户为使用状况选择概念(先前基于图8的过程步骤所定义)。在8030处,使用GUI选择用户关注的组成项以用于该使用状况(例如,从一个或多个特定公司选择一个或多个有效雇员)。

在8035处,使用GUI来选择概念的属性至编索引后的数据的属性的适当映射。举例而言,可基于用户需要的特定类型文档(例如,电子邮件、字处理文档、任何其他类型的文档文件)、需要文档的日期(例如,具有在指定范围内的发送或创建日期的电子邮件或其他文档)等来选择映射。在先前提及的实例中,当用户需要特定雇员的电子邮件时,发生的映射可以是雇员的名和/或姓与电子邮件所关联的收件人及发件人字段的映射。在此情境下,用户可(例如)通过简单地指定电子邮件作为待与使用状况相关联的期望文档而选择适当映射。在8040处,基于概念、所选择的组成项及与该使用状况相关联的适当映射而自动地创建数据的一个或多个信息集。

参看图10,描述用于基于用户对概念的使用状况生成信息集的与概念引擎相关联的过程步骤(例如,被提供为数据组件2020的一部分)。在8045处,概念引擎接收与由用户(经由用户的GUI)针对使用状况选择的概念、与概念相关联的所选择组成项,及基于与用户相关联的过程步骤(如图9中所描绘)的映射信息有关的信息。在8050处,概念引擎使用映射生成针对组成项的数据过滤器。举例而言,在雇员概念被用户选择用于使用状况且雇员进一步选择电子邮件数据作为特定雇员要找到的数据的情境下,数据过滤器将搜索限于电子邮件数据的收件人及发件人字段,其中使用所生成的数据过滤器从一个或多个数据存储库搜索与特定雇员相关联的电子邮件文档。在8055处,由概念引擎基于使用数据过滤器对一个或多个数据存储库的搜索而生成一个或多个信息集。在8060处,概念引擎将一个或多个信息集报告给用户。用户可(例如)经由与用户相关联的GUI来存取信息集。

现关于图11至图13描述使得用户能够与应用服务器2000的数据组件2020(包括概念引擎)交互的GUI的一个实例实施例。参看图11,自GUI9000内的下拉式选单按钮9002选择身份(IDENTITY)概念,其中GUI9000当前正显示概念(CONCEPTS)视图(可在GUI顶部处的菜单列中选择其他视图)。概念(CONCEPTS)视图显示包括与概念成员相关联的属性的概念成员(名及姓、电子邮件地址、所有者ID、公司及部门)。用户选择GUI9000内的创建成员(CREATEMEMBER)功能(通过选择按钮9004)以将另一概念成员添加至身份(IDETITY)概念。响应于做出创建成员的选择,在图12中提供窗口9006,所述窗口9006具有用户可藉以提供与新概念成员相关联的属性的字段。在将信息键入窗口9006内的字段之后,用户可保存此数据,从而导致新概念成员被添加至身份概念,如图13中所描绘、9000处所展示。虽然此实例实施例促进概念组成项至指定概念的手动键入,但如先前所提及,亦可针对概念自动地填充此信息(基于从合适数据源导入的数据,例如,来自公司的雇员的所选择群组)。

因此,本文中所描述的实例实施例通过允许用户利用具有由用户选择以表征及识别用户针对特定使用状况所关注的数据的特定属性及组成项的概念,促进数据的有效处理,所述数据基于用户的特定需要而对于用户有用。具有相关联组成项的概念至编索引后的数据的映射允许对编索引后的数据执行复杂查询,同时使对查询的答案的检索时间最小化。此外,用户可从不同存储库检索数据,而不需要知晓存储数据的方式及地点的细节。

应了解,上文所描述且附图中所说明的实施例仅表示实施用于利用概念从一个或多个数据存储位置获得用户特定关注的数据的实施例的许多方式中的几个。

本发明的实施例的环境可包括任何数目的计算机或其他处理系统(例如,客户端或终端用户系统、网关系统、服务器系统等)及以任何所要方式配置的数据库或其他存储库,其中本发明的实施例可应用至任何所要类型的计算环境(例如,云计算、客户机-服务器、网络计算、主机、独立系统等)。本发明的实施例使用的计算机或其他处理系统可由任何数目的任何个人或其他类型的计算机或处理系统(例如,桌面计算机、膝上型计算机、PDA、移动设备等)实施,且可包括任何市售操作系统及市售且定制软件的任何组合(例如,浏览器软件、通信软件、服务器软件、数据及管理组件等)。这些系统可包括任何类型的监视器及输入设备(例如,键盘、鼠标、语音识别等)以键入和/或查看信息。

应理解,本发明的实施例的软件(例如,浏览器软件、通信软件、服务器软件、数据及管理组件等)可以任何所要计算机语言来实施,且可由计算机领域的技术人员基于包含在说明书中的功能描述及在附图中说明的流程图来开发。另外,本文中对执行各种功能的软件的任何参考通常指在软件控制下执行这些功能的计算机系统或处理器。本发明的实施例的计算机系统可备选地由任何类型的硬件和/或其他处理电路来实施。

计算机或其他处理系统的各种功能可以任何方式分散于任何数目的软件和/或硬件模块或单元、处理或计算机系统和/或电路间,其中计算机或处理系统可彼此在本地或远离地安置,且经由任何合适通信介质(例如,LAN、WAN、企业内部网络、因特网、硬联机、调制解调器连接、无线等)而通信。举例而言,本发明的实施例的功能可以任何方式分散于各种终端用户/客户端与服务器系统和/或任何其他中间处理设备间。上文描述且流程图中说明的软件和/或算法可以以实现本文中所描述的功能的任何方式来加以修改。此外,流程图或描述中的功能可以以实现所要操作的任何次序来执行。

本发明的实施例的软件(例如,浏览器软件、通信软件、服务器软件、数据及管理组件等)可存在于用于与独立系统或由网络或其他通信介质连接的系统一起使用的固定或便携程序产品设备或装置的非暂时性计算机可读或可用介质(例如,磁或光介质、磁光介质、软盘、CD-ROM、DVD、存储设备等)上。

通信网络可由任何数目的任何类型的通信网络(例如,LAN、WAN、因特网、企业内部网络、VPN等)来实施。本发明的实施例的计算机或其他处理系统可包括任何常规或其他通信设备以经由任何常规或其他协议在网络上通信。计算机或其他处理系统可利用任何类型的连接(例如,有线、无线等)以访问网络。本地通信介质可通过任何合适通信介质(例如,局域网(LAN)、硬联机、无线链路、企业内部网络等)来实施。

所述系统可使用任何数目的任何常规或其他数据库、数据存储区或存储结构(例如,文件、数据库、数据结构、数据或其他存储库等)来存储信息(例如,元数据、状态信息、属性信息、映射信息、概念、组成项、信息集等)。数据库系统可由任何数目的任何常规或其他数据库、数据存储区或存储结构(例如,文件、数据库、数据结构、数据或其他存储库等)来实施以存储信息(例如,元数据、状态信息、属性信息、映射信息、概念、组成项、信息集等)。数据库系统可包括于以下各项内或耦接至以下各项:服务器、网关和/或客户端系统。数据库系统和/或存储结构可远离计算机或其他处理系统或在计算机或其他处理系统本地,且可存储任何期望数据(例如,元数据、状态信息、属性信息、映射信息、概念、组成项、信息集等)。

本发明的实施例可使用任何数目的任何类型的用户接口(例如,图形用户接口(GUI)、命令行、提示等)从而获得或提供信息(例如,元数据、状态信息、属性信息、映射信息、概念、组成项、信息集等),其中接口可包括以任何方式配置的任何信息。接口可包括安置于任何位置以经由任何适当输入设备(例如,鼠标、键盘等)键入/显示信息并发起所要动作的任何数目的任何类型的输入或致动机构(例如,按钮、图标、字段、框、链接等)。接口屏幕可包括任何合适致动器(例如,链接、选项卡等)以便以任何方式在屏幕之间导航。

在此使用的术语只是为了描述特定的实施例并且并非旨在作为本发明的限制。如在此使用的,单数形式“一”、“一个”和“该”旨在同样包括复数形式,除非上下文明确地另有所指。还将理解,当在此说明书中使用时,术语“包括”和/或“包含”指定了声明的特性、整数、步骤、操作、元素和/或组件的存在,但是并不排除一个或多个其它特性、整数、步骤、操作、元素、组件和/或其组合的存在或增加。

下面权利要求中的对应结构、材料、操作以及所有功能性限定的装置或步骤的等同替换,旨在包括任何用于与在权利要求中具体指出的其它元件相组合地执行该功能的结构、材料或操作。出于示例和说明目的给出了对本发明实施例的描述,但所述描述并非旨在是穷举的或是将本发明限于所公开的形式。在不偏离本发明的范围和精神的情况下,对于所属技术领域的普通技术人员来说许多修改和变化都将是显而易见的。实施例的选择和描述是为了最佳地解释本发明的原理和实际应用,并且当适合于所构想的特定使用时,使得所属技术领域的其它普通技术人员能够理解本发明的具有各种修改的各种实施例。

出于示例目的给出了对本发明的不同实施例的描述,但所述描述并非旨在是穷举的或是限于所公开的实施例。在不偏离所述实施例的范围和精神的情况下,对于所属技术领域的普通技术人员来说许多修改和变化都是显而易见的。本文中所用术语的选择,旨在最好地解释实施例的原理、实际应用或对市场中的技术的技术改进,或者使所属技术领域的其它普通技术人员能理解本文公开的实施例。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是—但不限于—电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输介质传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读存储介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本发明的一个实施例可通过用于从较大数据集获得关注数据的方法、系统及计算机程序产品来表征,其包括经由计算设备的用户接口促进用户定义表示业务对象的概念;响应于用户定义所述概念,根据所述概念对数据编索引。所述业务对象可包括包含身份、部门、组织、供应商、产品、项目、监管人等的任何类型的数据。所述概念可包括定义该概念的属性。关于概念所存取的数据可维护于存储库中,每个存储库具有其自己的存取接口。用户接口可用于促进将概念转换成具有过滤器的适配器,以根据关于概念的用户请求来检索数据。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号