法律状态公告日
法律状态信息
法律状态
2020-06-23
未缴年费专利权终止 IPC(主分类):G06F17/20 授权公告日:20100428 终止日期:20190627 申请日:20030627
专利权的终止
2017-09-15
专利权的转移 IPC(主分类):G06F17/20 登记生效日:20170825 变更前: 变更后: 申请日:20030627
专利申请权、专利权的转移
2010-04-28
授权
授权
2005-08-03
实质审查的生效
实质审查的生效
2004-05-12
公开
公开
背景技术
近年来,标记语言普遍推广。一类标记语言,可扩展标记语言(XML),是一种能提供验证、交换并处理各类数据的通用性语言。例如,XML常用来创建由各类应用程序使用的文档。XML文件的要素具有关联的名称空间和模式。
在XML中,名空间是用于收集在XML文件中用作要素类型和属性名名称的唯一标识符。名空间的名称通常用于唯一地标识每一类XML文档。唯一的名空间区分来自不同来源而正好具有相同名称的标记要素。
XML大纲提供了描述和验证XML环境中数据的方法。模式阐明了什么要素和属性用于描述XML文档的内容,在哪里允许各个要素,其中允许什么文本内容的类型,以及哪些要素能够在哪些其它要素中出现。大纲的使用保证文件以一致的方式构建。大钢可由用户创建,并由诸如XML的相关标记语言支持。通过使用XML编辑器,用户能够操作XML文件并创建符合用户创建的模式的XML文档。可创建XML文档,使之符合一个或更多的大纲。
通常,文字处理器文档不能被外部应用程序理解,除非那些应用程序熟悉该文档的特定结构。这使应用程序不用广泛的并于应用的知识而对文字处理器文档操作变得极其困难。所需要的是易于操作、创建和显示与文字处理器关联的文档的方法。
发明内容
本发明涉及提供可由理解XML的应用程序来理解以自然XML文件格式的文字处理器文档,或使另一个应用程序或服务器来创建以XML方式的丰富文档,以使文字处理器应用程序能像打开自身文档那样将其打开。
根据本发明的另一个方面,文字处理器具有自然XML文件格式。良好形成的XML文件完全代表了文字处理器文档,并完全支持文字处理器的丰富格式。因此,这种自然XML表示的一个目的是当根据定义的XSD以XML方式保存文字处理器文档时没有特征损失。
根据本发明的另一个方面,存在有公布的XSD文件,该文件定义于文字处理器XML文件格式后面的所有规则。该模式描述了文字处理器的XML结构。该模式文件映像了内部文字处理器程序,且仍然易于使用。这样,该模式使第三方服务器和应用程序能创建可由应用程序理解的XML文件。
根据本发明的还有一个方面,在与XML关联的文件中提供关键点提示,它向理解XML的应用程序提供快捷方式来理解由文字处理器提供的一些特征。通过使用关键点提示,应用程序不必为了重建特征而了解文字处理器内部处理的所有特定细节。
又根据本发明的另一个方面,文字处理器文档存储在单XML文件中。应用程序将能够从这单个XML文件完全重建文档。这包括可存在于文档中的所有图像和其它二进制数据。本发明提供了表示单个XML文件中所有文档数据的一种方法。
再根据本发明的一个方面,可在不包括文字处理器的计算装置上进行文字处理器文档的操作。
附图说明
图1示出可用于本发明一个示范实施例的示范计算装置;
图2是可实行本发明的示范环境的方框图;
图3示出示范的WPML文件;
图4示出示范文字处理器XML文档的树图;
图5示出文字处理器XML文档的示范结构的方框图;
图6示出根据本发明的一个方面解释文字处理器的处理流程图。
具体实施方式
在说明书和权利要求中,下面的术语如下说明,除非在文本中以其它方式清楚地描述。
术语“标记语言”或“ML”是指在文档中确定怎样由应用程序解释文档各部分的专用代码。在文字处理器文档中,标记语言规定怎样将文本格式化或布局,而在HTML文档中,ML趋于指定文本的结构功能(例如,标题、段落、等等。)
术语“文字处理器标记语言”或“WPML”是指它与文字处理器应用程序有关的标记语言要素和与文字处理器应用程序有关的模式。ML或模式的这种类型也常称作文字处理器“自然”模式或标记。
术语“要素”是指ML文档的基本单元。该要素可包括用于ML文档的属性、其它要素、文本和其它构件块。
术语“标志”是指插入到文档中的一个命令,它描述ML文档中的要素。各个要素能够有不多于两个标志:开始标志和结束标志。可以有空要素(没有内容)在空要素中可只有一个标志。
在标志间的内容认为是要素的“孩子”(或后代)。因此,在要素内容中嵌入的其它要素称作“子要素”或“子节点”或要素。在要素内容中直接嵌入的文本称作要素的“子文本节点”。子要素和要素中的文本共同构成了要素“内容”。
术语“属性”是指设定为特定值并与要素有关的附加特性。要素可具有与其有关的任意数目的属性设定值,包括空值。属性用于将附加信息和不含有附加要素的要素相关联,或被看作为文本节点。
示范工作环境
参考图1,图中示出实现本发明的一个示例系统,包括诸如计算装置100的计算装置。在非常基本的配置中,计算装置100一般包括至少一个处理单元102和系统存储器104。根据计算装置的精确配置和类型,系统存储器104可为易失的(诸如RAM),非易失的(诸如ROM,闪存等),或这两者的某些组合。系统存储器104一般包括操作系统105,一个或多个应用程序106,且可包括程序数据107。在一个实施例中,应用程序106可包括文字处理应用程序120,在120中还包括ML编辑器122。在图1中基本配置由虚线108中的那些组件表示。
计算装置100可具有额外的特点或功能。例如,计算装置100也可包括额外的数据存储装置(可移动或不可移动的),比如磁盘、光盘或磁带。在图1中,这样的额外存储器由移动存储器109和不可移动存储器110表示。计算机存储介质可包括用于存储信息的任意方法或技术实现的易失和非易失,可移动和不可称动介质,诸如计算机可读指令,数据结构,程序模块,或其它数据。系统存储器104,可移动存储器109,和不可移动存储器110都是计算机存储介质的例子。计算机存储介质包括(但不仅限于)RAM、ROM、EEPROM、闪存或其它存储技术、CD-ROM、数据通用盘(DVD)或其它光学存储装置、盒式磁带、磁带、磁盘存储装置或其它磁存储装置、或任意其它可用于存储所需信息并可由计算装置100访问的其它介质。任意这样的计算机存储介质可是装置100的一部分。计算装置100也可具有输入装置112,诸如键盘、鼠标、光笔、语音输入装置、触摸式输入装置等。还可包括输出装置114,诸如显示器、扬声器、打印机等。这些装置众所周知,在下面无需讨论。
计算装置100也可包括通信连接116,通信连接允许该装置与其它计算装置118(诸如)通过网络通信。通信连接116是通信介质的一个例子。通信介质一般可体现为计算机可读指令、数据结构、程序模块或其它被调制的数据信号(诸如载波或其它传输机制)中的数据,并包括任意的信息传送介质。术语“已调制的数据信号”表示这样的信号,按照对信号中信息编码的方式使信号特征的一个或多个被设定或改变。作为举例,而非限制,通信媒体包括有线媒体(诸如有线网络或直接连线(direct-wired)连接)和无线媒体(诸如声音、射频和其它无线媒体)。这里所用的术语计算机可读介质包括存储媒体和通信媒体。
文字处理器文件结构
图2是说明应用本发明的示范环境的方框图。在图2中示出的示范环境是文字处理器环境200,包括文字处理器120、WPML文件210、WPML模式215和WPML验证引擎225。
在一个实施例中,文字处理器120具有其自己的名空间或名空间组,以及模式或一组模式,它们被定义为用于与文字处理器120关联的文档。用于由文字处理器120模式定义的这组标志和属性对于被称为自身自然标记语言(文字处理器标记语言(WPML))的程度上定义了文档格式。WPML由文字处理器120支持,遵守其它标记语言(诸如XML)的规则,然后它还创建其自身的规则。WPML提供标记语言,该语言包括丰富的显示信息,使用户能够请求而无需花费时间创建符合显示信息的模式。
文字处理器120在内部验证WPML文件210。当验证时,检验WPML文件是否符合WPML模式215。如上所述,模式阐明使用什么标志和属性来描述ML文档中的内容,在哪里可用这些标志,以及哪些标志可出现在其它标志中,以确保文档以相同方式构建。因此,当以任意WPML模式215阐明结构时,WPML210是有效的。
WPML验证引擎225类似于其它可用于ML文档的有效验证引擎工作。WPML验证引擎225估价在WPML验证引擎225格式中的WPML。例如,将XML要素发送到XML验证引擎。在一个实施例中,许多验证引擎可与文字处理器120关联,以验证大量ML格式。
图3示出符合本发明的示范WPML文件。WPML文件300包括WPML要素。在标记语言中一个要素通常包括打开标志(用“<”和“>”表示),一些内容,和关闭标志(用“<”和“>”表示)。在这些例子中,与WPML有关的标志包括标志中的“w:”(例如302)。“w:”前缀用作与该要素有关的名空间的简化符号。
对一个理解XML的应用程序需要有足够的WPML要素来从这单个XML文件中完全再造文件。还可包括关键点提示(hint)标志,它为应用程序提供信息来帮助理解文件的内容。对根据本发明一个实施例使用的WPML的更复杂的描述,请看下面的描述。在下面还讨论更详细的WPML文件的范例。
在文档中包含的文本紧接“T”标志以后,使应用程序易于从根据本发明的各个方面创建的文字处理器文档中提取文本内容。假定所示例子是有效的,WPML文件210提供了具有一个本件和两个段落的文件,在第一段落中包括文本“Work”在第二段落中包括“123Main”。
图4示出根据本发明各个方面的文字处理器文档的树图。XML文件中第一字段涉及文档信息和特性。
例如,可存储文档统计信息。这个信息可包括(但不仅限于)标题、主题、作者、经理、公司、分类、关键字。该信息也可涉及文档统计量,诸如创建日期、修改日期、最后一次访问日期、最后一次打印日期、页数、字、行、字符,等等。也可以存储自定义特性。
根据本发明的一个实施例,所有的字体定义在前面。字体信息包括支持字体信息。
类似地,定义了样式、表、编号,等等。样式字段包括不同列表级的格式、列表类型,以及列表所需的其它信息。在XML文件中包含的段落可指向列表样式,或它们可默认为一种样式。
字符样式包括涉及文字处理器文档中与文本有关的信息。例如,字符样式可包括,与字体样式、大小、颜色、下划线样式、文本效果、缩放比例、间距、字距调整,等等有关的特性。可包括由文字处理器定义的任何字符特性。文字处理文件的文档(运行文本)指向样式,以定义怎样显示文本。还可提供关键点提示,帮助应用程序显示文本。
段落样式通常包括字符特性和段落特性。段落特性可包括段落对齐、大纲级别、缩进,段落前后的间距、行间距,页码特性,等等。段落节可包括诸如段落样式名称、列表信息等的信息。
表样式可包括表设计专用的大量信息。这包括诸如条带(banding)等的信息。表特性包括诸如边界;宽度;和栅网单位这样的信息。表的栅网单位由表元引用以取得其宽度。
文本节点包括文件的实际内容。在这个节点中存储了用于该文字处理器文档的所有文档。这个特征使仅访问文件的内容变得容易。如果所需要的只是文本,那么所有其它要素均可省略。
节(section)特性包括诸如页面布局、页脚和标题信息及其它专用于文字处理器文档的节的信息。
运行文本引用了字符样式名称和允许特性。
在段落中有图像和对象。在段落中甚至包含浮动的图像和对象。当浮动时,这出现在锚点出现处。根据本发明的一个实施例,图像以二进制编码存储。对以二进制编码存储的示范图像,请在下面参考示范文字处理器文件。
涉及文字处理器的模板信息也可以存储在文字处理器文档中。根据本发明的一个实施例,模板信息在文字处理器文档中以二进制编码存储。
段落标记要素代表段落标记。由于段落标记本身可以具有自身的格式,我们需要输出一个要素以表示我们能够给出字符特性的段落标记。
因为能够观察文件的布局,一个应用可按其需要使用或多或少的信息。如果应用程序需要精确再创建或创建如文字处理器所创建的文件,则在文档中有足够的信息来这样做。另一方面,如果应用程序需要最小化格式内容,则应用程序也可这样做。
图5示出根据本发明各方面的文档方框图。式样505包括列表式样510,字符式样512,段落式样514,和表式样516。特性518包括文档特性520和信息特性522。文件体524包括示范节526和示范节528。节526包括段落530,段落530包括专用特性信息530和运行文本532。可以发现,运行文本可包括特性和文本或可能的图象或对象。
示范节528包括表550,表550包括表的特性和表行的定义,以及表中包含的表元。节也可包括脚注信息,打印信息,等等。
文件的不同部分可引用样式(505)来定义怎样显示要素。例如,如图中所示,一些段落可引用列表样式414或段落样式516。运行文本可引用字符样式412,而表可引用表样式516。
文字处理器文档包括允许其再创建应用程序的文档中的所有信息。
其它信息也可包括在文字处理程序所不需要的文档中。根据本发明的一个实施例,所包含的“关键点提示”要素允许外部程序能够易于识别特定的要素是什么,或怎样再创建组件。例如,特殊数目的格式可处于列表中并由外部程序使用来再创建文档而不需了解具体样式。
图6示出根据本发明特性的用于解释文档处理文档的过程流600。在开始方框后,过程移到方框610,在那里分析文字处理器文档。分析可包括察看整个文档,或只察看文件的具体部分。例如,一个应用程序可只为文本分析文档,另一个应用程序可为文本和图像分析文档,而另一个文档可用于文档中的整个增强内容。
过程进行到方框615,文档根据公布的XSD解释。XSD定义怎样解释由文字处理器创建的XML文档。
在判定方框620,确定是否显示文件。当显示文件时,过程移到显示文档的方框625。可向用户显示该文档以用于编辑或一些其它目的。当不显示该文档时,过程移到判定方框630。
在判定方框630,确定是否修改文档。文档可由用户修改,在没有用户的互动时则由应用程序自行修改。可出于许多原因而修改文档。例如,可添加或删除附加的文本,可不同地格式化部分文档,可添加图像,等等。当要修改文档时,过程移到修改文档的方框635(见图7和相关的讨论)。根据定义创建文字处理器文档所需的所有信息的XSD修改文档。在下面讨论示范XSD。
为进一步示出文字处理器文档,下面是根据本发明的各方面而创建的文字处理器文档。根据本发明的一个实施例,文字处理器文档存储在单个XML文件中。
根据本发明的一个方面创建的文字处理器文档是极增强的。如果需要,理解XML的应用程序可创建和/或修改文字处理器文档。如果需要,该应用程序也可忽略文本中的任意元素。例如,应用程序可只需知道在文档中包含的文本。根据该例,该应用程序只能提取由<w:T>标志表示的元素。
为了使应用程序理解由文字处理器创建的文字处理器文档,提供了XSD文档。下面是示范的XSD文档,可用于解释和/或创建XML中的增强文字处理文档。
如上所述,在XML中可提供关键点,为文件提供理解XML的应用程序的快捷操作,以理解由文字处理器提供的一些特征。通过使用关键点,应用程序不需要为再构特性而知道文字处理器的内部处理过程的所有细节。下面是根据本发明方面的示范关键点模式。
上述说明、例子和数据提供了本发明的完整制作描述和各部分的使用。因为在不背离本发明的精神和范围的情况下能够制作本发明的许多实施例,本发明决定于附加的权利要求。
机译: 存储在单个XML文件中的文字处理文档,可由理解XML的应用程序处理
机译: 存储在单个XML文件中的文字处理文档,可由理解XML的应用程序处理
机译: 存储在单个XML文件中的文字处理文档,可由理解XML的应用程序处理