首页> 中国专利> 一种实现图书自动组稿按需印刷的方法和系统

一种实现图书自动组稿按需印刷的方法和系统

摘要

本发明公开了一种实现图书自动组稿按需印刷的方法和系统,涉及数字出版领域。本发明首先利用文章结构化装置对历史图书资源的图书篇章结构进行拆分,使图书文章结构化;通过服务器接收存储文章结构化装置输出的结构化文章资源,并对文章的属性信息进行标注;然后利用图书组稿智能客户端完成图书的自动组稿,最后通过图书组稿输出装置对图书组稿智能客户端的组稿结构进行输出。通过本发明用户可以更精确的筛选所需的文章资源,以及文章的部分内容结构,进行图书组稿输出,实现了按需印刷服务,解决了现有技术存在的文章资源重复利用率低以及传统出版流程效率低、周期长的问题。

著录项

  • 公开/公告号CN102566945A

    专利类型发明专利

  • 公开/公告日2012-07-11

    原文格式PDF

  • 申请/专利号CN201010622066.6

  • 发明设计人 陈金莲;翟因为;

    申请日2010-12-24

  • 分类号G06F3/12(20060101);G06F17/25(20060101);G06F17/30(20060101);

  • 代理机构北京天悦专利代理事务所(普通合伙);

  • 代理人田明;任晓航

  • 地址 100871 北京市海淀区成府路298号方正大厦

  • 入库时间 2023-12-18 05:55:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-03-18

    授权

    授权

  • 2012-09-12

    实质审查的生效 IPC(主分类):G06F3/12 申请日:20101224

    实质审查的生效

  • 2012-07-11

    公开

    公开

说明书

技术领域

本发明涉及数字出版领域,具体涉及一种实现图书自动组稿按需印刷的方法和系统。

背景技术

目前在数字出版领域中,文字类资源多以一篇篇独立的文章为主,文章结构特点明显,每年的文字类出版物内容重复率高。针对文字出版物,传统的出版流程主要通过“选题策划、组稿、审稿、排版、印刷”的方式进行纸质出版,大量的历史资源没有进行数字化和结构化,往往需要重新开始选题,编辑人员则需要在大量的资源中进行手工筛选组稿,工作量繁重巨大,选择效率不高,造成了出版流程的周期长,选题稿件的资源利用率低等问题。

基于出版领域的现状,传统的出版流程已经不能满足于按需印刷的需求,出版社也面临着从传统纸质出版向数字出版的转型。而转型的重要一步是实现图书资源的结构化、电子化;实现图书组稿过程的数字化、自动化;而针对文字类资源,由于其较其他出版物鲜明的资源结构性特点,实现文章类资源的组稿自动化,为出版单位或读者提供按需印刷服务正是本发明要解决的问题。

发明内容

针对现有技术中存在的缺陷以及数字出版的需求,本发明的目的在于提供一种实现图书自动组稿按需印刷的方法和系统,通过该方法和系统能够解决出版领域传统出版流程资源利用率低、出版周期长的问题。

为解决上述技术问题,本发明采用的技术方案是一种实现图书自动组稿按需印刷的方法,包括以下步骤:

(1)采集图书的排版文件,对图书篇章结构进行拆分,使图书文章结构化;

(2)将结构化的图书文章经过服务器接口存入服务器,并对图书文章的属性信息进行标注;

(3)从服务器选择组稿所需的文章资源和文章的组稿模板,进行图书的智能组稿;

(4)将所述智能组稿完成的图书组稿结果进行输出。

进一步,如上所述的实现图书自动组稿按需印刷的方法,步骤(1)中,所述图书文章结构化,是根据图书的目录结构进行篇章拆分,形成稿件存储。

进一步,如上所述的实现图书自动组稿按需印刷的方法,步骤(2)中,所述对图书文章的属性信息进行标注,通过将图书文章进行按内容分类或者按来源分类对文章的属性信息进行标注。

进一步,如上所述的实现图书自动组稿按需印刷的方法,步骤(3)中,从服务器选择组稿所需的文章资源,并根据所选文章的属性信息自动提取图书目录结构,生成初步组稿目录,并对图书目录进行可视化修改。

进一步,如上所述的实现图书自动组稿按需印刷的方法,步骤(3)中,所述图书的智能组稿,能够选取文章的部分结构化内容进行组稿。

再进一步,如上所述的实现图书自动组稿按需印刷的方法,步骤(3)中,所述图书的智能组稿,能够选择文章的组稿模板,对选用文章的内容进行组合

更进一步,如上所述的实现图书自动组稿按需印刷的方法,步骤(4)中,所述将图书组稿结果进行输出,输出的格式为html格式、xml格式或者word格式;输出的形式为共享目录或者ftp形式。

一种实现图书自动组稿按需印刷的系统,包括:

文章结构化装置:用于对历史图书资源的图书篇章结构进行拆分,使图书文章结构化;

服务器:用于接收存储文章结构化装置输出的结构化文章资源,并对文章的属性信息进行标注;;

图书组稿智能客户端:用于提供图书自动组稿,进行图书目录的可视化组织以及目录内自动组稿;

图书组稿输出装置:用于对图书组稿智能客户端的组稿结果进行输出。

进一步,如上所述的实现图书自动组稿按需印刷的系统,用户通过验证才能登录服务器,服务器对外提供稿件查询、内容获取接口。

进一步,如上所述的实现图书自动组稿按需印刷的系统,所述图书组稿智能客户端通过服务器的查询接口,对服务器的稿件资源通过文章篇名属性信息进行检索;所述图书组稿智能客户端通过服务器内容获取接口进行稿件内容获取。

再进一步,如上所述的实现图书自动组稿按需印刷的系统,其特征在于:所述图书组稿智能客户端从服务器选择组稿所需的文章资源,根据所选文章的属性信息自动提取图书目录结构,生成初步组稿目录,并对图书目录进行可视化修改。

更进一步,如上所述的实现图书自动组稿按需印刷的系统,其特征在于:所述图书组稿智能客户端能够记录用户的本地工作空间,进行智能化的工作流程管理。

本发明的效果在于:本发明所述的方法和系统,提供了图书的按需印刷服务,满足了现代读者的需求。通过图书组稿客户端,用户可以更精确的筛选所需的文章资源,以及文章的部分内容结构,进行图书组稿输出,实现了按需印刷服务。采用本发明所述的实现图书自动组稿按需印刷的方法和系统,实现了对文字类资源的结构化拆分、标注、再组稿、模板输出,并具有以下显著效果:

实现了资源的结构化管理:通过文章内容结构化装置,对文字类资源进行结构化,通过建立服务器的文章库,对结构化资源进行管理;

提供了文章类资源的重复利用:通过图书组稿装置,可以对服务器的文章资源进行再次组稿利用,提供了资源的利用率,实现了结构化资源的再生价值;

提供了图书组稿的工作效率:基于服务器提供的资源检索服务和智能组稿客户端装置,大大改变了传统的出版流程,节约了组稿的人力、时间投入,缩短了出版周期,大大提高了工作效率;

提供了图书的按需印刷服务,满足了现代读者的需求,通过图书组稿客户端,用户可以更精确的刷选所需的稿件资源,以及输出的内容模板,进行图书组稿输出,实现了按需印刷服务。

附图说明

图1为本发明具体实施方式中一种实现图书自动组稿按需印刷的系统的结构框图;

图2为本发明具体实施方式中一种实现图书自动组稿按需印刷的方法的流程图;

图3为本发明具体实施方式中文章结构化效果图;

图4为本发明具体实施方式中图书自动组稿的流程图;

图5为本发明具体实施方式中图书自动组稿进行文章资源筛选的效果图;

图6为本发明具体实施方式中图书自动组稿目录制作的效果图;

图7为本发明具体实施方式中图书组稿输出的html格式的效果图;

图8为本发明具体实施方式中图书组稿输出的word格式的效果图。

具体实施方式

下面结合说明书附图及具体实施方式对本发明作进一步的说明。

如图1所示,为本发明具体实施方式中一种实现图书自动组稿按需印刷的系统的结构框图,如图所示,该系统包括包括文章结构化装置11、服务器12、图书组稿智能客户端13和图书组稿输出装置14;所述文章结构化装置11用于对图书资源的图书篇章结构进行拆分,使图书文章结构化;所述服务器12用于接收存储文章结构化装置输出的结构化文章资源,并对文章的属性信息进行标注;所述图书组稿智能客户端13用于提供图书自动组稿,进行图书目录的可视化组织以及目录内自动组稿;所述图书组稿输出装置14用于对图书组稿智能客户端的组稿结果进行输出。

其中,用户通过验证才能登录服务器12,服务器12对外提供稿件查询、内容获取接口。图书组稿智能客户端13通过服务器12的查询接口,对服务器的稿件资源通过文章篇名属性信息进行检索;通过服务器12内容获取接口进行稿件内容获取。图书组稿智能客户端12从服务器13选择组稿所需的文章资源,根据所选文章的属性信息自动提取图书目录结构,生成初步组稿目录,并对图书目录进行可视化修改。此外,图书组稿智能客户端还能够记录用户的本地工作空间,进行智能化的工作流程管理。

如图2所示,为本发明具体实施方式中基于图1中所示实现图书自动组稿按需印刷的系统的实现图书自动组稿按需印刷的方法的流程图,由图中可以看出,该方法包括以下步骤:

步骤S21:对图书篇章结构进行拆分,使图书文章结构化;

采集图书的排版文件,通过文章结构化装置11对已有的图书资源进行图书篇章结构化拆分使图书文章结构化。

首先,用户登录文章结构化装置11,通过服务器12任务查询接口获取结构化加工任务,根据任务号从服务器自动加载图书排版文件,以及文章结构化标签。加载过程中,系统自动对排版文件的篇章结构进行提取。如图3所示,为本发明具体实施方式中文章结构化效果图,用户登录文章结构化装置11,对排版文件“2007~2008年中国经济形势分析与预测”的篇章结构进行提取,如对其“书目”或其它的结构进行提取。

步骤S22:将结构化文章存入服务器,对文章的属性信息进行标注;

将步骤21中结构化的图书文章经过服务器接口存入服务器12,并对图书文章的属性信息进行标注。

服务器12对入库的图书文章资源进行存储管理,并对图书的属性信息进行标注。图书资源的存储表结构如表1所示,其中以SYS_DOCUMENTID存储文档ID,唯一标识稿件,以DOC_EXPLAIN存储稿件正文,以SYS_TOPIC存储文章篇名。

  SYS_DOCUMENTID  文档ID INTEGER  12  SYS_DELETEFLAG  是否删除 INTEGER  1  SYS_CREATED  创建时间 TIMESTAMP  0  SYS_LASTMODIFIED  最后修改时间 TIMESTAMP  0  SYS_CURRENTNODE  当前流程节点 INTEGER  4  SYS_CURRENTSTATUS  当前流程状态 VARchar  60  SYS_CURRENTUSERID  当前处理人ID INTEGER  5  SYS_CURRENTUSERNAME  当前处理人 VARchar  60  SYS_AUTHORS  作者 VARchar  255  SYS_topIC  文章篇名 VARchar  255  DOC_EXPLAIN  稿件正文 CLOB  0  DOC_CATALOG  稿件分类 VARchar  255  DOC_CATALOGID  稿件分类级联ID VARchar  255  DOC_CATALOGLEAFID  稿件分类叶子ID INTEGER  4  KEYWORDS  关键词 VARchar  255  DOC_SOURCE  稿件来源 VARchar  255  DOC_KNOWNTYPE  文体 INTEGER  3  DOC_ORICATALOGLEAFID  原书级联目录 INTEGER  4  DOC_0RICATALOGID  原书目录ID VARchar  255  DOC_ORICATALOG  原书目录名称 VARchar  255  DOC_PAGE  页码 INTEGER  0  DOC_REFID  关联附件ID LONG  4  WORDNUM  字数 INTEGER  0  REMARK  备注 CLOB  0  COUNTRY  国别 VARchar  32  TIMES  年代 VARchar  255  SUBJECT  主题 VARchar  255

表1

此外,服务器12还对对图书组稿智能客户端13的组稿目录进行存储,其中,组稿目录分为图书书目信息表和目录信息表,分别如表2和表3所示,其中图书书目信息表2与目录信息表3通过SYS_DOUMENTID和ENTRY_LINKID进行关联。

  SYS_DOCUMENTID  文档ID INTEGER  12  SYS_CREATED  创建时间 TIMESTAMP  0  SYS_LASTMODIFIED  最后修改时间 TIMESTAMP  0  SYS_CURRENTNODE  当前流程节点 INTEGER  4  SYS_CURRENTSTATUS  当前流程状态 VARchar  60  SYS_AUTHORS  作者 VARchar  255  SYS_topIC  书名 VARchar  255  B00K_VERSI0N  版次 INTEGER  3  ISBN  书号 VARchar  32  SERIES_NAME  丛书名 VARchar  255  PUBDATE  出版日期 DATE  0  B00K_CAT  图书分类 VARchar  1024  B0OK_CATID  图书分类ID INTEGER  0  B00K_CASCADID  图书分类级联ID VARchar  255  KEYWORDS  关键词 VARchar  255  REMARK  备注 CLOB  0  PAM_CATALOG  目录 CLOB  0

表2

  ENTRY_ID  目录ID  int  PARENT_ID  父目录ID  int  ENTRY_NAME  目录名  varchar(255)  ENTRY_CODE  目录编码  varchar(255)  ENTRY_LEVEL  目录级别  int  ENTRY_CASCADE_NAME  级联目录名  varchar(1024)  ENTRY_DISP_ORDER  目录排序  int  ENTRY_DELETE_FLAG  是否删除  int  LAST_MODI_MAN  最后修改人  varchar(80)  LAST_MODI_DATE  最后修改时间  datetime  ENTRY_LINKTABLE  目标关联表名  varchar(80)  ENTRY_LINKID  目录关联对象ID  int  WT_TYPE  目录节点类型  int  ENTRY_CASCADE_ID  目录级联ID  varchar(255)  CHILD_COUNT  子目录个数  int

表3

步骤S23:选择组稿所需的文章资源,进行图书智能组稿;

从服务器选择组稿所需的文章资源和文章的组稿模板,通过图书组稿智能客户端13进行图书的智能组稿。

如图4所示,为本发明具体实施方式中图书自动组稿的流程图,如图所示,图书组稿智能客户端13可以新建图书选题,并可以对服务器12的图书书目进行浏览,并对已有图书的文章目录结构进行预览。通过文章篇名等属性字段对服务器的文章资源进行检索,并对检索到的文章内容进行预览。根据用户所选文章的文体等属性信息自动提取目录结构,并通过可视化拖动界面技术进行图书目录制作。图书组稿智能客户端13可选择文章的组稿模板,对选用文章的内容进行组合,以达到除文章级的资源利用外更细粒度的资源选用,提高用户的选择准确性和组稿的智能化。此外,图书组稿智能客户端13还可以对图书组稿内容进行预览。

如图5所示,为本发明具体实施方式中图书自动组稿进行文章资源筛选的效果图。如图所示,通过文章篇名“论”对服务器的文章资源进行检索,通过检索用户得到“过秦论上”、“钱神论”等包含“论”字的文章资源。此外用户还可以对检索到的文章的内容进行预览,如点击文章列表中的“过秦论上”,用户就可以对其原文内容进行预览。

如图6所示,为本发明具体实施方式中图书自动组稿目录制作的效果图。如图所示,用户可以根据所选文章的属性信息自动提取文章的目录结构,如根据“时代”属性信息提取,用户就可以自动提取到以“隋唐五代”、“汉魏六朝”等以时代分类的目录结构,此外用户还可以通过可视化拖动界面技术进行图书目录的制作,如通过右键点击进行删除,拖动进行排序。

步骤S24:输出图书组稿模板。

通过图书组稿输出装置14将图书组稿智能客户端13完成的图书组稿结果进行输出。

本发明具体实施方式中提供两种图书输出方式,一种为用户可以在图书组稿智能客户端直接进行图书组稿结果输出,一种为在服务器上选择已经组稿的图书基础上再进行图书组稿输出。其中用户输出图书书目可以选择输出html格式以供用户浏览使用,输出xml格式供用户进行再次编辑出版,输出word格式进入传统的后续出版流程。选择输出的形式为共享目录或ftp形式。

如图7和图8所示,为本发明具体实施方式中图书组稿输出的效果图。如图所示,用户根据需要选择结构化的文章资源或者文章的部分结构化内容完成组稿后,可以选择html网页、xml结构数据或者word格式输出组稿后的图书目录。如图7中输出的为html网页格式可以供用户浏览使用,图8中输出的为word格式可以直接进入传统的后续出版流程,若选用xml格式输出则能够供用户进行再次编辑出版。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号