...
首页> 外文期刊>Linux Journal >Adeptol's Text Extraction Software
【24h】

Adeptol's Text Extraction Software

机译:Adeptol的文本提取软件

获取原文
获取原文并翻译 | 示例
           

摘要

Adeptol's new Text Extraction application is designed to extract text from documents in more than 150 file formats, which then can be processed by content aggregation tools and used for storing, publishing, archiving or searching. Adeptol's Java-based software mines text at up to 15,000 words per second and can be deployed on Linux, Solaris or Microsoft Windows. Some of the more than 150 file formats include Microsoft Office, OpenOffice.org and PDF. The software's output can be exported to a text file or text stream, which can be saved into a database or passed on to other applications. Developers also can leverage Text Extraction to build text extraction capabilities directly into their applications.
机译:Adeptol的新文本提取应用程序旨在从超过150种文件格式的文档中提取文本,然后可以使用内容聚合工具对其进行处理,并用于存储,发布,归档或搜索。 Adeptol的基于Java的软件以每秒15,000个单词的速度挖掘文本,可以部署在Linux,Solaris或Microsoft Windows上。超过150种文件格式中的一些包括Microsoft Office,OpenOffice.org和PDF。该软件的输出可以导出到文本文件或文本流,可以将其保存到数据库中或传递给其他应用程序。开发人员还可以利用文本提取功能直接在其应用程序中构建文本提取功能。

著录项

  • 来源
    《Linux Journal》 |2010年第200期|p.40|共1页
  • 作者

  • 作者单位
  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号