您现在的位置: 六合教研网 >> 资讯中心 >> 电化教育 >> 电化教研 >> 文章正文 用户登录 新用户注册
[组图]转换电子文稿为纯文本工具         ★★★ 【字体:
转换电子文稿为纯文本工具
作者:吴克春    文章来源:本站原创    点击数:    更新时间:2007-3-5

信息检索好帮手: DMC Text Filter

这是一款能够将各种电子文档中的特殊控制信息除掉,并将纯文本内容进行快速抽出的软件。通过DMC Text Filter(纯文本抽出通用程序库),用户可以对各种文件简单快速地进行处理,而文本提取过程中完全独立于生成文件的原应用软件,网址为http://www.hyfsoft.com.cn/,操作界面如附图所示。

在文件识别方面,DMC程序库并不根据文件的扩展名识别,而是根据文件的内部信息来进行格式识别,能够准确辨别多种文件格式类型。目前支持PDF(含加密格式)PagemakerWordExcelPowerPointRTF HTMLXMLLotus 1-2-3以及AutoCAD等多种文件格式的识别。

DMC Text Filter可以从指定的文件或嵌入在文件中的OLE对象中抽出文本内容。它还提供对PDF文档的支持,不仅支持通常的PDF文件的文本抽出,还支持压缩格式及具有安全性口令保护的PDF文件的文本抽出。

文章录入:吴克春    责任编辑:吴克春 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    最新热点 最新推荐 相关文章
    没有相关文章
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    版权所有:六合教研      关于我们        苏ICP备 05079267 号  
    制作维护:刘 义      主 办:南京市六合区教育局教研室
    地址:六合区雄州镇延安北路21号(原四中南侧) 邮编:211500