作者:黑客基地 Dzl Oicq:59887868
特别感谢 钥 斑竹提供此 方法
由于工作的关系,古典辣M°经常要我们把一些加密的pdf文件转换成文本格式. 用单纯的pdf工具转换出来是乱码, 甚至有些
需要用工具扫描成图片格式, 然后然后用转换工具再将图片扫描成文字. 弄的我们是"谈pdf色变". 不过最近我们想出了
一个好办法, 有兴趣的朋友不妨试下吧~
工具:Adobe Acrobat Reader 6.0.1 简体中文版 http://crc.onlinedown.net/down/AdbeRdr60_chs_full.exe
尚书六号自动表格文字识别系统 2004
http://www.cnjpe.org/download/SHOCR6.rar
开工,首先我们用Adobe Acrobat Reader打开PDF文件,然后选择 编辑 --> 首选项 (图一)
然后在弹出的窗口,页面显示中,自定义分辨率里设置成150(图二)
其他默认,然后在平滑选项卡里,将平滑文本.平滑线状图.平滑图象三个选项前面的√去掉(图三)
点确定。
OK,现在开始复制图象,先点击快照工具(图四)
然后按住Ctrl+A这样可以选择整张图象,然后用Ctrl+C复制图象,再在桌面上用鼠标右键新建一个BMP图象,
然后打开新建的这个BMP图象在里面用Ctrl+V键盘粘贴刚才复制的图象,现在我们再点另存为,注意这里的格式要选单色(图五)
这样才可以扫描。
然后用尚书六号自动表格文字识别系统打开刚才另存为的图片识别一下就OK了。