请试用汉王PDF OCR8.1简体中文版的PDF识别软件,简单易用免费。网上有下载。
方法是下载安装汉王pdf ocr8.1,运行并打开PDF文件,如PDF的字号较小,在打开时请不用默认分辨率,自行设定最高分辨率为600DPI,逐页打开PDF文件后,可直接进行识别,但最好是进行水平调整,手工设置识别区域,分出文字区、表格区和图片区,然后才开始识别,这样的识别率较高,识别后进行校稿,对照原稿校正错别字。最后是选择已识别转换校对好的页面,在菜单-输出-到指定输出文件格式,可输出为TXT、RTF、XLS等文件格式。如要输出EXCEL格式,请选择XLS格式,用EXCEL打开后,按需要编辑一下即可。
扫描的东西说白了就是一张图片,你怎么往excel插入图片的怎么来就是了。
但是一般人的需求是把文字识别出来可以编辑而不是整张图片,因此需要OCR识别才能正确转换为文字。
这种软件比较好的有清华紫光的OCR识别软件,一般的扫描仪也都会自带一个识别软件的。但是识别一般都不是100%准确,尤其是那种图文并茂、包含公式或者表格的,识别完成之后还需要人工校对才行的。
如果是源excel文件打印生成的PDF文件的话,直接在PDF里另存为excel的xml即可;如果是扫描得到的PDF的话,可能性就不大了。