前端开发入门到精通的在线学习网站

网站首页 > 资源文章 正文

图片、PDF转文字DOC超简单的2个方法!最后一个你逗我?

qiguaw 2024-09-11 06:17:55 资源文章 21 ℃ 0 评论


最近有朋友需要将大量的图片或者PDF转word(也就是字符文本),自己找了方法,在这里共享一下。

首先说说PDF的分类

PDF根据内容大概分为两类:

一类是扫描件,也就是图片形式的pdf,这种转文字稍微复杂一些;

一类是word、excel等发布的pdf,这种很简单,由于保留了文字的属性,通过指定网站就直接转换了。

如何区别这两类pdf?

打开pdf,按着鼠标左键不放去选一些文字,如果文字能被单独选到就说明是第二类情况,请直接到网站去转换即可。99%可以还原,另外的1%我也不知道存在不存在,做事要留余地,不说那么绝对哈!

第二类情况比较简单,先说PDF这个。

具体操作:

1、 打开这个链接:https://smallpdf.com/cn/pdf-to-word 将PDF文件拖到指定区域;

2、静静等待网站自动转换(别问我静静是谁。。);

3、转换完毕,下载即可。

说完简单的还是说稍微复杂的第一类情况,图片转文字

这里要用到的office工具的ocr识别文本功能


具体操作:

1、 复制图片到系统自带的画图工具里面粘贴出来,另存为TIFF格式的图片;

2、 在开始菜单打开office工具里面的Office Document imaging(找不到这个的我后面说如何处理),打开之前的tiff图片,点击“工具”——使用ocr识别文本,然后再转到word里面就可以了!

注意,上面第2步是网上的方式,我用的office 2010,有所不同,也说一下

Office 2010我没发现所谓的“Office Document imaging”后来发现可能是更名为“Microsoft OneNote”

打开OneNote2010,新建一个分区,“插入”——“图片”选择之前的tiff即可

然后在图片上点鼠标右键,选择“复制图片中的文本”即可!

——————

推荐粘贴到Word里面,会有一定的分段,如果粘贴导txt的文本里面,所有的字会挨在一起。

——————

如果你的Microsoft Office下既没发现Office Document imaging也没发现Microsoft Office OneNote,那就是安装office是没有完全安装,我们重新加上

打开开始菜单,右边有“控制面板”——“程序和功能”——找到“Microsoft Office Professional Edition 2003(注:office2010版本的名字是Microsoft Office Professional plus 2010)”点击(或右键),选择“更改”——“添加功能”

选择“Microsoft OneNote”前面的小三角,选择“本机运行”

继续,就开始安装这个工具了

安装完重启一下。开始用吧。

当然,还有一种最靠谱的转换方式……

也就是方法3杀手锏……

关注薇信:DOCINDAILY

这里不仅有有趣的互联网热点资讯,更提供无限互联网行业深度报告原文免费下载!

成为你工作、学习的犀利助手!

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表