PDF文档,其实分三类。
一类是纯图片的,
这一类根本不能转为WORD文档,
即使强转了,
在WORD里也是图片,
不能编辑的。
第二类是正常的文本,
只有这一类才能转为WORD文档。
第三类虽然也是文本,
但文本的编码是错位的,
这种文本的PDF也是转化不成的。
前两类还可以使用OCR软件提取文字,
第三类连OCR软件都是没法提取文字的。
一类是纯图片的,
这一类根本不能转为WORD文档,
即使强转了,
在WORD里也是图片,
不能编辑的。
第二类是正常的文本,
只有这一类才能转为WORD文档。
第三类虽然也是文本,
但文本的编码是错位的,
这种文本的PDF也是转化不成的。
前两类还可以使用OCR软件提取文字,
第三类连OCR软件都是没法提取文字的。