以下推荐了一种方法,虽然转换软件需要注册,但是不注册也可以使用10000次!!
PDF是一种非常流行的电子文档格式,在国外,它几乎已经成为电子文档的事实标准,随着中外交流的日益增加,在国内也慢慢流行起来。PDF文件拥有自己的专用阅读器——Acrobat Reader,可Acrobat Reader的体积庞大,最新的50中文版有20多MB,而且有的PDF文档还进行了一些特殊处理,无法复制文档中的文字,也不允许打印,给我们带来很多不便。笔者向大家推荐PDF Tools,它可以把PDF文件转换成HTML、TXT和BMP三种格式。PDF Tools是个共享软件,下载地址是>
1
什么是乱码?(即PDF文档文字符号显示原理)
计算机系统中显示出来的字符,是通过每个字符对应的唯一码(即内码),再用此字符不同字体的字模样式显示出来。如:”
国
”字的内码是“
B9FA
”,用黑体显示就是“
国
”的字样,用楷体显示就是“
国
”的字样,但内码都是同一的“
B9FA
”。
对于PDF文档来说也一样,当打开一个PDF文件时,我们看到显示出来的字符是每个字符的字模样式,但当字模与该字符对应的内码不能对应时,将PDF文档内的字符复制黏贴出来则会出现乱码现象,即显示非对应内码的另外一个字符。
例如,“简”字的字符内码显示为“
{
”,则将“简”字复制出来黏贴到写字板显示出来就变成了“
{
”,这就是乱码现象。
2
什么是乱码PDF?
乱码PDF通常具有以下特征:
1)PDF显示很正常。
2)将PDF中的文字复制粘贴到写字板,会发现这些文字变成了乱码。
3)无法在此PDF中查找文本。
4)
无法将PDF另存为txt文本文件。
这种PDF只能用于浏览和打印,无法存档和二次利用。
3解决方法:找到内码(嵌套)字体;OCR光学识别;龙谷的
pdf内码校正。
一pdf文件本身编码不规范,建议到文件下载的网站上找找,看网站上的推荐阅读器是哪个,然后使用那个阅读器。
二、pdf文件转换word文件后,可能出现乱码。可以先用Adobe
reader
或Adobe
acrobat
Pro软件打开出现乱码的pdf文件,然后点击菜单栏->文件->属性->字体项,
看是否文件内嵌了较多的字体。因为word文件是直接读取系统中的字体的,若内嵌的字体没有,那么转换出来的word文件一般都会出现乱码问题的。
使用Foxit PDF Reader 试试。它会提示安装东方文字插件,下载安装即可。
>
出现pdf文件打开是乱码的问题,有两种可能:
一是用户所使用的PDF阅读器太次,无法读取PDF文件中的某些数据或无法显示某些编码。
二是PDF文件本身编码不规范。
出现前者,直接下载Adobe Reader最新版打开即可,如果是后者,建议到文件下载的网站上找找,看网站上的推荐阅读器是哪个,然后使用那个阅读器即可;一般来说,这个问题在大的PDF集、知网以及方正阿帕比等地方出现的比较多
Adobe Reader下载地址:>
阿帕比阅读器:>
Adobe Reader一般很少会出现pdf文件打开是乱码的问题,而阿帕比阅读器打开中文文档时,基本不会出现pdf文件打开乱码。
参考资料
中关村在线综合论坛:>
你用的可能是第一种方法
1、实现工具:office
2003中自带的microsoft
office
document
imaging
应用情景:目前国外很多软件的支持信息都使用pdf方式进行发布,如果没有adobe
reader,无法查看其内容,如果没有相关的编辑软件又无法编辑pdf文件。转换为doc格式则可以实现编辑功能。尽管有些软件也可以完成pdf转换为doc的工作,但很多都不支持中文,我们利用office
2003中的microsoft
office
document
imaging组件来实现这一要求最为方便。
使用方法:
第一步:首先使用adobe
reader打开待转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“microsoft
office
document
image
writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
编辑提示:如果你在“名称”设置的下拉列表中没有找到“microsoft
office
document
image
writer”项,那证明你在安装office
2003的时候没有安装该组件,请使用office
2003安装光盘中的“添加/删除组件”更新安装该组件。
第二步:运行microsoft
office
document
imaging,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,并在d出的窗口中勾选“在输出时保持版式不变”,确认后系统提示“必须在执行此 *** 作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
编辑提示:目前,包括此工具在内的所有软件对pdf转doc的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。
2、实现工具:solid
converter
应用情景:利用office
2003中的microsoft
office
document
imaging组件来实现pdf转word文档在一定程度上的确可以实现pdf文档到word文档的转换,但是对于很多“不规则”的pdf文档来说,利用上面的方法转换出来的word文档中常常是乱码一片。为了恢复pdf的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。
使用方法:
1、下载安装文件solid
converter
pdf,点击安装。
编辑提示:安装前有个下载安装插件的过程,因此需要保证网络连接通畅。
2、运行软件,按工具栏要求选择需要转换的pdf文档,点击右下的“转换”(convert)按扭,选择自己需要的版式,根据提示完成转换。
可能是打印机或电脑中毒,在其他人电脑上试试。要不就换个PDF浏览器再打印。
通常指把电脑或其他电子设备中的文字或等可见数据,通过打印机等输出在纸张等记录物上。
方法
第一步:将打印机连接至主机,打开打印机电源,通过主机的“控制面板”进入到“打印机和传真”文件夹,在空白处单击鼠标右键,选择“添加打印机”命令,打开添加打印机向导窗口。选择“连接到此计算机的本地打印机”,并勾选“自动检测并安装即插即用的打印机”复选框。
第二步:此时主机将会进行新打印机的检测,很快便会发现已经连接好的打印机,根据提示将打印机附带的驱动程序光盘放入光驱中,安装好打印机的驱动程序后,在“打印机和传真”文件夹内便会出现该打印机的图标了。
第三步:在新安装的打印机图标上单击鼠标右键,选择“共享”命令,打开打印机的属性对话框,切换至“共享”选项卡,选择“共享这台打印机”,并在“共享名”输入框中填入需要共享的名称,例如CompaqIJ,单击“确定”按钮即可完成共享的设定。
提示:如果希望局域网内其他版本的 *** 作系统在共享主机打印机时不再需要费力地查找驱动程序,我们可以在主机上预先将这些不同版本选择 *** 作系统对应的驱动程序安装好,只要单击“其他驱动程序”按钮,选择相应的 *** 作系统版本,单击“确定”后即可进行安装了。
以上就是关于pdf文件打开,出现乱码的情况怎么办全部的内容,包括:pdf文件打开,出现乱码的情况怎么办、电子发票pdf文件打开后乱码、pdf为什么是乱码等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)