PDF格式是指?又如何制做使用?

PDF格式是指?又如何制做使用?,第1张

Adobe Reader 关于PDF的图标

PDF全称Portable Document Format,译为可移植文档格式,是一种电子文件格式。这种文件格式与 *** 作系统平台无关,也就是说,PDF文件不管是在Windows,Unix还是在苹果公司的Mac OS *** 作系统中都 是通用的。这一性能使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。 Adobe公司于2009年7月13日宣布,作为电子文档长期保存格式的PDF/Archive(PDF/A)经中国国家国家标准化管理委员会批准已成为正式的中国国家标准,并已于2009年9月1日起正式实施。PDF格式文件目前已成为数字化信息事实上的一个工业标准。 Adobe公司设计PDF文件格式的目的是为了支持跨平台上的,多媒体集成的信息出版和发布,尤其是提供对网络信息发布的支持。为了达到此目的, PDF具有许多其他电子文档格式无法相比的优点。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。 PDF文件使用了工业标准的压缩算法,通常比PostScript文件小,易于传输与储存。它还是页独立的,一个PDF文件包含一个或多个“页”,可以单独处理各页,特别适合多处理器系统的工作。此外,一个PDF文件还包含文件中所使用的PDF格式版本,以及文件中一些重要结构的定位信息。正是由于 PDF文件的种种优点,它逐渐成为出版业中的新宠。 对普通读者而言,用PDF制作的电子书具有纸版书的质感和阅读效果,可以“逼真地”展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由于PDF文件可以不依赖 *** 作系统的语言和字体及显示设备,阅读起来很方便。这些优点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普及。 Adobe公司以PDF文件技术为核心,提供了一整套电子和网络出版解决方案,其中包括用于生成和阅读PDF文件的商业软件Acrobat和用于编辑制作PDF文件的Illustrator等。 Adobe还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包。[1]

编辑本段相关技术

PDF主要由三项技术组成: · 衍生自PostScript,可以说是PostScript的缩小版; · 字型嵌入系统,可使字型随文件一起传输; · 资料压缩及传输系统。

编辑本段格式研究

文件结构可以分为四方面: 1、首部。用文本编辑器打开的时候就可以看到:%PDF-1.4 这样的字眼,其中最后一位就是PDF文件格式版本号,软件的版本号总要比文件格式的版本号高1,比如说Read 5能打开的内容就是4。 2、文件体。里面有若干个的obj来组成,OBJ这种形式: 30979 0 obj <</Linearized 1 /O 30982 /H [ 15061 25084 ] /L 9379963 /E 166967 /N 978 /T 8760262 >>endobj 第一个数字就是这个OBJ的顺序号,是为了便于在xref中查找,后面的0是为了区分不同的OBJ,后面就是关键字obj.下面的各行就是属性,/关键字值 的形式。 3.索引表。 用来索引各个obj在文档中的起始位置,它的形式是: xref 0 211 0000000000 65535 f 0000000009 00000 n …… 0000087999 00000 n 4、文件尾。 trailer <</Size 211 /Root 2 0 R /Info 1 0 R /ID [<B29FBB52459C4623DB1A90CBFC28381E><B29FBB52459C4623DB1A90CBFC28381E>] >>startxref 88019 %%EOF 其中0,211分别代表这个xref的obj的起始和终止序号。其中0这个估计是为了程序中好处理所以加了这个,可以不加入这个。下面的各行就代表各个obj在这个文档的起始位置,其中第一串字符(10个)代表起始位置,中间的五个字符也是为了区分用的,现在基本上全为0,后面的字母有两种f代表删除的,n代表要使用的。后面的trailer是对整个xref的摘要,说明里面有多少个OBJ,读的时候从哪个OBJ开始解析,信息节点等,ID是为了让一些文件检索工具能够唯一区分文件。

编辑本段常用工具

以下介绍的是PDF( Portable Document Format )常用的工具。

阅读工具

★推荐产品:Adobe Acrobat Reader 中文版 另有方正apabi reader和Foxit PDF Creator等 类型:免费软件 支持的平台:Windows 系列/移动平台/MAC/Unix/Linux 简介:官方出品的阅读器,允许阅读PDF文档,填写PDF表格,查看PDF文件信息。稳定性和兼容性好。缺点是体积庞大,启动速度慢。 ★最佳替代工具:Foxit Reader 类型:免费软件 支持的平台:Windows 系列/移动平台/Linux 简介:能实现绝大部分的阅读功能。绿色软件。体积小巧,新版本大约5M。

创编工具

★推荐产品:官方编辑工具 Adobe Acrobat、Adobe Indesign 类型:商业软件 支持的平台:Windows 系列/移动平台/MAC/Unix/Linux 简介:生成PDF文件,修改PDF文件。功能强大。 其它产品: ★Foxit PDF Editor 软件授权:共享版 简介:Foxit PDF Editor 是第一个真正的PDF文件编辑软件。许多人都希望能找到一个象编辑其它类型的文档的编辑器,事实上在 Foxit PDF Editor 出现之前,根本没有这样的工具。每一个PDF 文件都包含很多页面,每一页包含各种可视对象,如文本对象、图形对象和图像对象。而每一个对象都由其属性来定义其显示的方式。 ★Foxit PDF Creator 支持的平台:Windows 2000/2003/XP/Vista(32-Bit&64-Bit)/7(32-Bit&64-Bit) 简介:是PDF创建工具,可以将支持打印的任何类型的文档,象DOC、XLS、PPT、TXT、E-MAIL甚至HTML格式的文档通过点击列印转换成标准的PDF格式。 ★金山WPS 免费国产办公软件,可将文档转化为pdf格式 ★Pdf995 Printer Driver 类型:免费软件 支持的平台:Windows 系列 简介:安装后,会加入一部名叫PDF995的打印机。只要在有提供打印的软件上选择打印到PDF995,便可将整个文档打印存为PDF。 ★pdf Factory 类型:共享软件 支持的平台:Windows 系列 简介:和上面的工具是一样的用法,也是打印文件到PDF中。支持安全设置、预览、嵌入字体,允许插入和删除某个页。 ★其他编辑软件 Pitstop(作为插件形式与acrobat专业版协助) NEO(MAC上的专业PDF编辑软件) packedge(esko流程中的编辑软件,且对PDF支持很好编辑类) ARTPRO(MAC上的pdf专业编辑软件) Adobe Illustrator(仅可汇入该档案的某个页面编辑类) PDF Creator PrimoPDF CutePDF Microsoft Office2007/2010 加载项:Microsoft Save as PDF或 XPS

分割/合并工具

★推荐产品:Foxit PDF Page Organizer 简介:一款可以拆分、合并PDF页面、重排页面、组织书签(bookmarks)、添加注释(annotations)和创建链接的PDF页面管理器。 ★其它产品:PDFSplit-Merge 一款好用的PDF分割/合并工具,可以帮助你从PDF中“去粗取精”,也可将多个PDF文档打包在一起,以方便传输、阅读。软件本身是独立的,无需预装 Adobe Acrobat。

加密工具

ProfPDF Protection Manager PDF 加密工具,是一款给PDF文档加密码保护或在知道密码的情况下移除密码保护的工具。

解密工具

★推荐产品:Advanced PDF Password Recovery PDF 密码破解工具,支持暴破、掩码、字典、密钥四种破解方式。 ★pdf密码暴力破解工具 PDFPasswordCracker [2] ★去除PDF文件加密 A-PDF Restrictions Remover 类型:共享软件 支持的平台:Windows 系列 简介:可以去除PDF文件的限制,比如不允许打印等。使用超级简单,安装后,在我的电脑中右键单击PDF文件,选择Remove Restrictions... 选项即可。如果碰到有需要密码打开的文件,需要输入正确密码。

编辑本段发展趋势

最初PDF只被看作是一种页面预览格式,而不是生产格式。然而市场的感觉并非如此,市场期望转化了这种格式的焦点,从而也改变了该产品的使用方式。目前,各种各样的电子书阅读器充斥着国内外市场,已经在很多领域取代纸质媒体。纸质媒体阅读率的下降很大程度上是因为广大读者将注意力从纸质媒体转向了电子类读物。虽然电子图书市场销售额远远不能同传统图书市场相比,但发展势头强劲。大多数电子阅读器厂商都开始全部或部分支持PDF格式。

编辑本段PDF版本

PDF 1.0

PDF 1.0于1992年秋季在Comdex发布,该技术获得Best of Comdex奖项,用以创建和查看PDF档案的工具Acrobat于1993年6月15日推出,对印前而言,这个第一次的版本是没有用的;它已经有内部链结、书签和嵌入字体功能,但唯一支援的色彩空间是RGB。

PDF 1.1

其它释Acrobat 2于1994年9月上市,它支援新的PDF 1.1档案格式,PDF 1.1新增的特点包括: 外部链结(External Link); 文章阅读绪(Article Threads); 保全功能(Security Features); 设备无关色彩(Device Independent Coulour); 注解(Notes)。 Acrobat 2.0程式本身也有一些很不错的改进,包括Acrobat Exchange的支援插件以及能搜索PDF档案内容的新架构。 Adobe公司自己本身就是PDF格式的第一个大用户,他们发布的所有开发者文件都是PDF档案,另一个早期就采用PDF格式的是美国税务当局,他们以PDF档案派发各式表格。 Acrobat 2.1加入多媒体支援,可以在PDF档案内加入音频或视讯资料。 当时PDF并非唯一试图创造一种便携、与设备和作业系统无关的档案格式,其最大的竞争对手产品称为Common Ground。 1995年Adobe公司的Acrobat Capture以相当昂贵的4000美元价格上市,在同一时间内, Adobe公司也开始在它自己的许多应用程式加入支援PDF格式,包括FrameMaker 5.0和PageMaker 6。义

PDF 1.2

1996年Adobe公司推出Acrobat 3.0(程式开发代号:Amber [琥珀])及配套PDF 1.2规格,PDF 1.2是第一个真正可用在印前环境的PDF版本,除了表单外,包括下列印前相关的功能: 支援OPI 1.3规格; 支援CMYK色彩空间; PDF内能包含特别色定义; 能包含半色调函数(Halftone function)与叠印(Overprint)指令。 发布一个让Netscape网页浏览器内检视PDF档案的插件益增PDF档案在正值兴盛网际网路的人气,Adobe还增加了PDF档案与HTML网页之间的相互连接;PDF也慢慢逐渐获得输出印刷业的接受,最初由黑白数位印刷市场在全录快速印刷机开始使用PDF输出。 在Acrobat 3下Acrobat Exchange的开放式架构终于获得其努力成果,1997年和1998年开始出现很多有趣的印前Xtensions,其中包括一些十分必要的印前工具;例如Enfocus公司的PitStop与CheckUp、Lantanarips公司的CrackerJack;爱克发是第一家在1998年推出的Apogee系统内推广全彩色商业印刷使用PDF格式的大型公司,其他厂商随后不久也都跟进。

PDF 1.3

1999年4月Adobe公司推出了在内部被称为'Stout'的Acrobat 4,它为我们带来PDF 1.3,新的PDF格式规格包括支援:双位元的CID字体;OPI 2.0规格;称为DeviceN的一个新色彩空间,改善支援特别色能力;平滑渐层(smooth Shading),一项有效率与非常平顺渐层的技术(从一个色彩渐变到另一个色彩);注解(annotations)。

PDF 1.4

2000年中Adobe公司做了一件怪异的事:他们推出Illustrator 9,虽然推出绘图应用程式的新版本并不奇怪,但Illustrator 9确有一个惊人的特点:它是第一个支援PDF 1.4和其透明度特征的应用程式,这是第一次Adobe公司并未伴随着新版本的PDF规格而推出一个新版本的Acrobat,他们也没有释放PDF 1.4的全部规格,虽然Technote 5407记载了PDF 1.4支援透明度。

PDF 1.5

2003年4月Adobe宣布Acrobat 6将于5月下旬开始出货,Acrobat 6内部代号为'Newport',像往常一样地,新版本的Acrobat同时带出了一个新版本的PDF格式,版本1.5。 PDF格式1.5带来了一些新的功能,可能需要相当长的时间才会被应用程式套用或支援,新的东西包括: 1、改良的压缩技术,包括物件流(Object Stream)与JPEG 2000压缩; 2、支持层(Layers); 3、提高标签(Tagged) PDF格式的支持; 4、Acrobat软体本身提供更多于新的PDF档案格式的立即好处。

PDF 1.6

2005年1月Adobe推出具新PDF功能的Acrobat 7,PDF 1.6提供了下列改进: 1、改进的加密演算法; 2、注解和标注功能的一些小改进 3、OpenType字体可直接嵌入到PDF,不再需要以TrueType或PostScript Type 1字体型式嵌入; 因为提供嵌入档案的可行性,PDF 1.6档案可被用来作为一种〔容器〕的档案格式。新的主要特点是能够嵌入3D数据,起初感觉此功能只会引起建筑师或使用CAD-CAM人们的兴趣,不过看到用包装设计应用程式ArtiosCad制作出的3D的PDF档案,在PDF内可以从各个角度来检查图案设计和图片或条码的位置,所以这种技术也可用于平面艺术,特别是对于从事包装或展示工 PDF 1.7大概是发布过最'沉闷'的PDF版本,它改进评注(Comment)与保全(Security)的支援,3D的支援功能也获得改善,可以为3D物件加上评注(Comment)及更严谨地 *** 控3D动作,PDF 1.7档案能包含预设印表机如纸张的选择、拷贝数量、缩放、…等设置,可以在此下载全部规格。 Adobe Acrobat 8于2006年11月面世,介绍了一个有趣的新功能:它不使用PDF 1.7作为预设的档案格式,而是使用PDF 1.6,它也变得更容易将档案存成较旧的PDF版本,这大概是Adobe也认知大多数人还不需要最新发布的PDF格式来解决问题;对印刷和印前作业而言,PDF 1.3或PDF 1.4就很够了;其他的新功能包括改良的PDF /A之支援、更好地选单与工具之组织与能在Adobe Reader 8内储存表格的能力,预检引擎能处理多项更正(称为Fix-ups)的事实是另一项不错的跃进,大多数人则更认可提高性能,特别是对Intel Mac电脑是改善最多,有些人则不喜欢这个新的使用者界面。 PDF 1.7的一个有趣的发展是2008年1月它已成为一个正式的ISO标准(ISO 32000),Adobe的James King有在他自己的博客张贴了若干有趣的背景资料。

编辑本段其它释义

缩写词

PDF abbr. 1. =Parkinson's Disease Foundation (美国)帕金森氏病基金会,震颤麻病基金会 pdf abbr. 1. =point detonating fuse d头(起爆)引信 2. =probability distribution function 机率密度函数 PDF: probability density function 概率密度函数 Project Delivery Framework PDF: Power Distribution Frame)电源配线架 PDF: Plug-in Development Environment 插件开发环境

PDF 数据库

PDF 数据库 (Powder Diffraction File) 是国际衍射数据中心(ICDD)收集、编辑、出版和发行的用于晶态材料鉴定的粉末衍射数据库。 粉末衍射文件中包含了628155多个唯一的材料数据条目。每一个数据条目包含衍射、晶体学、参考文献和实验、仪器、样品条件,以及按通常的标准格式精选的物理性质。PDF是含盖了2000余种期刊和成千上万个作者成就的集体著作。并且通过奖励金程序,ICDD也收集新显现的和商品化的材料数据。每一年,大约有50个主要的材料实验室因为PDF分析和表征新材料而获奖励。通过ICDD自身的努力以及同全球结构数据库组织的协作,PDF已然拥有了大的数据量和材料领域全面含盖性的特点。 为了服务于不同的用户,ICDD按照不同的形式设计和制作了数据库。 PDF-2 是ICDD、FIZ以及NIST的合作产品,设计用于无机材料的分析。ICDD中很多常规的有机材料数据被加入到了这个数据库,这样可以便于快速的物相鉴定。 PDF-4+ 是一个包含PDF-2数据以及ICDD与MPDS合作数据的先进数据库。其设计宗旨在于定量分析(Rietveld, RiR, Pattern Fitting)和物相鉴定。数据库中含盖了大量无机材料,并且包含了大量数字谱线、分子图形和原子参量等信息。许多新的特点已经被集成到PDF-4+中,通过利用Rietveld分析、参考强度比(RiR)方法和全谱分析法这三种方法之一,增强了定量分析的能力。 PDF-4/矿物是PDF-4+的子系统,包含那些已编入PDF-4+的新特点。这个数据库是世界上有关矿物和相关矿物材料的最大、最权威的数据库。这些相关材料包括人造矿物、宝石和在特殊条件下处理的样品。 PDF-4/有机物 是ICDD与CCDC的合作产品。其设计宗旨是有机和有机金属材料的鉴定,也包含几千个无机材料和基本的药物赋形剂信息,以便于公式化分析和鉴定。 所有的ICDD数据库都被设计用于快速的物相鉴定。数据库的设计包含了专业的索引,以便于基于化学和结构知识搜索的快速搜索。此外,为了软件开发者更便利地在PDF同世界上常用粉末衍射分析软件之间转化数据,我们也在数据库中加入了一些新的特征。

我的理解,你问题的关键是程序如何往数据库里写入文件。对吧?无论是什么类型的文件。

这里有一些概念上的东西和你一起清理一下:

1)你需要了解你要用什么数据库?流行的企业级别的有:oracle,MSSQLServer, Sybase等,桌面的就更多了MSACCESS, MSSQL EXPRESS, SQLITE, POSTGRESQL等。无论什么数据库肯定会有一种数据类型为二进制的如oracle叫BLOB可以存放大量的数据流;

2)设计的核心就是通过C#前台程序的序列化功能将任何的文件以流的形式读入内存,转化成二进制文件流stream,然后通过特定的数据库API接口将该数据流写入数据库保存到上面提到的BLOB中

3)使用的时候,就从数据库里先把二进制数据流读出来,然后写入一个新文件里。

以上是设计概要,真正要实现一个软件会遇到很多具体问题,个人认为这是一个很好的将理论转化为实践的机会。多看看C#的技术书


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9680531.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存