C语言读取pdf

C语言读取pdf,第1张

这个肯定是要借助工具的,pdf不是单纯的字符编码,

它是字符编码和字节编码的混合,而且字节编码部分还是甲骨文公司自己的压缩加密后的结果,

如果你够厉害可以自己去钻研,要不就用第三方,

C语言对应的工具我不知道,C# 和JAVA可以用 iText

【C++库】

PDF类库 PoDoFo

http://podofo.sourceforge.net/

PoDoFo 是一个用来 *** 作 PDF 文件格式的 C++ 类库。它还包含一些小工具用来解析、修改和创建 PDF 文档

Xpdf

http://www.foolabs.com/xpdf/download.html

Xpdf是一个开放源代码的PDF档案浏览器,Xpdf 可解码LZW压缩格式并阅读加密的PDF文件。

PDF生成工具 Poppler

http://poppler.freedesktop.org/

Poppler 是一个用来生成 PDF 的C++类库,从xpdf 继承而来。它使用了很多先进的类库例如 freetype 和 cairois 来达到更好的输出效果,同时也提供了一组命令行工具包。

JagPDF

http://www.jagpdf.com/

JagPDF 提供给 C/C++ 和 Python 编程语言用来生成 PDF 文档的库。

libHaru

http://libharu.org/wiki/Downloads

开源的PDF库

CLibPDF

http://hpux.connect.org.uk/hppd/hpux/Shells/ClibPDF-2.02/

ClibPDF是C函数库,可以直接生成PDF文件, 不需要Adobe Acrobat等工具支持.

------------------------------------------------------------------------

【JAVA库】

PDF *** 作类库 iText

http://www.lowagie.com/iText/

iText是一个能够快速产生PDF文件的java类库。iText的java类对于那些要产生包含文本,表格,图形的只读文档是很有用的。它的类库尤其与java Servlet有很好的给合。使用iText与PDF能够使你正确的控制Servlet的输出。

PDFBox

http://www.pdfbox.org/

非常强悍的PDF生成和解析Java类库

jpedal

http://www.jpedal.org/

jpedal是开源纯Java的PDF文档解析库,可以用来读取PDF文档中的文字、图形。

JasperReports

http://jasperforge.org/plugins/project/project_home.php?group_id=102

JasperReports是一个基于Java的开源报表工具,它可以在Java环境下像其它IDE报表工具一样来制作报表。JasperReports 支持PDF、HTML、XLS、CSV和XML文件输出格式。JasperReports是当前Java开发者最常用的报表工具。

Fourfive

http://sourceforge.net/projects/fourfive

Fourfive是一个领先的开源Web报表解决方案,使用XML作为它的配置文件。支持集群、负载平衡、动态发布、PDF, Excel, LDAP,图表、过滤器、排序、布局定制、门户、JasperReports、Velocity模板、兼容Internet Explorer, Netscape, Mozilla, Opera。

FOP

http://xmlgraphics.apache.org/fop/

FOP是由James Tauber发起的一个开源项目,原先的版本是利用xsl-fo将xml文件转换成pdf文件。但最新的版本它可以将xml文件转换成pdf,mif,pcl,txt等多种格式以及直接输出到打印机,并且支持使用SVG描述图形。

JFreeReport

http://sourceforge.net/projects/jfreereport/

JFreeReport是一个用来生成报表的Java类库。它为Java应用程序提供一个灵活的打印功能并支持输出到打印机和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件中。

YaHP

http://www.allcolor.org/YaHPConverter/

YaHP是一个能够把html文档转换成pdf文档的Java开源包。

PDFjet

http://pdfjet.com/os/edition.html

PDFjet是一个用于动态生成PDF文档的Java类库。支持绘制点、线、方框、圆、贝塞尔曲线(Bezier Curves) 、多边形、星形、复杂路径和形状。支持unicode,文本间距调整,嵌入超链接等。它同时有Java和.NET两个版本。

vPDF

http://sourceforge.net/projects/vpdf/

一个将RTF文档转成PDF文档的工具

【.NET组件】

--------------------------------------------------

iTextSharp

http://itextsharp.sourceforge.net/

iTextSharp 是用来生成 PDF 文档的 C# 组件

PDFsharp

http://www.pdfsharp.com/

PDFsharp is a C# library that easily creates PDF documents on the fly. The same GDI+ like drawing routines can be used to create PDF documents, draw on the screen, or send output to any printer. PDFsharp can also modify, merge, and split existing PDF files or incorporate pages from existing PDF files into new PDF documents.

Report.NET

http://report.sourceforge.net/

Report.NET 是一个功能强大且易用的用来生成 PDF 文档的 C# 组件

---------------------------------------------------------------------

【PHP】

Php Pdf Factory

http://sourceforge.net/projects/pdf-factory/

一个PHP的PDF *** 作库。

TCPDF

http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf

TCPDF是一个用于快速生成PDF文件的PHP5函数包。TCPDF基于FPDF进行扩展和改进。支持UTF-8,Unicode,HTML和XHTML。

HTML2PDF

http://html2fpdf.sourceforge.net/

HTML2PDF能够把一个HTML文本转换成一个打印机友好的PDF文件。这个PHP脚本构建在FPDFPHP脚本之上。

cPdfWriter

http://www.palos.ro/index.php?page=opensource_active

cPdfWriter是一个能够输出PDF文档的PHP5 class。基于TCPDF,FPDF和其它相关脚本。

FPDF

http://www.fpdf.org/

FPDF这个PHP Class允许你采用纯PHP(更确切地说就是不需要使用PDFlib)来生成PDF文件。它所具有的特点包括:可选择的unit大小,页面格式和页边 距;页眉和页脚管理;自动分页;自动换行与文本自动对齐;支持JPEG与PNG图片格式;支持着色和文件超链接;支持TrueType,Type1与 encoding;支持页面压缩。...

------------------------------------------------------------------------

【Python和Ruby】

Prawn

http://prawn.majesticseacreature.com/

Prawn: 用Ruby生成PDF更简捷

ReportLab

http://www.reportlab.org/

Reportlab是用python开发的生成pdf的工具包,它是一个开源软件。

PDF生成工具 pyPdf

PyPDF这是一个用于构建PDF的纯Python工具包

1.pdf(Portable

Document

Format的简称,意为“便携式文档格式”),是由Adobe

Systems用于与应用程序、 *** 作系统、硬件无关的方式进行文件交换所发展出的文件格式。PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图象。

2.对于程序来说,不管后缀名如何,文件分为两种类型:文本文件和二进制文件。

C语言里有一系列文件 *** 作函数。区分文本和二进制文件,需要在打开文件时设置不同的控制符mode的变量即可。

3.fopen的函数原型:FILE

*

fopen(const

char

*

path,const

char

*

mode)

fopen函数的第一个参数是文件路径,第二个参数是打开方式,有以下几种方式:

r

以只读方式打开文件,该文件必须存在。

r+

以可读写方式打开文件,该文件必须存在。

rb+

读写打开一个二进制文件,允许读数据。

rw+

读写打开一个文本文件,允许读和写。

w

打开只写文件,若文件存在则文件长度清为0,即该文件内容会消失。若文件不存在则建立该文件。

w+

打开可读写文件,若文件存在则文件长度清为零,即该文件内容会消失。若文件不存在则建立该文件。

a

以附加的方式打开只写文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾,即文件原先的内容会被保留。(EOF符保留)

a+

以附加方式打开可读写的文件。若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。

(原来的EOF符不保留)

wb

只写打开或新建一个二进制文件;只允许写数据。

wb+

读写打开或建立一个二进制文件,允许读和写。

wt+

读写打开或着建立一个文本文件;允许读写。

at+

读写打开一个文本文件,允许读或在文本末追加数据。

ab+

读写打开一个二进制文件,允许读或在文件末追加数据。

上述的形态字符串都可以再加一个b字符,如rb、w+b或ab+等组合,加入b

字符用来告诉函数库打开的文件为二进制文件,而非纯文字文件。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6423700.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-21
下一篇 2023-03-21

发表评论

登录后才能评论

评论列表(0条)

保存