是Office
2007
软件保存的文档包含的一个文件。
rels就是Relationships(关系)的缩写。
可以用Microsoft
Word
2007
Microsoft
Excel
2007
Microsoft
PowerPoint
2007
打开
在Microsoft Office的早期版本中,由Microsoft Office Excel, Microsoft Office PowerPoint和Microsoft Office Word创建的文件以独有的,单一文件格式进行保存,它们称之为二进制文件。Microsoft Office System 2007的发布为Microsoft Office Excel 2007, Microsoft Office PowerPoint 2007和Microsoft Office Word 2007引入了一个新的文件格式:Office Open XML格式。Office Open XML格式是基于XML和ZIP归档技术创建的。和早期Microsoft Office版本类似,2007的文档保存在一个单一的文件或者容器中,所以管理这些文档的过程仍然是简单的。但是,与早期文件不同的是Office Open XML格式的文件能够被打开显示器中的组件,使得您能够访问此文件的结构。
在本文中,您可以手动的打开文件并且浏览组成此文档那个的每一个部件来查看Office Open XML格式文件。另外您也可以对此文档进行编程。在本文中适用到的文件可以通过下载获得, 2007OfficeManipulatingOpenXMLFilesSample.exe.如果您不能够下载,您可以使用自己的程序文件和图像文件进行替代。
1.
打开Windows资源管理器。
2.
找到 SampleWordDocument.docx文件,右键点击此文件,然后选择重命名。
重要:
使用下面的三个步骤来抽取Office Open XML格式文件。根据您使用的 *** 作系统不同(Windows XP或Windows Vista),第5步有所不同。
3.
在文件名称后面添加一个.zip扩展名,文件名称现在变为 SampleWordDocument.docx.zip。
4.
当d出警告信息时,点击确定。
5.
抽取容器文件:
1.
(如果您使用Windows XP:) 右键点击SampleWordDocument.docx.zip文件,指向打开方式,然后点击Compressed (zipped) Folders。此时组成文档的文件夹和部件将会显示在资源管理器中。
2.
(如 果您使用Windows Vista:) 右键点击SampleWordDocument.docx.zip 文件,然后点击Extract All。 在Extract Compressed (Zipped) Folders 对话框中,接受默认位置或者选择一个新的位置,然后点击Extract。此时组成文档的文件夹和部件将会显示在资源管理器中。
在下面的步骤中,您将检测包含在文档中的关键部件。
6.
检测 [Content_Types].xml部件:
1.
使用Windows资源管理器,找到名为[Content_Types].xml的文件。
2.
右 键点击此文件,指向打开方式,然后点击Internet Explorer。每一个Office Open XML格式文档的根下都有一个 [Content_Types].xml 组件。 [Content_Types].xml组件的作用就是确定文档中每个唯一类型组件。每个组件需要在这个组件中列出它自己的类型。组件需要有可以识别的类 型,以便应用程序知道当渲染此文档时如何使用这个组件。类型也能够使您了解到组件的作用以及如何使用。
3.
关闭文件。
7.
检测.rels 文件夹:
关 联代表着两个组件之间的连接。关联是存储在_rels子文件夹中的组件。任何组件都有相关联的组件,包含在同结构的_rels文件夹中,此文件夹包含了一 个定义它们关系的.rels组件。子文件夹创建在与组件相同的文件夹下。一个关联的名称通过在原始组件的文件名后加上.rels扩展名获得 (用于文档文件的关联组件是一个例外;它的名称为“.rels”)。
1.
在Windows资源管理器中,双击_rels 文件夹,然后右键点击.rels 文件。
2.
指向打开方式,点击选择程序,点击Internet Explorer,然后点击确定。
3.
完成检测后,关闭IE。
8.
检测docProps 文件夹:
2007版本中的文档属性在三个Microsoft Office System程序中是始终保持结构化的。分成三个逻辑XML组件,它们被存储自docProps子文件夹下。这使得用户可以很容易的进行访问,因为他们它们在相同的位置并且不会和其它的文档内容混淆。
在Windows资源管理器中,双击docProps 文件夹,右键点击core.xml 文件,指向打开方式,然后点击Internet Explorer。
9.
检测core.xml 组件:
打开 core.xml 组件,然后观察显示的您之前输入的属性。 core.xml组件持有用户输入的用来标识文档的属性,例如标题,主题和作者。
10.
检测custom.xml 组件:
从Windows资源管理器中,在Internet Explorer中打开custom.xml。
custom.xml 组件包含了被用户,开发人员或者通过自定义逻辑添加到文档任何自定义文档属性。
11.
检测app.xml 组件:
从Windows 资源管理器中,在Internet Explorer中打开 app.xml。
app.xml 组件包括在应用程序级别指定到文档的唯一属性,例如文章的页数,文本行的数量,应用程序的版本等等。
12.
检测word文件夹:
大部分的内容组件都驻留在word子文件夹下面。另外,在里面也有一个_rels关联子文件夹。
双击 _rels 文件夹。
在_rels 子文件夹中,用于连接所有文档组件的关联名称为document.xml.rels。
13.
检测document.xml.rels 组件:
在Internet Explorer中打开document.xml.rels 。
关联使用IDs和Uniform Resource Identifiers (URIs)来定位组件。它允许在没有任何硬编码引用的前提下所有非关联的组件是无效的。在后面的章节中将会详细讨论。
在Word文件夹下面,注意styles.xml 组件。
14.
检测styles.xml组件:
在Internet Explorer中 styles.xml。
这个包含了一些可用的重音和底纹,您可以在文档中使用它们。
15.
必须的和可选的组件
16.
在Office Open XML格式文件中这些组件的使用使得文档能够以高度模块化的方式存储。一些组件对文档来说是必须有效的,例如document.xml组件和fontTable.xml组件。
17.
检测document.xml 组件:
1.
在Internet Eexplorer中打开document.xml 。 document.xml 组件包含了文档主体的文本。
2.
查看完此文件后,关闭Internet Explorer。
18.
检测fontTable.xml 组件:
1.
在Internet Explorer中打开fontTable.xml组件。
fontTable.xml组件包含了文档的字体设置。
2.
查看完此文件后,关闭Internet Explorer。
如果组件描述的功能在文档中使用不到的话,这些组件就不是必需的。示例中包括了备注,页眉组件和页脚组件,这些组件对Word文档来说是可选的。这就使得用户能够轻松的通过文档结构进行 *** 纵,而不需要研究没有使用的内容。
XML 设计用于结构化的内容,并不会本地支持二进制的内容,例如图像或者OLE对象。二进制数据能够被编码到字符并且以XML形式进行存储,但是它需要一个编码 和解码的过程,这就使得对于应用程序或者开发人员来说效率低下。在2007发布之后,此时就不在需要编码二进制对象因为他们能够作为二进制组件以他们自身 的格式进行存储。因此在Office文档中访问二进制对象变得非常容易。媒体文件存储在media文件夹中。
19.
检测word"media和word"embeddings文件夹:
在Windows资源管理器中,双击media子文件夹。
注意.gif媒体文件表示您之前插入的图像。
备注:
您 可能注意到图像的文件名称已经从Eagle1.gif更改为image1.gif了。更改的目的是为了解决隐私考虑,因为一个恶意用户可以从文档中的组件 名称中获得关于此组件的一些内容,例如一个图像文件。例如,一个作者可能通过加密文档中的文本部件来保护文档内容。但是,如果两个图像 old_widget.gif and new_reenforced_widget.gif 被插入。即使文本被保护起来了,恶意用户也能够知道widget已经被更新了。使用像image1和image2这样的通用图像文件可以在Office Open XML格式文件中添加额外的保护。
20.
关闭SampleWordDocument.docx.zip ,不保存。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)