doc 文件主要用于保存term的倒排表信息,包括docId倒排链及term在docId的term freq信息等。倒排链是Lucene 进行全文检索的核心数据结构,请特别关注这个数据结构
请参考 Lucene tim文件格式详解 第三部分
文件头部分主要内容为标识此文件类型为 Lucene50PostingsWriterDoc , 源码部分在 Lucene50PostingsWriter 的123行,主要内容如下
开始本部分阅读时,请注意一个在第3部分兆虚得到的结果及含义, 现族茄燃在开始分析该部分内容
下面为term的doc信息。 主要逻辑是: 对于term的doc freq = 1的term来说,纳档doc文件不保存这个term的doc信息,而是在 tim 文件中保存,doc 文件只保存doc freq >1的term。在范例中,只有nice的doc freq >1, 故只保存nice的doc倒排链
关于其它term(term freq = 1)的编码方式,请参考 tim 文件相应的格式内容
footer区主要有以下内容
DOC结构与工作原理DOC一般封装在排气管中,其结构由蜂窝状载体组成。载体一般都是陶瓷或金属材料制成。载体表面涂覆有铂系贵金属,其作用有二:
一、铂金属可以很好的吸附各种汽车尾气排放气体,包括没有参与燃烧的氧气。而氧是DOC与后处理各部件“催化氧化”功能的核心。
二、铂系郑念毕金属作为催化剂可以降低被氧化物的氧化温度。
氧化型催化转化器简称DOC(Diesel Oxidation Catalyst),是安装在发动机排气管路中,通过氧化反应,将发动机排气中一氧化碳(CO)和碳氢化合物(HC)转化成无害的水(H20)和二氧化碳(CO2)的装置。它是催化转化器技术中的早期产品。结构形式与三效催化转化器基本相同,只是催化剂涂层有所高如不同,只具有氧化能力喊芹,没有还原能力。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)