基于LINUX的嵌入式浏览器的设计与实现
随着 Intemet普及率的迅猛增长,浏览器成为获取信息的标准工具,并且已经为广大 Intemet用户所接受。与浏览器相配合的各类软件,如视频、音频的 Plug-in,都十分丰富。 Intemet上产生了大量的可浏览资源,也证明了浏览器这种方式的正确性,浏览器将成为网络生活中的核心。另一方面,消费电子、计算机、通信 (3C)一体化趋势日趋明显,嵌入式技术成为研究热点,机顶盒、信息家电等新产品的出现让人们开始关注嵌入式系统,嵌入式浏览器也随之浮出水面。嵌入式浏览器可以广泛应用于 Intenet-Tv、iDVD、Web终端、数字电视机顶盒、掌上电脑等各种信息电器和便携式网络终端中,在工业控制领域也有着非常广阔的应用前景。
本文提出了一种基于 I肿 D(系统的嵌入式浏览器,并介绍了该浏览器的设计实现方法。 1系统基本原理
1.1嵌入式浏览器的基本工作流程输入 URL,通过网络读取对应 HTML文件:交给 HTML的解析器进行解析,在解析的过程中如果发现新的 URL(主要是图片、样式单以及 Jscript外部代码 ),提交给网络部分去读取;在解析的过程中形成 DOM树和 Render树;最后利用解析结果生成对应控件并排版显层次关系如图 1所示。
1.2嵌入式 LINUX系统
对嵌入式应用环境下的 LINUX系统,要求代码空间小,运行速度快,资源需求少。可以通过对通用 I删 JX系统的配置和功能代码精简得到,也可采用商业的嵌入式 LINUX。
1.3嵌入式 GUI
GUI(图形用户接口)是浏览器的运行平台,并提供了窗口编程的接口函数。嵌入式 GUI必须运行效率高,功能精干。常用的嵌入式 GUI有 MicroWindows、OpenGUI、QT/Enbedded、 MiniGui等。
1.4网络访问
网络访问通过 HTTP(超文本传输协议)实现浏览器与 Web服务器之间的通信,HITP规定了发送和处理请求的标准方式,规定了浏览器和服务器之间传输的消息格式及各种控制信息。
1.5 DTD
DTD(文档类型定义)定义了 HTML文件中所有的标签和属性,及标签的嵌套关系和属性的取值范围。它是解析 HTML文件的基础。
1.6 DOM
DOM(文档对象模型)是 HTML,文件解析的结果。它的内容包括了当前 HTML文件中所有的元素、元素的子元素、元素的属性、元素的样式、元素的事件等。
1.7 RENDER树
RENDER树供排版输出程序使用。 RENDER.树结构与 DOM树类似,HTML解析器生成 DOM树的同时生成 RENDER树。RENDER树的内容定义了实际显示区域的嵌套关系。
2系统设计概要
2.1 HTML解析
HTML解析主要功能是分析取得的 HTML文件,辨认出标签、属性和内容,并根据 DTD定义校验元素结构关系。解析结果形成 DOM树和 RENDER树,供输出引擎排版显示。如图 2所示。
HTML解析可分为以下几个子模块:
2.1.1 DTD构建。
DTD定义了 HTMl。的语法规范。根据应用需要可选择 TransiTIonal DTD、FIarIleset DTD及 Strict DTD。依据 DTD规范说明,可以建立啪表格,每一个 DTD表格记录定义一种标签的基本信息,包括元素 ID、元素名、子元素列表、属性列表等。解析 HTML.必须首先构建 DTD表格。
2.1.2语法分析 HTML文件
语法分析的主要思路是:读 HTMI。缓存区。如是起始标签,分析标签内的标签名、属性和属性值,根据 [riD定义判断此标签是否能被栈顶标签包容 (为判断元素的嵌套关系。建立的一个栈表),如合法,生成 DOM节点,如果此标签需有结束标签,此标签入栈;如包含关系不正确,放弃此标签,继续读缓存。如是结束标签,从栈顶向下查找有否对应起始标签,如有,将对应起始标签以上的栈元素出栈;如没有,放弃此标签,继续读缓存。如是标签间的文本,则放至文本缓冲区,直到读到标签时,生成文本 DOM节点,插入到 DOM树中。在生成 DOM节点时,生成对应的 RENDER节点(DOM节点与 RENDER节点不一定对应)。每个 RENDER节点代表一矩形区域,RENDER类型指明该矩形区域的特性,可分为: BlockBOX、InlineBOX、LineBOX、Anonymous BlockBOX等。在后面排版显示中将介绍各类 RENDER的使用。
2.1.3 CSS的应用
作用于标签的 CSS可分为三类:标签的缺省样式、从上层标签继承的样式、标签属性中定义的样式。它们从小到大的应用优先级是:缺省样式、继承上层标签的样式、标签属性中定义的样式。在生成 DOM节点时,分析以上三类样式定义.得到当前元素的应用样式单。样式的数据结构与属性类似。
2.2排版显示排版输出模块利用对 HTML文件解析的结果 DOM树和 RENDER树,生成浏览器窗口及相应的控件,并在屏幕上排版显示。排版是基于 CSS2的规范进行的。
排版显示基本原理:所有的 HTML元素在屏幕上都表示为矩形区域 (Box)。排版实际上就是把这些 Box摆到正确的位置上。 Box主要可分为 InlineBox、BlockBox。BlockBox代表一个矩形容器框,Linline box表现为文字、图片等具体内容形成的矩形区域。一个 Block Box的直系儿子要么全是 Block,要么全是 Inline。若一个 Block Box的儿子中,既有 Block又有 Inline,就要包装一层.即把 inline box用一个 Block Box包起来。这个自动产生的 Block Box就是所谓的 Anonymous Block Box。若一个 Lnline:Box有 Block Leve的儿子,那么它自己也应转为 Block level。即 Inline Box不可能有 Block Box做儿子。 (Block box和 Inline box的包含关系要求的实现在前面生成 RENDER节点时解决)一个 Box可以在三种定位方式下进行排版:常规定位、绝对定位、浮动定位。通过元索的属性 posiTIon和 float可以设置定位方式。
2.3网络访问
利用 LINUX系统的 HTTP函数库,实现浏览器与 WEB服务器的通讯。为了管理多个通讯请求,需要建立任务队列。请求得到响应后,响应结果放在缓冲区,发送消息回对应控件,由控件的处理函数分析响应内容。原理如图 3所示。
主要接口函数: AddJobTbQueue(struct Job*Job):加入新任务到任务队列 GetHTMLFile();利用 HTTP函数实现任务队列的头个任务 NetworkContml():任务调度
3系统功能特点及实现情况此系统设计实现了浏览器的基本功能,能够满足一般嵌入式环境的需要。在优秀的嵌入式 GUI上开发项目,可以借用最新的科研成果,加快开发进度。系统结构简单,易于实现。代码量较小,资源占用较少。在国产著名自由软件 MiniGUI下已成功实现。
4结语
本文的创新点是基于现有的嵌入式 GUI,利用系统的 HTEP函数库实现网络访问,根据文档类型定义和层叠式样式表规范,解析 HTML文件和排版显示。设计与实现了基于 LINUX系统的嵌入式浏览器的基本功能,满足一般嵌入式环境的需要。其次,本系统简单,易于实现,代码较小,资源占有较少。
参考文献
[1] Paul Tranblett,王伯欣译 .J2ME无线 Java应用开发 [M].人民邮电出版社 ,2002.
[2]王楠, 邓依群 . 嵌入式 Internet的实现技术与安全问题分析 . [J].微计算机信息 , 2006, 9-2:
12-15.
[3]白小明, 邱桃荣.基于 Linux的嵌入式实时 *** 作系统的研究 [J]. 微计算机信息, 2006,2-2: 78-79、40.
[4]张科. 多接口嵌入式 Web服务器的设计与实现 [D].南京理工大学 ,2007.7
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)