对于源代码的阅读,要想比较顺利,事先最好对源代码的知识背景有一定的了解。对于linux内核源代码来讲,我认为,基本要求是:1、 *** 作系统的基本知识;2、对C语言比较熟悉,最好要有汇编语言的知识和GNU C对标准C的扩展的知识的了解。另外在阅读之前,还应该知道Linux内核源代码的整体分布情况。我们知道现代的 *** 作系统一般由进程管理、内存管理、文件系统、驱动程序、网络等组成。看一下Linux内核源代码就可看出,各个目录大致对应了这些方面。Linux内核源代码的组成如下(假设相对于linux目录):
arch 这个子目录包含了此核心源代码所支持的硬件体系结构相关的核心代码。如对于X86平台就是i386。
include 这个目录包括了核心的大多数include文件。另外对于每种支持的体系结构分别有一个子目录。
init 此目录包含核心启动代码。
mm 此目录包含了所有的内存管理代码。与具体硬件体系结构相关的内存管理代码位于arch//mm目录下,如对应于X86的就是arch/i386/mm/faultc 。
drivers 系统中所有的设备驱动都位于此目录中。它又进一步划分成几类设备驱动,每一种也有对应的子目录,如声卡的驱动对应于drivers/sound。
ipc 此目录包含了核心的进程间通讯代码。
modules 此目录包含已建好可动态加载的模块。
fs Linux支持的文件系统代码。不同的文件系统有不同的子目录对应,如ext2文件系统对应的就是ext2子目录。
kernel 主要核心代码。同时与处理器结构相关代码都放在arch//kernel目录下。
net 核心的网络部分代码。里面的每个子目录对应于网络的一个方面。
lib 此目录包含了核心的库代码。与处理器结构相关库代码被放在arch//lib/目录下。
scripts此目录包含用于配置核心的脚本文件。
Documentation 此目录是一些文档,起参考作用。
俗话说:“工欲善其事,必先利其器”。 阅读象Linux核心代码这样的复杂程序令人望而生畏。它象一个越滚越大的雪球,阅读核心某个部分经常要用到好几个其他的相关文件,不久你将会忘记你原来在干什么。所以没有一个好的工具是不行的。由于大部分爱好者对于Window平台比较熟悉,并且还是常用Window系列平台,所以在此我介绍一个Window下的一个工具软件:Source Insight。这是一个有30天免费期的软件,可以从>这是因为windowonload事件是加载完页面内容就发生,而js这是伴随着document即文档内容的加载而运行,也就是说,windowonload事件是否激活的判断依据是整个html文档的内容是否加载完,这些内容你甚至可以直观地理解为html源代码组成的字符串。
过程如下:
-----文------------- --------------------
-----档------------- 运行文档内的JS
-----内------------- ----------|----------
-----容------------- ----------|----------
|
加载完(包括onload等字符串,一直到文档结束),执行onload事件绑定的内容。
再来解决你的问题:
使用ajax来获取动态js,然后使用eval() 或者Function来执行获取到的文本,这样就能保证在任何浏览器下均能够达到目的。首先明确我指的动态数据是什么。
名词定义:动态数据在这里指的是网页中由Javascript动态生成的页面内容,即网页源文件中没有,在页面加载到浏览器后动态生成的。
下面进入正题。
抓取静态页面很简单,通过Java获取到html源码,然后分析源码即可得到想要的信息。如获取中国天气网中杭州的天气,只需要找到对应的html页面(>
是的。一般来说,直接使用右键->查看原文件
是可以看到初始状态的源代码的,但是如果对方网站使用js动态加载许多东西就看不到了。
如果使用遨游浏览器和GreenB,可以使用viewpage查看源代码(完整的);
如果是firefox的话,可以使用firebug
如果使用ie8和opera,可以使用“开发者工具”
看不到使用,请访问:
>
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)