如何直接提取HTML文档的title_随笔

方法1：如果你的所有的页面的标题或头都是一样的。那么你可以将页面的头部单独提取出来到一个新页面，然后其它页面在把它包含进去。这样一来，你如果要是统一修改页面的头部信息的话，只需修改那个提取出来的头部页面即可。

方法2：如果不采用方法1，那么你可以专门建立一个存放各页面的数据库表，将页面的标题信息存放的里面，然后其它的页面只需从数据库提取就可以。这样一来如果你要统一修改页面的标题信息的话，只需修改数据库就可以了。根据你的情况。你也可以专门做一个简单的管理页面标题的界面，以后就只通过那个界面而不用直接打开数据库来实时修改页面标题信息了。

图样。win7自带一个字符串查找的工具findstr.exe

新建一个fs.bat 内容如下

findstr /r /i "\<<title>.*</title>\>" %1 >> good.txt

findstr /r /i "\<<meta name="keyword".*/>\>" %1 >> good.txt

再新建一个go.bat 内容如下

for /r %%a in (*.html) do fs.bat %%a

把这两个文件放到保存html文件的文件夹，运行go.bat即可。

所以结果会自动保存到good.txt中。

-------------------------------------------------------完结-------------------------------------------

html文档中的title元素，在w3c文档中，有这样的定义：

interface HTMLTitleElement : HTMLElement {

attribute DOMString text

}

可以看到title元素继承了HTMLElement，并拥有一个text属性，该属性可读写title.text( = value)；

那么，如果我们要获得title元素之间的文本，我们可以有多种方法，

1、document.title；

2、title.text(var title = document.getElementsByTagName('title'))

3、title.innerHTML

第三种方法不靠谱，会返回title之间的所有东西，包括elements、注释节点；

而第一、第二种方法则是标准的获取title内容的方法，它们会忽略elements、注释等节点，返回所有text node节点字符串；

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/6104217.html

如何直接提取HTML文档的title

发表评论

评论列表（0条）