怎么把网页保存为html格式_随笔

1. 怎样保存网页部分内容为html格式

保存网页部分内容为html格式 *** 作步骤如下：

1、点击你自己想需要转换的网页文件，如下图。

2、点击右上角关闭下面有个“设置"的选项。点击"文件"选项，最后在点击“另存为”。

3、点击另存为对话框中的“保存类型选项”中然后在选择“文本文件（*.txt）”。

4、然后下方有”编码”。点击此处选择“简体中文”。这个过程是为了防止使转换过程中不会出现乱码的情况。

5、综合上述步骤，点击保存后即可就可以得到TXT格式的文件，如下图。

2. 怎么以HTML格式保存页面内容

只要将网页另存为，就是可以保存成HTML格式。

步骤如下：

1、点击你的浏览器，然后选择右上角的三条杠。

2、点击另存网页为。

3、然后选择保存类型，点击第一个。然后就能保存成HTML格式。

3. 怎样把一个网页保存到电脑上并且保存为HTML文件

第一步：编写HTML 对于这个教程，我建议你只使用最简单的工具。

例如：Notepad（在windows里），TextEdit （在Mac上）或是KEdit （在KDE里）就可以了。一旦你了解这个原理，你就会想要切换到更高级的工具，甚至是商业程序，如Style Master,Dreamweaver或GoLive。

但对于你的第一个CSS样式表，最好不要因为使用太多的高级功能而分心。不要使用文字处理器，如Microsoft Word或OpenOffice。

它们通常制作出网络浏览器不能读取文件。对于HTML和CSS，我们需要简单的纯文本文件。

第一步打开你的文本编辑器（Notepad,TextEdit,KEdit，或是任何你喜欢的文本编辑器），在一个空的窗口开始，输入以下的内容： <！DOCTYPE html PUBLIC "-W3CDTD HTML 4.01EN">我的第一个样式页面 <body><！-- 目录 -->

html">首页 html">连接1 html">连接2 html">连接3 <！-- 主要内容 --> 我的第一个样式页面欢迎来到我的样式页面！这里没有图片，但至少有CSS样式. 有连接，但只是为了举例和演示，并不能带你到任何地方… 这只是个例子，好象没什么好写. <！-- 签名和日期 -->2004年4月5日制作事实上，你不需要输入它：你可以从这个网页复制并粘贴进编辑器。（如果你在Mac 上使用TextEdit，不要忘记告诉TextEdit文本确实是纯文本，通过转到格式菜单并选择 “Make plain text”。）

上面HTML文件的第一行告诉浏览器HTML的类型（DOCTYPE 意思是文档类型）。在这个案例中，它是HTML 4.01 版本。

在 <和 >里的单词叫标签，像你看能到的，这文档包含和标签。在和间有一个位置是给没有显示在屏幕上各个种类的信息的。

目前为止，它包含文档的标题，但之后我们也会在这里加上CSS样式表。 <body>是实际文档文本所在之处。

原则上，除了在 <！-- 和 -->里作为对它们本身注解的内容不会显示，这里的所有内容都会被显示。浏览器会忽略它。

在该示例中的标签，介绍了一个“无次序列表”，例如：条目没有编号的列表。是“列表条目”的开始。

是“段”。还有是创建超链接的“锚点”。

编辑器展示了HTML源。如果你想知道在<…>里的名字是什么意思，一个好的开始地方是着手从HTML开始。

但是只有一些关于我们示例HTML页面的单词。 “ul”是一个每个条目都有一个超链接的列表。

这会作为我们的“网站导航菜单”链接到我们（超链接）网站的其它页面。想必，我们网站的所有页面都有一个类似的菜单。

“h1”和“p”元素形成这个页面独特的内容，而底部的签名（“address”）也是和网站上所有的页面是类似的。注意，我没有关闭“li”和“p” 元素。

在HTML里（但不是在XHTML 里），允许忽略和标签，这就是我在这里做的，为了使得文本稍微容易读一点。但是你可以加上它们，如果你喜欢的话。

让我们假设这是要成为一个有许多类似页面的网站上的一个页面。对当前网页来说很普通，此页面有一个菜单，在超链接站点，一些独特的内容和签名上链接到其它页面上去。

现在从文件菜单里选定“另存为……”，导入你想把它放入的一个目录/文件夹里（桌面也可以），再把文件存为“mypage”。先不要关掉编辑器，我们还会需要它。

（如果你在Mac OS X 10.4 前的版本上使用TextEdit，你会看到一个选项“不要附加保存.txt 扩展名”的存盘对话框。选定那个选项，因为名字“mypage”已经包含了一个扩展名。

更新的版本的TextEdit会让自动扩展。）接下来，在浏览器里打开文件。

你可以按照下面的做：用你的文件管理器（Windows Explorer,Finder或Konqueror ）找到文件，再点击或双击“mypage”文件。它就会在你默认的网络浏览器里打开。

（如果不可以，就打开你的浏览器，把文件拖进来。）像你看到的那样，页面看起来非常沉闷…… 第二步，添加一些颜色你可能看到一些白色背景里的黑色文本，但它是取决于浏览器如何配置的。

所以，我们能做的让页面更加时新的一件简单的事情就是添加一些颜色。（让浏览器开着，我们之后会再用到它。）

我们从嵌在HTML 文件里的样式表开始。然后，我们会把HTML和 CSS 放进单独的文件里。

单独的文件很好，因为相对于复合的HTML文件，它让相同的样式表使用起来更简单：你只需要编写样式表一遍。但是对于该步骤，我们仅仅保持所有的内容在一个文件里。

我们需要添加一个<style>元素到HTML文件中。样式表会在此元素里。

所以回到编辑器窗口，再在HTML文件的抬头部分添加下面的五行。要添加的行用红色的显示出来了。

（lines 5 to 9）我的第一个样式页面 <style type=text/css>body { color: purplebackground-color: #d8da3d } </style><body>[etc.] 第一行说的是，这。

1、打开“我的电脑”，进入到页面以后，双击“属性”，进入到下一个页面。

2、在页面中找到控制面板这个选项，然后双击进入。

3、然后在控制面板的界面中找到“外观和个性化”的这个图标，双击进入下一界面。在新的界面里找到“文件资源管理器选项”的图标，在此图标有两个选项，选择“显示隐藏的文件和文件夹”。单击进入。

4、最后在文件资源管理器选项左上角的菜单一栏里，单击“查看”选项。再从下面的“高级设置”的栏目里下拉，找到“隐藏已知文件类型的扩展名”这一行，把前面的打勾去掉，就可以直接修改html网页内容了。

/// <summary>

/// 传入URL返回网页的html代码

/// </summary>

/// <param name="Url">URL</param>

/// <returns></returns>

public static string getUrltoHtml(string Url)

{

errorMsg = ""

try

{

System.Net.WebRequest wReq = System.Net.WebRequest.Create(Url)

// Get the response instance.

System.Net.WebResponse wResp =wReq.GetResponse()

// Read an HTTP-specific property

//if (wResp.GetType() ==HttpWebResponse)

//{

//DateTime updated =((System.Net.HttpWebResponse)wResp).LastModified

//}

// Get the response stream.

System.IO.Stream respStream = wResp.GetResponseStream()

// Dim reader As StreamReader = New StreamReader(respStream)

System.IO.StreamReader reader = new System.IO.StreamReader(respStream, System.Text.Encoding.GetEncoding("gb2312"))

return reader.ReadToEnd()

}

catch(System.Exception ex)

{

errorMsg = ex.Message

}

return ""

}

你可以用这个函数获取网页的客户端的html代码，然后保存到.html文件里就可以了。

方案2：

生成单个的静态页面不是难点，难的是各个静态页面间的关联和链接如何保持完整；

特别是在页面频繁更新、修改、或删除的情况下；

像阿里巴巴的页面也全部是html的，估计用的是地址映射的功能

关于地址映射可参考：

可以看看这个页面，分析一下他的“竞价倒计时”功能

ASP.Net生成静态HTML页

在Asp中实现的生成静态页用到的FileSystemObject对象!

在.Net中涉及此类 *** 作的是System.IO

以下是程序代码注:此代码非原创!参考别人代码

CODE:

//生成HTML页

public static bool WriteFile(string strText,string strContent,string strAuthor)

{

string path = HttpContext.Current.Server.MapPath("/news/")

Encoding code = Encoding.GetEncoding("gb2312")

// 读取模板文件

string temp = HttpContext.Current.Server.MapPath("/news/text.html")

StreamReader sr=null

StreamWriter sw=null

string str=""

try

{

sr = new StreamReader(temp, code)

str = sr.ReadToEnd() // 读取文件

}

catch(Exception exp)

{

HttpContext.Current.Response.Write(exp.Message)

HttpContext.Current.Response.End()

sr.Close()

}

string htmlfilename=DateTime.Now.ToString("yyyyMMddHHmmss")+".html"

// 替换内容

// 这时,模板文件已经读入到名称为str的变量中了

str =str.Replace("ShowArticle",strText) //模板页中的ShowArticle

str = str.Replace("biaoti",strText)

str = str.Replace("content",strContent)

str = str.Replace("author",strAuthor)

// 写文件

try

{

sw = new StreamWriter(path + htmlfilename , false, code)

sw.Write(str)

sw.Flush()

}

catch(Exception ex)

{

HttpContext.Current.Response.Write(ex.Message)

HttpContext.Current.Response.End()

}

finally

{

sw.Close()

}

return true

此函数放在Conn.CS基类中了

在添加新闻的代码中引用注：工程名为Hover

if(Hover.Conn.WriteFilethis.Title.Text.ToString),this.Content.Text.ToString),this.Author.Text.ToString)))

{

Response.Write("添加成功")

}

else

{

Response.Write("生成HTML出错!")

}

模板页Text.html代码

CODE:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" >

<HTML>

<HEAD>

<title>ShowArticle</title>

<body>

biaoti

<br>

content<br>

author

</body>

</HTML>

biaoti

<br>

content<br>

author

</body>

</HTML>

提示添加成功后会出以当前时间为文件名的html文件!上面只是把传递过来的几个参数直接写入了HTML文件中,在实际应用中需要先添加数据库，然后再写入HTML文件

方案3：

给一个客户端参考的例子（SJ）

它的作用在于以客户端的方式获取某个页面的代码，然后可以做为其他用途，本例是直接输出

var oXmlHttp = new ActiveXObject("Microsoft.XMLHTTP")

oXmlHttp.open("GET","", false)

oXmlHttp.send()

var oStream = new ActiveXObject("ADODB.Stream")

if(oStream == null)

alert("您的机器不支持ADODB.Stream.")

else

{

oStream.Type=1

oStream.Mode=3

oStream.Open()

oStream.Write(oXmlHttp.responseBody)

oStream.Position= 0

oStream.Type= 2

oStream.Charset="gb2312"

var result= oStream.ReadText()

oStream.Close()

oStream = null

var aa = window.open("","")

document.write(result)

aa.document.write(result)

}

</script>

方案4：学csdn一样。用xml保存数据，模版XSL也只有一个文件。

使用xml来保存数据，使用xsl来定义模板并且生称数据。可以通过xsl来很方便的在客户端或者服务段显示数据。如果要生成静态叶面那更简单了。去查一下.net的xml类包问题解决。

优点：可以方便快速转换成你想要的格式和内容。

缺点：需要学习更多的内容，不好入门。

方案5：

思路

1. 利用如Dw-Mx这样的工具生成html格式的模板，在需要添加格式的地方加入特殊标记(如$htmlformat$),动态生成文件时利用代码读取此模板，然后获得前台输入的内容，添加到此模板的标记位置中，生成新文件名后写入磁盘，写入后再向数据库中写入相关数据。

2. 使用后台代码硬编码Html文件，可以使用HtmlTextWriter类来写html文件。

优点

1. 可以建立非常复杂的页面，利用包含js文件的方法，在js文件内加入document.write()方法可以在所有页面内加入如页面头，广告等内容。

2. 静态html文件利用MS Windows2000的Index Server可以建立全文搜索引擎，利用asp.net可以以DataTable的方式得到搜索结果。而Win2000的Index服务无法查找xml文件的内容。如果包括了数据库搜索与Index索引双重查找，那么此搜索功能将非常强大。

3. 节省服务器的负荷，请求一个静态的html文件比一个aspx文件服务器资源节省许多。

缺点

思路二：如果用硬编码的方式，工作量非常大，需要非常多的html代码。调试困难。而且使用硬编码生成的html样式无法修改，如果网站更换样式，那么必须得重新编码，给后期带来巨大的工作量。

因此这里采用的是第一种思路

示列代码

1.定义(template.htm)html模板页面

＜html＞

＜head＞

＜title＞＜/title＞

＜meta http-equiv="Content-Type" content="text/html charset=gb2312"＞

＜/head＞

＜body ＞

＜table $htmlformat[0] height="100%" border="0" width="100%" cellpadding="10" cellspacing="0" bgcolor="#eeeeee" style="border:1px solid #000000"＞

＜tr＞

＜td width="100%" valign="middle" align="left"＞

＜span style="color: $htmlformat[1]font-size: $htmlformat[2]"＞$htmlformat[3]＜/span＞

＜/td＞

＜/tr＞

＜/table＞

＜/body＞

＜/html＞

2.asp.net代码：

//---------------------读html模板页面到stringbuilder对象里----

string[] format=new string[4]//定义和htmlyem标记数目一致的数组

StringBuilder htmltext=new StringBuilder()

try

{

using (StreamReader sr = new StreamReader("存放模板页面的路径和页面名"))

{

String line

while ((line = sr.ReadLine()) != null)

{

htmltext.Append(line)

}

sr.Close()

}

catch

{

Response.Write("＜Script＞alert('读取文件错误')＜/Script＞")

}

//---------------------给标记数组赋值------------

format[0]="background="bg.jpg""//背景图片

format[1]= "#990099"//字体颜色

format[2]="150px"//字体大小

format[3]= "＜marquee＞生成的模板html页面＜/marquee＞"//文字说明

//----------替换htm里的标记为你想加的内容

for(int i=0i＜4i++)

{

htmltext.Replace("$htmlformat["+i+"]",format[i])

}

//----------生成htm文件------------------――

try

{

using(StreamWriter sw=new StreamWriter("存放路径和页面名",false,System.Text.Encoding.GetEncoding("GB2312")))

{

sw.WriteLine(htmltext)

sw.Flush()

sw.Close()

}

catch

{

Response.Write ("The file could not be wirte:")

}

小结

用此方法可以方便的生成html文件。程序使用了是循环替换，因此对需替换大量元素的模板速度非常快。

另外,团IDC网上有许多产品团购,便宜有口碑

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/7601631.html

怎么把网页保存为html格式

发表评论

评论列表（0条）