保存网页部分内容为html格式 *** 作步骤如下:
1、点击你自己想需要转换的网页文件,如下图。
2、点击右上角关闭下面有个“设置"的选项。点击"文件"选项,最后在点击“另存为”。
3、点击另存为对话框中的“保存类型选项”中然后在选择“文本文件(*.txt)”。
4、然后下方有”编码”。点击此处选择“简体中文”。这个过程是为了防止使转换过程中不会出现乱码的情况。
5、综合上述步骤,点击保存后即可就可以得到TXT格式的文件,如下图。
2. 怎么以HTML格式保存页面内容
只要将网页另存为,就是可以保存成HTML格式。
步骤如下:
1、点击你的浏览器,然后选择右上角的三条杠。
2、点击另存网页为。
3、然后选择保存类型,点击第一个。然后就能保存成HTML格式。
3. 怎样把一个网页保存到电脑上并且保存为HTML文件
第一步:编写HTML 对于这个教程,我建议你只使用最简单的工具。
例如:Notepad(在windows里),TextEdit (在Mac上)或是KEdit (在KDE里)就可以了。一旦你了解这个原理,你就会想要切换到更高级的工具,甚至是商业程序,如Style Master,Dreamweaver或GoLive。
但对于你的第一个CSS样式表,最好不要因为使用太多的高级功能而分心。 不要使用文字处理器,如Microsoft Word或OpenOffice。
它们通常制作出网络浏览器不能读取文件。对于HTML和CSS,我们需要简单的纯文本文件。
第一步打开你的文本编辑器(Notepad,TextEdit,KEdit,或是任何你喜欢的文本编辑器),在一个空的窗口开始,输入以下的内容: <!DOCTYPE html PUBLIC "-W3CDTD HTML 4.01EN">我的第一个样式页面 <body><!-- 目录 -->
html">首页 html">连接1 html">连接2 html">连接3 <!-- 主要内容 --> 我的第一个样式页面 欢迎来到我的样式页面! 这里没有图片, 但至少有CSS样式. 有连接, 但只是为了举例和演示, 并不能带你到任何地方… 这只是个例子, 好象没什么好写. <!-- 签名和日期 -->2004年4月5日制作 事实上,你不需要输入它:你可以从这个网页复制并粘贴进编辑器。 (如果你在Mac 上使用TextEdit,不要忘记告诉TextEdit文本确实是纯文本,通过转到格式菜单并选择 “Make plain text”。)
上面HTML文件的第一行告诉浏览器HTML的类型(DOCTYPE 意思是文档类型)。在这个案例中,它是HTML 4.01 版本。
在 <和 >里的单词叫标签,像你看能到的,这文档包含 和 标签。在 和 间有一个位置是给没有显示在屏幕上各个种类的信息的。
目前为止,它包含文档的标题,但之后我们也会在这里加上CSS样式表。 <body>是实际文档文本所在之处。
原则上,除了在 <!-- 和 -->里作为对它们本身注解的内容不会显示,这里的所有内容都会被显示。浏览器会忽略它。
在该示例中的标签, 介绍了一个“无次序列表”,例如:条目没有编号的列表。 是“列表条目”的开始。
是“段”。还有 是创建超链接的“锚点”。
编辑器展示了HTML源。 如果你想知道在<…>里的名字是什么意思,一个好的开始地方是着手从HTML开始。
但是只有一些关于我们示例HTML页面的单词。 “ul”是一个每个条目都有一个超链接的列表。
这会作为我们的“网站导航菜单”链接到我们(超链接)网站的其它页面。想必,我们网站的所有页面都有一个类似的菜单。
“h1”和“p”元素形成这个页面独特的内容,而底部的签名(“address”)也是和网站上所有的页面是类似的。 注意,我没有关闭“li”和“p” 元素。
在HTML里(但不是在XHTML 里),允许忽略和标签,这就是我在这里做的,为了使得文本稍微容易读一点。但是你可以加上它们,如果你喜欢的话。
让我们假设这是要成为一个有许多类似页面的网站上的一个页面。对当前网页来说很普通,此页面有一个菜单,在超链接站点,一些独特的内容和签名上链接到其它页面上去。
现在从文件菜单里选定“另存为……”,导入你想把它放入的一个目录/文件夹里(桌面也可以),再把文件存为“mypage”。先不要关掉编辑器,我们还会需要它。
(如果你在Mac OS X 10.4 前的版本上使用TextEdit,你会看到一个选项“不要附加保存.txt 扩展名”的存盘对话框。选定那个选项,因为名字“mypage”已经包含了一个扩展名。
更新的版本的TextEdit会让自动扩展。) 接下来,在浏览器里打开文件。
你可以按照下面的做:用你的文件管理器(Windows Explorer,Finder或Konqueror )找到文件,再点击或双击“mypage”文件。它就会在你默认的网络浏览器里打开。
(如果不可以,就打开你的浏览器,把文件拖进来。) 像你看到的那样,页面看起来非常沉闷…… 第二步,添加一些颜色 你可能看到一些白色背景里的黑色文本,但它是取决于浏览器如何配置的。
所以,我们能做的让页面更加时新的一件简单的事情就是添加一些颜色。(让浏览器开着,我们之后会再用到它。)
我们从嵌在HTML 文件里的样式表开始。然后,我们会把HTML和 CSS 放进单独的文件里。
单独的文件很好,因为相对于复合的HTML文件,它让相同的样式表使用起来更简单:你只需要编写样式表一遍。但是对于该步骤,我们仅仅保持所有的内容在一个文件里。
我们需要添加一个<style>元素到HTML文件中。样式表会在此元素里。
所以回到编辑器窗口,再在HTML文件的抬头部分添加下面的五行。要添加的行用红色的显示出来了。
(lines 5 to 9) 我的第一个样式页面 <style type=text/css>body { color: purplebackground-color: #d8da3d } </style><body>[etc.] 第一行说的是,这。
1、打开“我的电脑”,进入到页面以后,双击“属性”,进入到下一个页面。
2、在页面中找到控制面板这个选项,然后双击进入。
3、然后在控制面板的界面中找到“外观和个性化”的这个图标,双击进入下一界面。在新的界面里找到“文件资源管理器选项”的图标,在此图标有两个选项,选择“显示隐藏的文件和文件夹”。单击进入。
4、最后在文件资源管理器选项左上角的菜单一栏里,单击“查看”选项。再从下面的“高级设置”的栏目里下拉,找到“隐藏已知文件类型的扩展名”这一行,把前面的打勾去掉,就可以直接修改html网页内容了。
/// <summary>/// 传入URL返回网页的html代码
/// </summary>
/// <param name="Url">URL</param>
/// <returns></returns>
public static string getUrltoHtml(string Url)
{
errorMsg = ""
try
{
System.Net.WebRequest wReq = System.Net.WebRequest.Create(Url)
// Get the response instance.
System.Net.WebResponse wResp =wReq.GetResponse()
// Read an HTTP-specific property
//if (wResp.GetType() ==HttpWebResponse)
//{
//DateTime updated =((System.Net.HttpWebResponse)wResp).LastModified
//}
// Get the response stream.
System.IO.Stream respStream = wResp.GetResponseStream()
// Dim reader As StreamReader = New StreamReader(respStream)
System.IO.StreamReader reader = new System.IO.StreamReader(respStream, System.Text.Encoding.GetEncoding("gb2312"))
return reader.ReadToEnd()
}
catch(System.Exception ex)
{
errorMsg = ex.Message
}
return ""
}
你可以用这个函数获取网页的客户端的html代码,然后保存到.html文件里就可以了。
方案2:
生成单个的静态页面不是难点,难的是各个静态页面间的关联和链接如何保持完整;
特别是在页面频繁更新、修改、或删除的情况下;
像阿里巴巴的页面也全部是html的,估计用的是地址映射的功能
关于地址映射可参考:
可以看看这个页面,分析一下他的“竞价倒计时”功能
ASP.Net生成静态HTML页
在Asp中实现的生成静态页用到的FileSystemObject对象!
在.Net中涉及此类 *** 作的是System.IO
以下是程序代码 注:此代码非原创!参考别人代码
CODE:
//生成HTML页
public static bool WriteFile(string strText,string strContent,string strAuthor)
{
string path = HttpContext.Current.Server.MapPath("/news/")
Encoding code = Encoding.GetEncoding("gb2312")
// 读取模板文件
string temp = HttpContext.Current.Server.MapPath("/news/text.html")
StreamReader sr=null
StreamWriter sw=null
string str=""
try
{
sr = new StreamReader(temp, code)
str = sr.ReadToEnd() // 读取文件
}
catch(Exception exp)
{
HttpContext.Current.Response.Write(exp.Message)
HttpContext.Current.Response.End()
sr.Close()
}
string htmlfilename=DateTime.Now.ToString("yyyyMMddHHmmss")+".html"
// 替换内容
// 这时,模板文件已经读入到名称为str的变量中了
str =str.Replace("ShowArticle",strText) //模板页中的ShowArticle
str = str.Replace("biaoti",strText)
str = str.Replace("content",strContent)
str = str.Replace("author",strAuthor)
// 写文件
try
{
sw = new StreamWriter(path + htmlfilename , false, code)
sw.Write(str)
sw.Flush()
}
catch(Exception ex)
{
HttpContext.Current.Response.Write(ex.Message)
HttpContext.Current.Response.End()
}
finally
{
sw.Close()
}
return true
此函数放在Conn.CS基类中了
在添加新闻的代码中引用 注:工程名为Hover
if(Hover.Conn.WriteFilethis.Title.Text.ToString),this.Content.Text.ToString),this.Author.Text.ToString)))
{
Response.Write("添加成功")
}
else
{
Response.Write("生成HTML出错!")
}
模板页Text.html代码
CODE:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" >
<HTML>
<HEAD>
<title>ShowArticle</title>
<body>
biaoti
<br>
content<br>
author
</body>
</HTML>
biaoti
<br>
content<br>
author
</body>
</HTML>
提示添加成功后会出以当前时间为文件名的html文件!上面只是把传递过来的几个参数直接写入了HTML文件中,在实际应用中需要先添加数据库,然后再写入HTML文件
方案3:
给一个客户端参考的例子(SJ)
它的作用在于以客户端的方式获取某个页面的代码,然后可以做为其他用途,本例是直接输出
<script>
var oXmlHttp = new ActiveXObject("Microsoft.XMLHTTP")
oXmlHttp.open("GET","", false)
oXmlHttp.send()
var oStream = new ActiveXObject("ADODB.Stream")
if(oStream == null)
alert("您的机器不支持ADODB.Stream.")
else
{
oStream.Type=1
oStream.Mode=3
oStream.Open()
oStream.Write(oXmlHttp.responseBody)
oStream.Position= 0
oStream.Type= 2
oStream.Charset="gb2312"
var result= oStream.ReadText()
oStream.Close()
oStream = null
var aa = window.open("","")
document.write(result)
aa.document.write(result)
}
</script>
方案4:学csdn一样。用xml保存数据,模版XSL也只有一个文件。
使用xml来保存数据,使用xsl来定义模板并且生称数据。可以通过xsl来很方便的在客户端或者服务段显示数据。如果要生成静态叶面那更简单了。去查一下.net的xml类包问题解决。
优点:可以方便快速转换成你想要的格式和内容。
缺点:需要学习更多的内容,不好入门。
方案5:
思路
1. 利用如Dw-Mx这样的工具生成html格式的模板,在需要添加格式的地方加入特殊标记(如$htmlformat$),动态生成文件时利用代码读取此模板,然后获得前台输入的内容,添加到此模板的标记位置中,生成新文件名后写入磁盘,写入后再向数据库中写入相关数据。
2. 使用后台代码硬编码Html文件,可以使用HtmlTextWriter类来写html文件。
优点
1. 可以建立非常复杂的页面,利用包含js文件的方法,在js文件内加入document.write()方法可以在所有页面内加入如页面头,广告等内容。
2. 静态html文件利用MS Windows2000的Index Server可以建立全文搜索引擎,利用asp.net可以以DataTable的方式得到搜索结果。而Win2000的Index服务无法查找xml文件的内容。如果包括了数据库搜索与Index索引双重查找,那么此搜索功能将非常强大。
3. 节省服务器的负荷,请求一个静态的html文件比一个aspx文件服务器资源节省许多。
缺点
思路二: 如果用硬编码的方式,工作量非常大,需要非常多的html代码。调试困难。而且使用硬编码生成的html样式无法修改,如果网站更换样式,那么必须得重新编码,给后期带来巨大的工作量。
因此这里采用的是第一种思路
示列代码
1.定义(template.htm)html模板页面
<html>
<head>
<title></title>
<meta http-equiv="Content-Type" content="text/html charset=gb2312">
</head>
<body >
<table $htmlformat[0] height="100%" border="0" width="100%" cellpadding="10" cellspacing="0" bgcolor="#eeeeee" style="border:1px solid #000000">
<tr>
<td width="100%" valign="middle" align="left">
<span style="color: $htmlformat[1]font-size: $htmlformat[2]">$htmlformat[3]</span>
</td>
</tr>
</table>
</body>
</html>
2.asp.net代码:
//---------------------读html模板页面到stringbuilder对象里----
string[] format=new string[4]//定义和htmlyem标记数目一致的数组
StringBuilder htmltext=new StringBuilder()
try
{
using (StreamReader sr = new StreamReader("存放模板页面的路径和页面名"))
{
String line
while ((line = sr.ReadLine()) != null)
{
htmltext.Append(line)
}
sr.Close()
}
}
catch
{
Response.Write("<Script>alert('读取文件错误')</Script>")
}
//---------------------给标记数组赋值------------
format[0]="background="bg.jpg""//背景图片
format[1]= "#990099"//字体颜色
format[2]="150px"//字体大小
format[3]= "<marquee>生成的模板html页面</marquee>"//文字说明
//----------替换htm里的标记为你想加的内容
for(int i=0i<4i++)
{
htmltext.Replace("$htmlformat["+i+"]",format[i])
}
//----------生成htm文件------------------――
try
{
using(StreamWriter sw=new StreamWriter("存放路径和页面名",false,System.Text.Encoding.GetEncoding("GB2312")))
{
sw.WriteLine(htmltext)
sw.Flush()
sw.Close()
}
}
catch
{
Response.Write ("The file could not be wirte:")
}
小结
用此方法可以方便的生成html文件。程序使用了是循环替换,因此对需替换大量元素的模板速度非常快。
另外,团IDC网上有许多产品团购,便宜有口碑
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)