一般情况下,网页上文本内容可以直接选择复制下来,或者直接保存为网页文件或文本文件。但是,也有一些网页上的文本内容不能直接被选择和复制,也不能被保存为网页文件或文本文件。
有些网页作了加密处理,右键不起作用。这时可点击网页菜单栏上“查看”菜单中的“源文件”选项,将整个网页的HTML源文件保存下来后,再从源代码中寻找你所需要的文本信息。
2、网页文本素材的下载和处理:
在网页的空白处用鼠标右击,在快捷菜单中选择“查看源文件”,d出网页的源文件编辑窗口。该窗口一般是记事本窗口。
查看该文件的内容,将正文前的所有内容删除,然后保存为文本文件。
将保存的文件的扩展名.txt改为网页文件的扩展名.htm。
再次打开该文件后,文本内容就可以被复制下来。
简单的文件下载只需要使用HTML的连接标记<a>,并将属性href的URL值指定为下载的文件即可。所示:<a href=”http://www.*****.net/download/book.rar”>下载文件</a>
如果通过上面的代码实现文件下载,只能处理一些浏览器不能默认识别的MIME类型文件,例如当访问book.rar文件时,浏览器并没有直接打开,而是d出一个下载提示框,提示用户“下载”还是“打开”等处理方式。但如果需要下载后缀名为.html的网页文件、图片文件及PHP程序脚本文件等,使用这种连接形式,则会将文件内容直接输出到浏览器中,并不会提示用户下载。
为了提高文件的安全性,不希望在<a>标签中给出文件的链接,则必须向浏览器发送必要的头信息,以通知浏览器将要进行下载文件的处理。PHP使用header()函数发送网页的头部信息给浏览器,该函数接收一个头信息的字符串作为参数。文件下载需要发送的头信息包括以下三部分,通过调用三次header()函数完成。以下载图片test.gif为例,需要发送的头信息的所示:
header(‘Content-Type:imge/gif')//发送指定文件MIME类型的头信息
header(‘Content-Disposition:attachmentfilename=”test.gif”‘)//发送描述文件的头信息,附件和文件名
header(‘Content-Length:3390′)//发送指定文件大小的信息,单位字节
如果使用header()函数向浏览器发送了这三行头信息,图片test.gif就不会直接在浏览器中显示,而让浏览器将该文件形成下载的形式。在函数header()中,“Content-Type”指定了文件的MIME类型,“Content_Disposition”用于文件的描述,值“attachment
filename=”test.gif””说明这是一个附件,并且指定了下载后的文件名,“Content_Length”则给出了被下载文件的大小。
设置完头部信息以后,需要将文件的内容输出到浏览器,以便进行下载。可以使用PHP中的文件系统函数将文件内容读取出来后,直接输出给浏览器。最方便的是使用readfile()函数,将文件内容读取出来直接输出。下载文件test.gif的所示:
<?php
$filename = "test.gif"
header('Content-Type:image/gif')//指定下载文件类型
header('Content-Disposition: attachmentfilename="'.$filename.'"')//指定下载文件的描述
header('Content-Length:'.filesize($filename))//指定下载文件的大小
//将文件内容读取出来并直接输出,以便下载
readfile($filename)
?>
上面如果碰到中文名字就会无法正常下载了,对于中文名字下载文件我又找到一个文件下载实例代码
<?php
header("Content-type:text/htmlcharset=utf-8")
// $file_name="cookie.jpg"
$file_name="圣诞狂欢.jpg"
//用以解决中文不能显示出来的问题
$file_name=iconv("utf-8","gb2312",$file_name)
$file_sub_path=$_SERVER['DOCUMENT_ROOT']."marcofly/phpstudy/down/down/"
$file_path=$file_sub_path.$file_name
//首先要判断给定的文件存在与否
if(!file_exists($file_path)){
echo "没有该文件文件"
return
}
$fp=fopen($file_path,"r")
$file_size=filesize($file_path)
//下载文件需要用到的头
Header("Content-type: application/octet-stream")
Header("Accept-Ranges: bytes")
Header("Accept-Length:".$file_size)
Header("Content-Disposition: attachmentfilename=".$file_name)
$buffer=1024
$file_count=0
//向浏览器返回数据
while(!feof($fp) &&$file_count<$file_size){
$file_con=fread($fp,$buffer)
$file_count+=$buffer
echo $file_con
}
fclose($fp)
?>
header("Content-type:text/htmlcharset=utf-8")的作用:在服务器响应浏览器的请求时,告诉浏览器以编码格式为UTF-8的编码显示该内容
关于file_exists()函数不支持中文路径的问题:因为php函数比较早,不支持中文,所以如果被下载的文件名是中文的话,需要对其进行字符编码转换,否则file_exists()函数不能识别,可以使用iconv()函数进行编码转换
$file_sub_path() 我使用的是绝对路径,执行效率要比相对路径高
Header("Content-type: application/octet-stream")的作用:通过这句代码客户端浏览器就能知道服务端返回的文件形式
Header("Accept-Ranges: bytes")的作用:告诉客户端浏览器返回的文件大小是按照字节进行计算的
Header("Accept-Length:".$file_size)的作用:告诉浏览器返回的文件大小
Header("Content-Disposition: attachmentfilename=".$file_name)的作用:告诉浏览器返回的文件的名称
以上四个Header()是必需的
fclose($fp)可以把缓冲区内最后剩余的数据输出到磁盘文件中,并释放文件指针和有关的缓冲区
function openclk() {another=open('smj.rar','NewWindow', 'toolbar=no,location=no,directories=no,status=no,menubar=no,scrollbars=no,resizable=yes,copyhistory=yes,width=0,height=0,left=0,top=0')}//--> 最后,在和这个文件的同目录下放置一个:smj.rar看截图:欢迎分享,转载请注明来源:内存溢出
评论列表(0条)