#输入百度贴吧地址,及当期目录将要新建的文件夹名称。即可下载并存入新建文件夹中。
#算是自己这几天来写的第一个小程序吧。不过程序还存在几个bug
#比如:url地址不合法,同名的文件夹已经存在等问题没有处理
#其中只有:url地址匹配用到了一点re的内容。
#说实话,Python真是简单,你所想要的功能基本都有了!!!
#还小有成就感呢,(^__^) 嘻嘻……
#coding:utf-8
import urllib
import re
import os
def getHtml(url):
page = urlliburlopen(url)
html = pageread()
return html
def getImg(html):
reg = r'src="(
\jpg)"'
imgre = recompile(reg)
imglist = refindall(imgre,html)
return imglist
def main():
url = r'
url = str(raw_input('input the url : '))
forder = r'test'
forder = str(raw_input('input the forder name : '))
osmkdir(forder)
html = getHtml(url)
count = 0
for imgurl in getImg(html):
count += 1
print imgurl
urlliburlretrieve(imgurl,'%s/%sjpg' % (forder,count))
print 'total saved : %s pictures to : %s ' % (forder,count)
if __name__ == '__main__':
main()
类似的一个正则,加个括号就选出来了。
参考例子如下:
<php
echo getSubstr('我是测试文本','我是','文本');
/以下是取中间文本的函数
getSubstr=调用名称
$str=预取全文本
$leftStr=左边文本
$rightStr=右边文本
/
function getSubstr($str, $leftStr, $rightStr)
{
$left = strpos($str, $leftStr);
//echo '左边:'$left;
$right = strpos($str, $rightStr,$left);
//echo '<br>右边:'$right;
if($left < 0 or $right < $left) return '';
return substr($str, $left + strlen($leftStr), $right-$left-strlen($leftStr));
}
>
function getSubstr($str, $leftStr, $rightStr)
{
$left = strpos($str, $leftStr);
//echo '左边:'$left;
$right = strpos($str, $rightStr,$left);
//echo '<br>右边:'$right;
if($left < 0 or $right < $left) return '';
return substr($str, $left + strlen($leftStr), $right-$left-strlen($leftStr));
}
$preg = '<img src=\"#()#\" style=\"\" title=\"#()#\"/>'
类似这样,没测试过,这样正则出来的,是一个二维数组,array[1][i]就是4张图的src地址了,也就是数据中的第2行数据
$pattern = '/(<=:\s)"[\80-\xff:\w]+"(=\,)/';
//$pattern = '/(<=:\s")[\80-\xff:\w]+(="\,)/';//不需要引号的时候
preg_match($pattern,'{ "t": "我是真的love:you", "i": "',$match);
print_r($match);
测试应该可以。。当然还有其他正则表达式的写法
以上就是关于请问python中正则表达式如何获取字符串中间指定内容全部的内容,包括:请问python中正则表达式如何获取字符串中间指定内容、php正则问题如何取文本中间内容、php正则获取字符串,给定两边的字符串提取中间字符等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)