推荐使用的是 PyCharm,大部分用的都是这个,还有一部分坚守再sublime text上:
mport urllib
from BeautifulSoup import BeautifulSoup
url = 连接;
allData=
content = urlliburlopen(url)read()
soup = BeautifulSoup(content)
tags1 = soupfindAll('tr', {class: even right})
tags2 = soupfindAll('tr', {class: odd right})
上面的就是利用写的一些代码,是要取出网页中class 为even right 的所有tr和所有class为odd right的所有tr取出之后就可以打印出他的内容。
htmlspecialchars是将html转码,防止XSS攻击的。你这样没有意义。
CURL获取内容后直接 preg_match_all('/<p>()<\/p>/');就可以了还有不懂的可以追问
你的DIV给个ID,然后可以试着这样来试试,数组形式获取P标签;
documentgetElementById("DIV的ID")getElementsByTagName("p")[0] ------第一个P标签
<!doctype html>
<html>
<head>
<meta charset="utf-8">
<title>获取内容</title>
</head>
<body>
<div id="test">
<p class="title">1111</p>
<p class="content">10101010</p>
<p class="title">222</p>
<p class="content">20202020</p>
<p class="title">333</p>
<p class="content">30303030</p>
</div>
<script src=">
以上就是关于请各位老师指点一下,请问用BeautifulSoup如何获取p标签内的值全部的内容,包括:请各位老师指点一下,请问用BeautifulSoup如何获取p标签内的值、PHP正则获取整个页面<p>标签里面的内容、一个div下边有多个p标签中 如何提取其中具体一个的内容 这些p标签都没有标记属性无法通过#id、.class获取等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)