Python爬虫怎么循环截取html标签中间的内容?

Python爬虫怎么循环截取html标签中间的内容?,第1张

如果是中间的数据直接就用bs4最简单

from bs4 import BeautifulSoup

#这里是请求过来的额数据处理,提取标签

html = BeautifulSoup(response.text, 'html.parser')

body = html.body       # 获取body部分数据

div = body.find("div",{'id','today'}) #用find去找div标签,id叫 today的标签里面的数据

就可以了

如果要提取标签内容比如value的值

div = body.find("input",id='hidden_title')['value']

1、首先打开hbuilder软件,新建一个html文件,里面写入一个p标签和一个按钮标签。

2、然后在p标签的下方设置一个script标签,里面写入js胆码;先获取p标签和按钮的dom对象,然后给按钮添加一个点击事件,再点击事件爱的回调中alertp标签的text属性即可。

3、最后打开浏览器,可以看到一段文字和一个按钮,点击这个按钮。

4、就可以d出内容了。

  html中获取标签的数据,可以通过js来获取,如下代码:

<script type="text/javascript" src="js/jquery.js"></script>

<script type="text/javascript">

function validate(){

//一 .是通过jDOM

// var attitudeObj = document.getElementById("attitude")

//var attitude = attitudeObj.innerHTML

//二 .是通过jquery

var att = $("#attitude").text()//可以得到输入域中的内容

var idnum = $("#idnum").val()

var name = $("#name").val()

var t_name =  $("#t_name").val()

var pro_name =  $("#pro_name").val()

// alert(att)

if( name == null || name == "" ){

alert("请输入毕业设计名称!")

return false

}

att   =   att.replace(/\s+/g,"")

if( att == null || att == ""){

alert("请输入选题须知!")

return false

}

if( t_name == null || t_name == "" ){

alert("请选择教师!")

return false

}

if( pro_name == null || pro_name == ""){

alert("请选择专业!")

return false

}

location="teacher/mainfra.jsp"

//location="teacherAction_AddGraduationTitle.action?idnum=" + idnum +"&cname=" + cname +"&start=" + start+"&end=" + end

return true

}

</script>

</head>

<body">

<div >

<div style="margin-left: 100px">

<!--   <form action="teacherAction_AddGraduationTitle.action" method="post" >-->

<span>自动编号:</span><input type="text" readonly="readonly" name="idnum" id="idnum" style="background: gray" value="<s:property value="#request.maxIdnum"/>"/><br/>

<br/>

<span>毕业设计名称:</span><input type="text" name="name" id="name"/><br/><br/>

<span>所属教师:</span><select name="t_name" id="t_name">

<option></option>

<s:iterator value="teacherList">

<option value="<s:property value='idnum' />"><s:property value="name" /></option>

</s:iterator>

</select><br/><br/>

<span>所属专业:</span><select name="pro_name" id="pro_name">

<option></option>

<s:iterator value="professionList">

<option value="<s:property value='idnum' />"><s:property value="pro_name" /></option>

</s:iterator>

</select>

<br/>

<br/>

<span>选题须知:</span>

<textarea id ="attitude" name="attitude" rows="3" cols="30" style="color: red">

</textarea>

<br/>

<br/>

<input type="button" value="添加">  <input style="margin-left: 100px" type="reset" value="重置">

<!-- </form>-->

</div>

</div>

</body>


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/6295041.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-20
下一篇 2023-03-20

发表评论

登录后才能评论

评论列表(0条)

保存