XPATH怎么获取特定文字后面的文本

XPATH怎么获取特定文字后面的文本,第1张

0艾希恩写的命令没错,但我估计,你是要实现打开一个CMD窗口,里面的路径为指定的,但不退出窗口,对吧? 那就在bat文件中写到 cmd /k "cd /d F:\123"这样就在运行后直接定位到F:\123

你好!

可以通过lxml来获取指定标签的内容。

#安装lxml

pip install lxml

import requests

from lxml import html

def getHTMLText(url):

    

    

etree = htmletree

root = etreeHTML(getHTMLText(url))

#这里得到一个表格内tr的集合

trArr  = rootxpath("//div[@class='news-text']/table/tbody/tr");

#循环显示tr里面的内容

for tr in trArr:

    rank = trxpath("/td[1]/text()")[0]

    name = trxpath("/td[2]/div/text()")[0]

    prov = trxpath("/td[3]/text()")[0]

    strLen = 22-len(nameencode('GBK'))+len(name)

    print('排名:{:<3},   学校名称:{:<{}}\t,   省份:{}'format(rank,name,strLen,prov))

希望对你有帮助!

用XPath表达式来定位到对应的<td>元素

//th[span[text()="发布时间"]]/following-sibling::td/span

这个XPath表达式首先选择包含文本“发布时间”的<span>元素的<th>元素,然后使用/following-sibling::td选择这个<th>元素的下一个兄弟元素,即包含发布时间的<td>元素。最后,使用/span选择包含发布时间值的<span>元素。

请注意,这个XPath表达式返回的是一个<span>元素,如果您只需要获取该元素的文本值,可以使用text()函数,例如:

//th[span[text()="发布时间"]]/following-sibling::td/span/text()

这将返回包含发布时间的<span>元素的文本值

以上就是关于XPATH怎么获取特定文字后面的文本全部的内容,包括:XPATH怎么获取特定文字后面的文本、如何用Python爬取出HTML指定标签内的文本、XPATH文本内容匹配th内容,获取td的值等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9351895.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存