Scrapy使用的XPath
1.0具有非常有限的字符串 *** 作功能,尤其是不支持正则表达式。减少字符串有两种方法,我将通过一个示例来演示两种方法,以简化为您要查找的子字符串。
如果字符索引不更改(但内容可以更改),这很好。
通过前置/后缀搜索substring($string, $start, $len)substring(//td[@]/text(), 16, 16)
如果索引可以更改,这很好,但是字符串前后的内容立即保持不变:
substring-before($string, $needle)substring-after($string, $needle)substring-before( substring-after(//td[@]/text(), 'on '), ' Read')
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)