如何用python的selenium提取页面所有资源加载的链接_框架

最近需要写一个爬虫，逻辑上有一个环节是取得一个页面的所有资源加载链接（html5页面）

（ps：python下的确是是有个第三方包叫Ghostpy可以取得，但是尝试后效果并不好，估计是因为Ghostpy的webkit对html5的支持并不好。）

选择用selenium，但是没找到selenium的webdriver下取得所有资源加载链接的方法。

selenium包下有一个selenium模块。查看源码时看到有个get_all_links方法。但是一直没找到这个模块的用法。

最后，求解答。谢谢大家。

方法不成的话，就自己do

it把：

all_links

browserfind_element_by_xpath('//a')

for

all_links:

agetAttribute('href')

Python的MySQL资源主要可通过pymysql、mysqlclient、mysql-connector-python等第三方库来实现。这些库提供了一些负责管理和 *** 作MySQL数据库的模块和函数，例如连接、创建表、插入数据、查询数据、事务等。可通过官方文档、第三方教程和博客等方式来进行学习和使用。同时，也可以通过MySQL官方网站获取MySQL Connector/Python官方驱动程序，以便在Python中使用MySQL。MySQL Connector/Python是MySQL官方支持的Python驱动程序，提供了基于Python的 *** 作MySQL的接口，通常会通过pip等Python包管理工具来安装。

据行内经验来说，IT语言的培训时间一般在四五个月，Python爬虫培训时间也不会例外。互联网是一张网，Python爬虫就是网上爬来爬去的蜘蛛。网上的资源就是通过它来抓取下来。至于想要抓什么，全部由Python工程师来控制。

Python爬虫在抓取一个网页的时候，首先需要一条道路，而这条到来就是网页上的超级链接。因此有效链接多的话，蜘蛛就可以继续爬取获取其他页面的资源，这也就是我们常说的条条大道通罗马。

Python是一种全栈计算机程序设计语言，比如完成一个Web服务，C语言要写1000行代码，Java要写100行，而python可能只要写20行。由于python“简单易懂”，已逐步成为网络爬虫主流语言。

Python培训中优秀的资源有很多，比如机构的教学视频、资源库以及专业老Python优秀书籍：《Learn Python the Hard Way》的作者将书中的内容制作成网络教程免费提供，包括很多值得花时间完成的习题，只有多写代码，你才能从菜鸟变成老鹰。师的答疑等。

1Python教学视频：如果你习惯视频学习，那么可以考虑选择Udacity的Python for the Web免费课程，通过学习该课程，你将对web数据的流转有着更深入的认识。2Python的机器学习资源库：这个Github上的Python机器学习库提供大量优秀资源，让你快速入门3Learn-Python：GitHub与learning-python3类似，learn-python可以作为初学者和中级学习者的Python资源集合。该项目使用一组Python脚本来涵盖Python中的各个主题，例如运算符，数据类型，类，模块等等，并带有精确的说明和示例。4full-speed-python。涵盖了Python的基础知识以及更高级的主题，着重于实践学习。提供充足的练习来巩固对概念的理解。关于Python培训的更多相关知识，建议到千锋教育进行更详细的了解，目前，千锋教育已在北京、深圳、上海、广州、郑州、大连等20余个核心城市建立直营校区，等待你的随听。

以上就是关于如何用python的selenium提取页面所有资源加载的链接全部的内容，包括:如何用python的selenium提取页面所有资源加载的链接、python的mysql资源在哪里找、python爬虫需要学多久_爬虫python入门好学吗等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/web/9411396.html

如何用python的selenium提取页面所有资源加载的链接

发表评论

评论列表（0条）