PHP selenium模拟采集

PHP selenium模拟采集,第1张

核心组件

1这个是下载chrome核心组件,需要放到网站www下
http://chromedriver.storage.googleapis.com/index.html

2安装webdriver,需要提前安装composer
php composer.phar require facebook/webdriver
或者是
composer require facebook/webdriver

3然后下载selenium放到www下
http://justcode.ikeepstudying.com/wp-content/uploads/2018/12/selenium-server-standalone-3.9.1.zip

还要下载一个java
https://www.java.com/zh-CN/download/


这些是代码

require_once('C:\composer\vendor\autoload.php');
use Facebook\WebDriver\Remote\DesiredCapabilities;
use Facebook\WebDriver\Remote\RemoteWebDriver;
use Facebook\WebDriver\Chrome\ChromeOptions;
use Facebook\WebDriver\Remote\WebDriverCapabilityType;
use Facebook\WebDriver\WebDriverBy;


$host = 'http://localhost:4444/wd/hub'; // this is the default
$capabilities = DesiredCapabilities::chrome();

$driver = RemoteWebDriver::create($host,$capabilities,5000);
$driver->manage()->timeouts()->implicitlyWait(15);    //隐性设置15秒

$driver->get("https://www.amazon.co.jp/-/zh/gp/bestsellers/shoes/".$node."/ref=zg_bs_pg_1?ie=UTF8&pg=1&language=ja_JP");
$YUANMA = $driver->getPageSource(); //获取网页源文件

现在可以用了

然后这个是外面的链接可以参考,写的不错

php-webdriver:PHP控制浏览器动作, php web驱动, PHP实现自动化, php webdriver 教程, A php client for webdriver. - 狂猫 - 博客园

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/740629.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-28
下一篇 2022-04-28

发表评论

登录后才能评论

评论列表(0条)

保存