1、启动windows命令行工具(windows下启动系统搜索功能,输入cmd回车就出来了)。
2、查看环境变量是否已经自动配置,在命令行工具中输入node-v,如果出现v10字段,则说明成功安装Node.js。
3、在第三步发现输入node-v还是没有出现对应的字段,那么重启电脑即可。
4、打开本项目文件夹,打开命令行工具(windows系统中直接在文件的url地址栏输入cmd就可以打开了),输入npmicnpmnodemon-g。
5、下载puppeteer爬虫包,在完成第五步后,使用cnpmipuppeteer--save命令下载。
6、完成第六步下载后,打开本项目的url.js,将您需要爬虫爬取的网页地址替换上去。
7、在命令行中输入nodemonindex.js即可爬取对应的内容,并且自动输出到当前文件夹下面的index.pdf文件中。
浏览器不兼容、PDF文件损坏、网络问题。1、浏览器不兼容:pdfh5.js要求浏览器支持HTML5和JavaScript技术,浏览器版本过低或者不支持这些技术,就无法正常使用pdfh5.js。
2、PDF文件损坏:PDF文件本身出现了问题,会导致pdfh5.js无法打开。
3、网络问题:PDF文件较大或者网络不稳定,会导致pdfh5.js无法加载文件。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)