如果一个女生每天早上醒来,都能收到男朋友发来的暖心问候,会不会觉得一天心情都美美的呢?就和下图一样:
其实这张图就是程序员用Node + EJS写的一个爬虫脚本—— wechatBot
创建者通过使用到superagent和cheerio组合来实现爬虫,从而获取指定网页的所有DOM,天气预报等讯息
然后,通过EJS模版引擎生成HTML,最后通过node-schedule这个定时任务发生器定时,node-schedule可以定时每个月、每个礼拜,甚至是每天具体什么时候执行任务。
是不是觉得有点意思呢?
于是,有开发者看到这个项目后灵感乍现,心想为什么不用Python实现呢?于是就有了第二个项目—— EverydayWechat
这个项目就更厉害了,这名程序员觉得有些优(作)秀(死)的人表示女朋友不止一个,于是添加了一个多人信息的功能。可以定时每天给多个“女友”发暖心话
该项目用到的库如下:
itchat - 微信个人号接口
requests - 网络请求库
beautifulsoup4 - 解析网页
APScheduler - 定时任务
实现的效果如下:
正愁不知道怎么哄小女朋友的赶紧拿去用吧,或者学习一下这两位程序员是如何写的。很多女孩子都认为程序猿太过老实,一点都不懂得浪漫,但事实是程序猿浪漫起来真没别的男生的事
如果一个女生每天早上醒来,都能收到男朋友发来的暖心问候,会不会觉得一天心情都美美的呢?就和下图一样:
其实这张图就是程序员用Node + EJS写的一个爬虫脚本—— wechatBot
创建者通过使用到superagent和cheerio组合来实现爬虫,从而获取指定网页的所有DOM,天气预报等讯息
然后,通过EJS模版引擎生成HTML,最后通过node-schedule这个定时任务发生器定时,node-schedule可以定时每个月、每个礼拜,甚至是每天具体什么时候执行任务。
是不是觉得有点意思呢?
于是,有开发者看到这个项目后灵感乍现,心想为什么不用Python实现呢?于是就有了第二个项目—— EverydayWechat
这个项目就更厉害了,这名程序员觉得有些优(作)秀(死)的人表示女朋友不止一个,于是添加了一个多人信息的功能。可以定时每天给多个“女友”发暖心话
该项目用到的库如下:
itchat - 微信个人号接口
requests - 网络请求库
beautifulsoup4 - 解析网页
APScheduler - 定时任务
实现的效果如下:
正愁不知道怎么哄小女朋友的赶紧拿去用吧,或者学习一下这两位程序员是如何写的。
网络爬虫是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。它是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。它从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)