Python:基于Python爬虫技术的抢票程序及其实现

Python:基于Python爬虫技术的抢票程序及其实现,第1张

临近放假,相信我们每天都在群聊里或者朋友圈看到一些帮忙纳茄抢火车票的信息。看到朋友们抢回家的车票这么辛( bei )苦( can ),结合圈里一些前辈的指点,抱着学习孝轿的心态巧茄肆用 Python 做了一个简单的自动化抢票程序,抢到票之后通过绑定的邮箱(比如 QQ )发通知。下面分享主要内容:

然后,开始使劲地码:

1. 定义自动购票的类(初始化属性)

2. 实现登录功能

3. 实现购票功能

4. 邮箱通知付款

还有,网络不好或者 12306 的服务器不稳定的时候,就会卡住,针对这种情况,系统会重复查询:

最后,祝大家都能顺利抢到票.

本文以转载于博客园小帝君的博客

使用 python 实现一个查询火车票的小工具

主要功能:

输入出发车站,到达车站,时间,然后返回所有的车次信息,和余票信息

支持输入附加选项查询不同的火车的类型,比如高铁,动车。

#查询上海到北京2017-04-25的高铁和动车的车票,-g -d 是附加选项 表示高铁和动车

python3 trains.py -gd 上海 北京 2017-04-25

运行结果:

1. 对12306网站买票过程抓包分析

点击查询之后,通过抓包发现返回了一个json的文件,查看这个文件,就是保存着具体车次的信息。抓包如下图所示。

请求的url 是:

GET /otn/leftTicket/query?leftTicketDTO.train_date=2017-04-20&leftTicketDTO.from_station=TJP&leftTicketDTO.to_station=TYV&purpose_codes=ADULT HTTP/1.1

发现这个请求使用的是get方法,然后传递了四个参数,一个是出余歼漏发站,一个是到达车站,一个是成年人or学生,最后一个是时间。如下图:

但是有一个问题是,我输入的是天津到太原,但是这个却转换成了拼音的简称。必须要找到这个转换的字典是什么,这样才能正确的使用这个接口。

在网页的源代码找到这个文件,station_name.js 文件,如下图:

js文件的格式是,如下图,使用的话,必须要想用正则表达式处理一下:

2. 使用正则表达式处理这个js文件

使用正则表达式,将js 文件里面的车站名字和对应的简称提取出来,然后写入到一个station.py 文件里面,作为字典,程序运行的时候,将这个文件以模块的形式包含进去。

关竖烂于正则表达式,先占一个改旦坑,以后在详细的写。

正则表达式的代码:

运行的时候:

# 将输出重定向到一个新的文件stations.py里面python3 test3.py >stations.py

3. 使用docopt 优雅的完成命令行的输入

docopt 是一个很优雅的处理输入的一个模块,docopt可以根据你写的文档描述,可以自动为你生成解析器,可以非常容易的为你的python程序创建命令行界面。http://www.jianshu.com/p/d2c7cbf21931

4. 主程序

4.1 处理url

4.2 输出

运行结果:

5. 使用prettytable模块 优雅的输出

详细:http://www.jianshu.com/p/a6172b68810e

作者 sexycoder 本文转载自简书,转载需授权

所谓抢票实际上是在芦迹开始放票的一瞬间第一个发出请求并点击预订。作为程序员的我们,完全可以让程序来做这件事。我花了几个小时写了一个demo。用到的工具集有:陪型并Python3.6, Selenium, chromdriver. 程序本身就是流程性的东西,没有什么可介绍的。代租茄码如下

#

coding=utf-8

from

selenium import

webdriver

from

time import

sleep

import

traceback

TICKET_URI

= '

https://kyfw.12306.cn/otn/leftTicket/init

'

LOGIN_URI

= '

https://kyfw.12306.cn/otn/login/init

'

MY_URI

= '

https://kyfw.12306.cn/otn/index/initMy12306

'

LOGIN

= u'

登录

'

from

splinter.browser import

Browser

from

time import

sleep

import

traceback

TICKET_URI

= '

https://kyfw.12306.cn/otn/leftTicket/init

'

LOGIN_URI

= '

https://kyfw.12306.cn/otn/login/init

'

MY_URI

= '

https://kyfw.12306.cn/otn/index/initMy12306

'

LOGIN

= '

login_user

'

def

login():

brw.find_element_by_id(LOGIN).click()

sleep(

3)

uname

= '123456789

@qq.com

'

pwd

= 'xxxyyyzzz

'

brw.find_element_by_id(

'

username

'

).send_keys(uname)

sleep(

1)

brw.find_


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12393799.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-25
下一篇 2023-05-25

发表评论

登录后才能评论

评论列表(0条)

保存