1.
修改urllib2的agent。因为许多机器人发帖程序都用了urllib2,默认agent可能会被神悔屏蔽。你可以通过改agent把自己伪装成IE或者firefox之类的浏览器。
2.
什么叫投递到发贴框中?难道你所谓的发帖是通过修改DOM节点实现的??隐袭?正确的发帖程序应该先分析页面form的组成,然后组装出合适的http
request,通过POST或者GET方法发出去。游携正
以python 2.7为例。首先肯定会用到: urllib urllib2 cookielib。顶贴一般也就是回复一个帖子了,那么要像服务器发送一个特定的http请求,用python构造出这个请求再发就行了,具体构仔洞造成什么样,可以用firebug等工具看实际发帖过程中发到服务器的请求。
还有可能用到:re htmllib BeautifulSoup json 等。用来解析获取的web页面,用正则表达式或者专用于html解析的包来分析页面,在页面里找东西(比如想要抢沙发的话,可能会找没有回复的帖子)。
更多可能用到的包:如PIL,PyQt 等。 PIL用于处理验证码图片,比如二值化颂档。一说到验证码,问题就复杂了,可能想要人工输入验证野戚乱码的话会用到GUI的包比如Qt,还有可能比较弱的验证码用PIL做简单的图像处理就能识别了,如何处理比较复杂的验证码可以单独开一个问题了,可能会涉及到人工智能方面的东西。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)