要评论当然要能够先进行登陆,采用 requests 库进行处理,尝试能否看到自己的消息列表:
msg_url ="http://msg.csdn.net/"r = requests.get(msg_url,auth=(‘drfish‘,‘password‘))
结果跳转到登陆界面,好的那看一下登陆界面是怎么登陆的,找到表单:
发现还有一些隐藏的参数,如lt、excution等,好心的程序猿还写明了不能为什么不能直接认证的原因:缺少流水号,那就多访问一次来获取流水号好了,用 BeautifulSoup 来分析页面内容抓取流水号,同时因为要跨不同的域来进行 *** 作,所以引入session:
在学习过程中有什么不懂得可以加我的python学习交流扣扣qun,784758214群里有不错的学习视频教程、开发工具与电子书籍。与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容msg_url = "http://msg.csdn.net/"login_url = "https://passport.csdn.net/"headers = { ‘User-Agent‘: ‘Mozilla/5.0 (windows; U; windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 firefox/3.5.6‘}session = requests.session()session.headers.update(headers)r = session.get(login_url)page = BeautifulSoup(r.text,"lxml")authentication = { "username": "drfish","password": "password","lt": page.select("[name=lt]")[0]["value"],"execution": page.select("[name=execution]")[0]["value"],"_eventID": "submit",}r = session.post(login_url,authentication)r2 = session.get(msg_url)print(r2.text)
好了,现在能够得到我的消息信息了,说明已经成功解决登陆问题,那么自动化水军评论应该就近在眼前了。
自动评论这次学乖了,随便找了篇文章直接查看评论框form:
在上面登陆代码的基础上进行评论的提交:
blog_url = "http://blog.csdn.net/u013291394/comment/submit?ID=50444369"comment = { "comment_content": "水军评论测试","comment_usrID":"531203"}r2 = session.post(blog_url,comment)print(r2.text)
结果返回了 {"result":0,"content":"评论内容没有填写!","callback":null,"data":null}
这样的结果。有点意思,应该是在Js中对参数进行了处理。那就把Js拉出来看看,网页里搜了一下Js文件,有个 comment.js ,就是它了。在上面的form中可以看到提交时调用了subform方法,查看方法如下:
function subform(e) { if (c_doing) return false; var content = $.trim($(editorID).val()); if (content == "") { commentTip("评论内容没有填写!"); return false; } else if (content.length > 1000) { commentTip("评论内容太长了,不能超过1000个字符!"); return false; } var commentID = $("#commentID").val(); commentTip("正在发表评论..."); var beginTime = new Date(); $(editorID).attr("Disabled",true); $("button[type=submit]",e).attr("Disabled",true); c_doing = true; $.AJAX({ type: "POST",url: $(e).attr("action"),data: { "commentID": commentID,"content": content,"replyID": $("#comment_replyID").val(),"boleattohome": $("#boleattohome").val() },success: function (data) { c_doing = false; commentTip(data.content); if (data.result) { var rcommentID=$("#comment_replyID").val() $(editorID).val(‘‘); $("#comment_replyID,#comment_verifycode").val(‘‘); commentscount++; loadList(1,true); $(editorID).attr("Disabled",false); $("button[type=submit]",false); commentTip("发表成功!评论耗时:" + (new Date() - beginTime) + "毫秒") if (rcommentID!=undefined && rcommentID != "") { $("HTML,body").animate({ scrolltop: $("#comment_item_" + rcommentID).offset().top },1000); } } } }); return false;}
可以清楚的看到最后POST提交的数据 data
改变了参数的名字,还有几个其他的参数通过看Js文件可以看到不是空的就是定死的,就不用管他了。同时发现上的 "comment_usrID"
也是给死的?那就只要comment一个变量就搞定了。
blog_url = "http://blog.csdn.net/u013291394/comment/submit?ID=50444369"comment = { "content": "水军评论测试",}r2 = session.post(blog_url,comment)print(r2.text)
看一下效果:
自动化当然上面最终的参数传递也可以自己手动评论并用抓包软件抓取,不过通过查看 commetn.Js
文件也给我的自动化评论提供了方向,其中有一个 load_comment_form()
方法,是用来加载comment-form的,它给出了action的定义:
action="/‘ + username + ‘/comment/submit?ID=‘ + filename + ‘"
写的很明白了,我只要抓取到页面的作者名和文章的编号就可以尽情的水评论了,随便选个抓取文章的入口,如最新博客入口 http://blog.csdn.net/?ref=toolbar_logo ,用BeautifulSoup抓取url并解析取到其中的username和filename来构成action并提价评论。
运行脚本试一下效果:
如果你依然在编程的世界里迷茫,可以加入我们的Python学习扣qun:784758214,看看前辈们是如何学习的。交流经验。从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节,点击加入我们的 python学习者聚集地
写在最后写这篇文章只是为了证明一下自己的想法,不是用来也不希望有人用来恶意刷评论。
总结以上是内存溢出为你收集整理的十分钟教程,用Python实现自动化水军评论全部内容,希望文章能够帮你解决十分钟教程,用Python实现自动化水军评论所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)