两种方法:
网络爬虫。使用urllib2和BeautifulSoup(或者正则表达式)去抓取网页数据,大部分的网站都要这么做。
淘宝开放平台SDK。申请一个sdk用户,然后调用API。支持python27以上版本。
爬虫淘宝数据 都要有sign验证,app端是 x-sign。
简单来说pc端的sign验证藏在js里面 用token+data+t+appkey 做md5 就可以获取,本文主要说的是 app端的,这里就不细说。
在app端有了x-sign基本上所有数据都可以爬取到。逆向xsign算法网上也不少帖子可以查找到, 有兴趣学习可以找逆向资料学习。
下面是成品,做法是先搞定xsign算法,处理成接口返回签名需要的字段
{
wua: “FKr2_DmXgvslIZkzhfKjBuiMWTAuRxH4JVyYwM1SgFCfGD4T28iKOhL830o7xTyxXi833x+gWBp8g5UWnxy8CoTRHG9NX5UwaFok8WYHM1ftRXGRr7z4FSWJWsAYnuN+5mJWcDuPV3eItUNl+u18ypOHG5eu/q3jEJ+IfCUOfb2qjS/+PNJzCRKeGhLvt7W5udQp/HdB7wld16IzdgbLat+2MEcYJ3+1E+W8Z7j6jo/N3nsxEpXmWcWhmRSoHxXEuZIkYUPjNaQtQakSLxpp2OajdaDSBUhOysbfD+RFv95KQsJOSbH7J6+m/8vBVsebH0VqgnhyJjPQIIisbQyLUpPhZL2zw+TXFHe54+tKzHlk4yXhesLElXTdFy0MbTeiDr3/17R8KVb9lUatf5ITpT2weFg==”,
x-mini-wua: “HHnB_6GmTtOeuwdkCMKyhCgL8CDkahxEQtQNxrcsSVJJ7yx77w9HVsWA4610tcKU+/Qzcs70PR6plS3AWwnQFyvRfDRbH+/7W/nZ7j2P4FItFgRAb0lzQZqA7DVHBdxA75x8Q”,
x-sgext: “JAG7pXI5ds78b0CE23FM7Q==”,
x-sign: “azYBCM002xAALfdUCwyFS/3t+5vyaodd/vWOaADDOHStGiPqD2lE+dFwxAqi0739gh+DwVWNiUAUVzNRp2SzGiVqJs33bfdd9233Xf”,
x-t: “1602081910”,
x-umt: “pH1Lf4NLOkJi0zV1WOSqB1QnScotB+He”
}
然后抓包要爬取的页面,看请求参数,把请求参数提交到做好的xsign接口返回签名。然后请求淘宝数据接口 获取数据。
接口地址:联系我
请求方式: GET
返回格式: JSON
请求示例:
接口备注: 查询1次,计1次调用
频率限制: 10次 / 1秒
请求参数
参数类型必选描述
accountstring是淘宝账号
返回数据说明
名称类型说明
usernamevarchar淘宝账号(旺旺名称)
regTimeint注册时间
taoAgeint淘龄(淘宝年龄,单位为天)
isSellerint0,是否为卖家(0,非卖家| 1,C店| 2,天猫)
utypeint实名认证情况(1未认证; 2支付宝实名认证)
sexstring性别(直接中文显示:男号/女号/保密)
bscoreint买家信誉值(对应数值可以计算出几心几钻几皇冠)
bok_pstring买家好评率(给别人的好评率)
sok_pstring卖家好评率
last_visitstring最后登录时间
vipstring淘宝号的会员等级
vip_levelint是否为超级会员(0=普通会员, 10=超级会员)
bLevelint买家等级
areastring所在地区
active_pointint活跃度点数
active_levelint活跃度等级
safeTypeint安全等级(0安全; 1一般; 2危险仅供参考)
weekOrderint周单量
monthOrderint月单量
sLevelint卖家等级
sscoreint卖家信誉值
bad_numint差评
fake_numint打假
escape_numint跑单
dpower_numint降权
liar_numint骗子
harass_numint骚扰
ps_numintP图
返回数据
{"code":0,"msg":"成功","micro_sec":723,"time":1547193185,"data": {"account_id":1,"account_platform":"taobao","account":"芭比博士","avatar":">
以上就是关于怎么使用python获取淘宝数据全部的内容,包括:怎么使用python获取淘宝数据、淘宝APP x-sign、淘宝旺旺信誉黑号照妖镜API接口等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)