request+pandas采集京东数据存入excel

request+pandas采集京东数据存入excel,第1张

一、爬虫部分
# 爬虫部分是一个网友写的,我也没有仔细研究。大致看了一眼,难度不高,如果有需求
我可以出一套爬虫的教程,今天就直接惨杂点注释直接看代码吧。

# 模块导入
import requests,json

# 循环换页
for page in range(2):
	# 请求地址
    url = "https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100034710036&score=0&sortType=5&page={}&pageSize=10&isShadowSku=0&fold=1".format(page)
    # 发送请求
    resp=requests.get(url)
    # json解码
    ls=json.loads(resp.text[20:-2])["comments"]
    # 循环输出
    for coment in ls:
        print("颜色:{},名字:{},内存:{},评论:{}".format(coment["productColor"],coment["nickname"],coment["productSize"],coment["content"]))
二、Pandas存Excel

直接放完整代码

# 导入模块
import pandas
import requests,json

# 创建空字典
data = {
    "productColor":[],
    "nickname":[],
    "productSize":[],
    "content":[]
}

# 循环换页
for page in range(2):
	# 请求地址
    url = "https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100034710036&score=0&sortType=5&page={}&pageSize=10&isShadowSku=0&fold=1".format(page)
     # 发送请求
    resp=requests.get(url)
    # json解码
    ls=json.loads(resp.text[20:-2])["comments"]
    # 循环输出改为存入data字典
    for coment in ls:
        # print("颜色:{},名字:{},内存:{},评论:{}".format(coment["productColor"],coment["nickname"],coment["productSize"],coment["content"]))
        # 颜色
        data['productColor'].append(coment["productColor"])
        # 名字
        data['nickname'].append(coment["nickname"])
        # 内存
        data['productSize'].append(coment["productSize"])
        # 评论
        data['content'].append(coment["content"])
        
# print(data)

# 将数据转换为DF类型
df_response = pandas.DataFrame(data)

# 直接to_excel
df_response.to_excel('response.xlsx',index=False)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/715711.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-25
下一篇 2022-04-25

发表评论

登录后才能评论

评论列表(0条)

保存