python爬虫爬取百度指数_随笔

python爬虫爬取百度指数 1.环境：python版本+pyCharm

python3.7安装教程_PtaQ的博客-CSDN博客_python3.7

2.获取百度指数的cookie

1.先登录百度账号

2.在此页面点击键盘F12

3.点击NetWork、XHR

4.百度指数搜索“网贷”

5.复制cookie

点击右侧字符右键出现copy value复制

3.代码

# coding=gbk
# -*- coding:uft-8 -*-
# 百度指数

import requests
import urllib.parse
import execjs
import time


def collect(city, area):
    # name 想要搜索的关键字
    name = '网贷'
    wordType = 1
    # startDate 开始时间
    startDate = '2020-01-01'
    # endDate 结束时间
    endDate = '2022-01-09'
    baseUrl = 'https://index.baidu.com/api/SearchApi/index'
    addUrl = f'?area={area}&word=[[%7B%22name%22:%22{urllib.parse.quote(name)}%22,%22wordType%22:{wordType}%7D]]&startDate={startDate}&endDate={endDate}'
    headers = {
        'Referer': 'https://index.baidu.com/v2/main/index.html',
        'cookie': '',

        'User-Agent': 'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/91.0.4472.106Safari/537.36'
    }
    res = requests.get(url=baseUrl + addUrl, headers=headers).json()
    allData = res['data']['userIndexes'][0]['all']['data']
    uniqid = res['data']['uniqid']
    print(f'alldata: {allData}')
    print(f'uniqid: {uniqid}')
    url = 'https://index.baidu.com/Interface/ptbk?uniqid=' + uniqid
    res = requests.get(url=url, headers=headers).json()
    data = res['data']
    print(f'data: {data}')
    ctx = execjs.compile('var decrypt=function(t,e){if(t){for(var n=t.split(""),i=e.split(""),a={},r=[],o=0;o # startDate 开始时间
     startDate = '2020-01-01'
  # endDate 结束时间
     endDate = '2022-01-09' 
 # span想要的时间间隔 换算成秒数(如7天=604800秒)
     span = 604800 
 
 把复制的cookie粘贴到下图位置 
 
 要复制到 '  ' (单引号内) 
4.库安装 
 
 如果哪个库底下出现了波浪线，说明没有这个库，需要安装，以execjs为例 
进入设置settings 
 
 点击右上角的加号 
 
 搜索出来execjs，左下角安装 install package 
 
 环境就安装完成了，前期准备工作结束了。 
5.关于运行程序与结果 
设置运行的程序文件 
 
  
 再点击绿色三角运行 
 
 正常运行 
 
在同目录下就会出现一个以 “网贷”为名的txt文件 
 
 					
										


					
						欢迎分享，转载请注明来源：内存溢出
原文地址: https://outofmemory.cn/zaji/5710457.html

python爬虫爬取百度指数

发表评论

评论列表（0条）