用爬虫从网站爬下的数据怎么存储？_sql

显然不能直接储存，你还得解析出自己需要的内容。

比如我爬取某新闻网今日的国内新闻，那么我创建一个实体类，里面有属性：新闻标题，新闻时间，正文等等。解析出你需要的内容，封到实体里面，然后在dao层直接save到数据库即可

如果你爬下的是整个网页，这个好办，把它当做文件一样，用流 *** 作保存到电脑上即可。当然保存网页会遇到编码问题，这个很棘手。

下载mysql.connector库

然后把爬虫爬到的数据通过mysql里面的insert语句查到数据库，当然也可以建表，一般我没用python建表是先建好再写数据的

import mysql.connector

conn = mysql.connector.connect(

user='root',

password='root',

host='127.0.0.1',

port='3306',

database='test_demo'

)

cursor = conn.cursor()

cursor.execute("INSERT INTO test_user(`uuid`,`user_name`,`user_level`) VALUES (%s,%s,%s)",[id, user_name, user_level])

cursor.execute("INSERT INTO tieba_user_detail(`user_name`,`user_exp`,`user_sex`,`tieba_age`,`tieba_note`,`user_favorites`,`user_fans`) VALUES (%s,%s,%s,%s,%s,%s,%s)",[user_name,user_exp,user_sex, tieba_age,tieba_note, user_favorites, user_fans])

print('************** %s %s 数据保存成功 **************'%(user_rank,user_name))

conn.commit()

cursor.close()

插进入就这样的

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6714101.html

用爬虫从网站爬下的数据怎么存储？

发表评论

评论列表（0条）