在使用爬虫爬取网页时,爬取的内容里如果存在’‘或者"“,直接保存数据到数据库就会报错:
pymysql.err.ProgrammingError: (1064, 'You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '专精特新"中小企业贷款风险补偿实施细则〉的通知》的通知”’ at line 1’)
可以使用pymysql中专门的转义方法转义后再进行保存,导入语法如下:
# v1.0.0及以上
from pymysql.converters import escape_string
# v0.10.1及以下
from pymysql import escape_string
转义代码示例如下:
#data为含有单引号或者双引号的字符串
string = escape_string(string)
以下为我解决问题后的部分代码
cur_obj.execute(
'insert into tongzhigonggao(created_at,title,content) values (("%s"),("%s"),("%s"))' % (
(datetime.datetime.strftime(datetime.datetime.now(), '%Y-%m-%d %H:%M:%S')),escape_string(title_),content_.text))
# 提交 *** 作
mysql_obj.commit()
title_和content_为我自定义的变量,title_的值为re正则解析,content_的值为bs4解析,所以content_的值存到数据库中是content_.text。
使用escape_string(title_)转义title_后,带有’'或者""的标题就可以正常保存到数据库中了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)