需要安装tesseract工具,和pytesseract的python包,pytesseract是google的tesseract的一个python版本的接口库。
把网页中的验证码图片爬取下来之后,稍微修改一下对比度增加识别的准确率,然后用pytesseract直接识别。
import requests from lxml import etree from PIL import Image from io import BytesIO import pytesseract url = "https://xxxx/login.html" res = requests.get(url).content.decode("utf-8")
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)