python爬虫报错:不信任证书问题的解决

SSLError 请求异常,SSL错误,证书认证失败问题解决

在爬取某些网站时,会发现如下报错:

#请求脚本
from lxml import etree
import os
import requests


headers = {
        "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36",
        }

url = 'https://www.ygdy8.net/index.html'

response = requests.get(url,  headers=headers)
content = response.content.decode('gbk')
#报错信息
SSLError: ("bad handshake: Error([('SSL routines', 'ssl3_get_server_certificate', 'certificate verify failed')],)",)

 

 

解决方式:

第一种解决方式:

将https请求改为http请求,或许可能成功解决

from lxml import etree
import os
import requests


headers = {
        "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36",
        }

url = 'http://www.ygdy8.net/index.html'

response = requests.get(url,  headers=headers)
content = response.content.decode('gbk')

有的电脑上第一次执行有效,再次执行还报错。

第二种解决方式:

增加参数:verify=False 可成功解决

from lxml import etree
import os
import requests


headers = {
        "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36",
        }

url = 'https://www.ygdy8.net/index.html'

response = requests.get(url,verify=False, headers=headers)
content = response.content.decode('gbk')

 可成功得到content内容,但是结果中出现了一些warning信息,看着很不爽。继续尝试解决。

解决warning信息:

方法一:

调用关闭警告信息的方法:

#实际含义就是在requests下的urllib3不显示警告信息
requests.packages.urllib3.disable_warnings()

方法二:

直接调用urllib3的disable_warnings(),代码如下:

import urllib3
urllib3.disable_warnings()

方法三:

调用logging的captureWarnings()方法,传入True,关闭提示,代码如下:

import logging
logging.captureWarnings(True)

以上三种方式目的只是为了不显示warning信息而已,而warning信息不会对爬虫产生任何影响。