结果如下(下面内容很长,不予展示,有兴趣的可以去百度首页查看源代码)
至此就可以爬取大部分的网页源代码了,下一次介绍如何从源代码里提取我们想要的信息 给出静态网页爬取的代码框架(只做参考) import requests url = \'http://www.baidu.com\' headers = { \'User-Agent\': \'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36\' } r = requests.get(url,headers=headers) if r.status_code == 200: r.encoding = r.apparent_encoding print(r.text) else: print("访问失败") 其他关于requests库的其他方法和参数常用的有post()方法,data参数后期会慢慢介绍