Python爬虫的简单入门(一) (3)

结果如下(下面内容很长,不予展示,有兴趣的可以去百度首页查看源代码)

至此就可以爬取大部分的网页源代码了,下一次介绍如何从源代码里提取我们想要的信息 给出静态网页爬取的代码框架(只做参考) import requests url = \'http://www.baidu.com\' headers = { \'User-Agent\': \'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36\' } r = requests.get(url,headers=headers) if r.status_code == 200: r.encoding = r.apparent_encoding print(r.text) else: print("访问失败") 其他

关于requests库的其他方法和参数常用的有post()方法,data参数后期会慢慢介绍

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zgggys.html