Python爬虫的简单入门(一) (3)

日期：2022-09-12 栏目：程序人生浏览：次

结果如下(下面内容很长,不予展示,有兴趣的可以去百度首页查看源代码)

至此就可以爬取大部分的网页源代码了,下一次介绍如何从源代码里提取我们想要的信息给出静态网页爬取的代码框架(只做参考) import requests url = \'http://www.baidu.com\' headers = { \'User-Agent\': \'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36\' } r = requests.get(url,headers=headers) if r.status_code == 200: r.encoding = r.apparent_encoding print(r.text) else: print("访问失败") 其他

关于requests库的其他方法和参数常用的有post()方法,data参数后期会慢慢介绍

共3页:
上一页
1
2
3
下一页

转载注明出处：https://www.heiqu.com/zgggys.html

Python爬虫的简单入门(一) (3)

相关推荐