Python数据分析与挖掘

日期：2022-11-14 栏目：程序人生浏览：次

　　网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。

　　运用python3.6中的urllib.request

1.快速爬取一个网页　

（1）get请求方式　

Python数据分析与挖掘

#!/usr/bin/env python # -*- coding: UTF-8 -*- # Author:Du Fei import urllib.request # keywd = "python" keywd ="百度" #解决中文编码问题 keywd=urllib.request.quote(keywd) url = "?wd=" +keywd req =urllib.request.Request(url) #urlopen将网页存到内存 data =urllib.request.urlopen(req).read() fh=open("F:/python/data/douban/2.html","wb") fh.write(data) fh.close()

转载注明出处：https://www.heiqu.com/zgxygz.html

Python数据分析与挖掘

相关推荐