想自动下载一些网页,写了个简单的爬虫,但是碰到了503问题。
代码是下面这个样子:
site = "" local_filename, headers = urllib.request.urlretrieve(site) html = open(local_filename, encoding=\'UTF-8\') soup = bs4.BeautifulSoup(html) names = soup.find_all(\'a\')
想自动下载一些网页,写了个简单的爬虫,但是碰到了503问题。
代码是下面这个样子:
site = "" local_filename, headers = urllib.request.urlretrieve(site) html = open(local_filename, encoding=\'UTF-8\') soup = bs4.BeautifulSoup(html) names = soup.find_all(\'a\')
内容版权声明:除非注明,否则皆为本站原创文章。