08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS

日期：2022-06-30 栏目：程序人生浏览：次

谷歌无头浏览器

知识点回顾

验证码处理流程

今日详情

动态数据加载处理

一.图片懒加载

什么是图片懒加载？

案例分析：抓取站长素材中的图片数据

#!/usr/bin/env python # -*- coding:utf-8 -*- import requests from lxml import etree if __name__ == "__main__": url = '' headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36', } #获取页面文本数据 response = requests.get(url=url,headers=headers) response.encoding = 'utf-8' page_text = response.text #解析页面数据（获取页面中的图片链接） #创建etree对象 tree = etree.HTML(page_text) div_list = tree.xpath('//div[@>) #解析获取图片地址和图片的名称 for div in div_list: image_url = div.xpath('.//img/@src') image_name = div.xpath('.//img/@alt') print(image_url) #打印图片链接 print(image_name)#打印图片名称

转载注明出处：https://www.heiqu.com/zzsxpp.html

08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS

相关推荐