利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

一到开学季,校园里面又开始散发着爱情的酸腐,与其一个人在寝室默默地哭泣,不如上网看看比外面更漂亮的妹子!

嗯,想到这,我忍不住打开了,捏着手中的精灵球,好,今天的少女图鉴就从煎蛋网开始吧!!!冲鸭

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

打开网页,目标定格在了最后一页

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

先用f12看一下

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

发现了,上吧小虫虫,就决定是你了,使用抓取源码!

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

命中了,煎蛋网交出了源代码

好,那就一鼓作气,小虫虫,解析它!

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

很狡猾的网站,我们get到的是[40],所以最后要加一个切片,即取第二个到倒数第二个的那个数字就可以了

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

现在封死你的退路,把所有的url都封装到一个列表中,我们把初始的网址设为base_url

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

哼看你这下子往哪里跑,现在让我看看妹子们都躲到哪里去了嘎嘎嘎

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

试试新学的css选择器,右键copy一下

 

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

 

 

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

只得到了第一张妹子的图片信息,再加把劲,去掉一点限制条件

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

利用小虫虫做一枚合格宅男,果然牡丹花下做鬼也风流

都跑出来惹,可是怎么都一个样?原来这些都是被js封装了

网页设置了 Anti creeper机制,我们并不能顺利地爬取网页上的内容,可以使用selenium对数据进行爬取

from selenium import webdriver import requests from bs4 import BeautifulSoup path="C:/Users/12958/Desktop/douban/" # 保存图片的路径 urls = ["{}#comments".format(str(i))for i in range(38, 40)] # 需要爬取的url的地址,这里是爬了38 39两页 driver = webdriver.Chrome() img_url=[]

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zywjpg.html