CodeIgniter实现从网站抓取图片并自动下载到文件夹

因为某网站看图比较坑爹,要一页一页的翻页。。。。所以。。。。就写了这么个东西

(我是产品不是程序员)运行速度简直无法忍受,而且经常会有错误发生,所以希望大家帮忙改进(PHP)。

当然也欢迎看到PYTHON,GOLANG的版本~~^_^

1. controllers:

$this->load->helper('date'); $this->load->helper('phpQuery'); //我是把phpQuery单文件放到helper里了

2. view:

这里只是为了快速出产品,所以直接在VIEW里写的代码,请无视变量名。。。

<?php $imageslist = phpQuery::newDocumentFile('http://g.e-hentai.org/g/xxxxx/xxxxxxx/'); //首页 $pn = 1;//页数 $ps = $imageslist->find('.ptt td a');//从首页抓页面导航 //从页面导航开始获取页面内容 foreach($ps as $p) { echo '第'.$pn++.'页:<a href="'.pq($p)->attr("href").'"/></br>'; $imagesnow = phpQuery::newDocumentFile(pq($p)->attr("href")); //单页内容 $images = $imagesnow->find('#gdt a');//抓取图片页列表 foreach($images as $image) { echo '<a href="'.pq($image,$imagesnow)->attr("href").'"/></br>'; $imagebigs = phpQuery::newDocumentFile(pq($image,$imagesnow)->attr("href")); //获取单图片页地址 echo '<img src="'https://www.jb51.net/article/.$imagebigs->find('#i3 img')->attr('src').'"></br>';//输出图片 ob_start(); readfile($imagebigs->find('#i3 img')->attr('src')); $img = ob_get_contents(); ob_end_clean(); $filename='img/'.now().'.jpg'; $f=fopen($filename,'a'); fwrite($f,$img); fclose($f); } } ?>

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.heiqu.com/395abd0f7aec441e1b31f08fbc3fd7fd.html