nodejs爬虫初试---superagent和cheerio

日期：2021-06-26 栏目：程序人生浏览：次

　　早就听过爬虫，这几天开始学习nodejs，写了个爬虫 demo ，爬取博客园首页的文章标题、用户名、阅读数、推荐数和用户头像，现做个小总结。

　　使用到这几个点：

　　1、node的核心模块-- 文件系统

　　2、用于http请求的第三方模块 -- superagent

　　3、用于解析DOM的第三方模块 -- cheerio

　　几个模块详细的讲解及API请到各个链接查阅，demo中只有简单的用法。

准备工作

　　使用npm管理依赖，依赖信息会存放在package.json中

//安装用到的第三方模块 cnpm install --save superagent cheerio