使用htmlparser爬虫技术爬取电影网页的全部下载链接 (2)

日期：2022-04-13 栏目：程序人生浏览：次

/** * 获取一个页面的下载链接 */ public static String getMoiveDownloadUrl(String moiveIntroUrl) { // 页面下载连接保存在这里 String moiveDownLoadUrl = ""; try { // 首先根据页面URL建立一个Parser. Parser parser = new Parser(moiveIntroUrl); // 使用parser中extractAllNodesThatMatch方法，这个有许多的过滤器，可以帮助我们过滤出我们想要的内容,具体可以看api的介绍 // 这里我们使用链接文本过滤器，可以过滤出链接里面含ftp的内容，这样就可以取出我们想要的链接 NodeList nodelist = parser.extractAllNodesThatMatch(new LinkStringFilter("ftp")); for (int i = 0; i < nodelist.size(); i++) { LinkTag tag = (LinkTag) nodelist.elementAt(i); moiveDownLoadUrl = tag.getLink(); } } catch (ParserException e) { e.printStackTrace(); } return moiveDownLoadUrl; }

转载注明出处：https://www.heiqu.com/zzgsfs.html

使用htmlparser爬虫技术爬取电影网页的全部下载链接 (2)

相关推荐