/** * 获取一个页面的下载链接 */ public static String getMoiveDownloadUrl(String moiveIntroUrl) { // 页面下载连接保存在这里 String moiveDownLoadUrl = ""; try { // 首先根据页面URL建立一个Parser. Parser parser = new Parser(moiveIntroUrl); // 使用parser中extractAllNodesThatMatch方法,这个有许多的过滤器,可以帮助我们过滤出我们想要的内容,具体可以看api的介绍 // 这里我们使用链接文本过滤器,可以过滤出链接里面含ftp的内容,这样就可以取出我们想要的链接 NodeList nodelist = parser.extractAllNodesThatMatch(new LinkStringFilter("ftp")); for (int i = 0; i < nodelist.size(); i++) { LinkTag tag = (LinkTag) nodelist.elementAt(i); moiveDownLoadUrl = tag.getLink(); } } catch (ParserException e) { e.printStackTrace(); } return moiveDownLoadUrl; }
使用htmlparser爬虫技术爬取电影网页的全部下载链接 (2)
内容版权声明:除非注明,否则皆为本站原创文章。