Lucene入门程序 准备环境
JDK: 1.8.0_162
IDE: Eclipse Neon.3
数据库: MySQL 5.7.20
Lucene: 4.10.4(已经很稳定了,高版本对部分分词器支持不好)
准备数据 SET FOREIGN_KEY_CHECKS=0; -------------------------------- Table structure for `book` -------------------------------- DROP TABLE IF EXISTS `book`; CREATE TABLE `book` ( `id` int(11) DEFAULT NULL, `bookname` varchar(500) DEFAULT NULL, `price` float DEFAULT NULL, `pic` varchar(200) DEFAULT NULL, `bookdesc` varchar(2000) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; -------------------------------- Records of book -------------------------------- INSERT INTO `book` VALUES ('1', 'java从入门到精通', '56', '1.jpg', '《Java从入门到精通》是人民邮电出版社于 2010年出版的图书, 由国家863中部软件孵化器主编. 以零基础讲解为宗旨, 深入浅出地讲解Java的各项技术及实战技能. 本书从初学者角度出发, 通过通俗易懂的语言、丰富多彩的实例, 详细介绍了使用Java语言进行程序开发应该掌握的各方面技术. 全书共分28章, 包括: 初识Java, 熟悉Eclipse开发工具, Java 语言基础, 流程控制, 字符串, 数组, 类和对象, 包装类, 数字处理类, 接口、继承与多态, 类的高级特性, 异常处理, Swing程序设计, 集合类, I/O输入输出, 反射, 枚举类型与泛型, 多线程, 网络通信, 数据库操作, Swing表格组件, Swing树组件, Swing其他高级组件, 高级布局管理器, 高级事件处理, AWT绘图与音频播放, 打印技术和企业进销存管理系统等. 所有知识都结合具体实例进行介绍, 涉及的程序代码给出了详细的注释, 可以使读者轻松领会Java程序开发的精髓, 快速提高开发技能. '); INSERT INTO `book` VALUES ('2', 'java web开发', '80', '2.jpg', 'Java Web, 是用Java技术来解决相关web互联网领域的技术总和. web包括: web服务器和web客户端两部分. Java在客户端的应用有java applet, 不过使用得很少, Java在服务器端的应用非常的丰富, 比如Servlet, JSP和第三方框架等等. Java技术对Web领域的发展注入了强大的动力. '); INSERT INTO `book` VALUES ('3', 'lucene从入门到精通', '100', '3.jpg', '本书总结搜索引擎相关理论与实际解决方案, 并给出了 Java 实现, 其中利用了流行的开源项目Lucene和Solr, 而且还包括原创的实现. 本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析. 爬虫部分介绍了网页遍历方法和如何实现增量抓取, 并介绍了从网页等各种格式的文档中提取主要内容的方法. 自然语言处理部分从统计机器学习的原理出发, 包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节, 同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍并总结了实现方法. 在全文检索部分, 结合Lucene 3.0介绍了搜索引擎的原理与进展. 用简单的例子介绍了Lucene的最新应用方法. 本书包括完整的搜索实现过程: 从完成索引到搜索用户界面的实现. 本书还进一步介绍了实现准实时搜索的方法, 展示了Solr 1.4版本的用法以及实现分布式搜索服务集群的方法. 最后介绍了在地理信息系统领域和户外活动搜索领域的应用. '); INSERT INTO `book` VALUES ('4', 'lucene in action', '90', '4.jpg', '本书深入浅出地介绍了lucene——一个开源的使用java语言编写的全文搜索引擎开发包. 它通过浅显的语言、大量的图注、丰富的代码示例, 以及清晰的结构为读者呈现出作为优秀开源项目的lucene所体现的强大功能. 全书共10章, 分为两大部分. 第1部分lucene的核心, 着重于lucene的核心 api介绍, 并按照把lucene集成到程序中的顺序宋组织;第2部分lucene的应用, 通过对lucene内置工具的介绍, 展示了lucene技术的高级应用和在各种程序语言上的移植. '); INSERT INTO `book` VALUES ('5', 'Lucene Java精华版', '80', '5.jpg', '本书总结搜索引擎相关理论与实际解决方案, 并给出了 Java 实现, 其中利用了流行的开源项目Lucene和Solr, 而且还包括原创的实现. 本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析. 爬虫部分介绍了网页遍历方法和如何实现增量抓取, 并介绍了从网页等各种格式的文档中提取主要内容的方法. 自然语言处理部分从统计机器学习的原理出发, 包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节, 同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍并总结了实现方法. 在全文检索部分, 结合Lucene 3.0介绍了搜索引擎的原理与进展. 用简单的例子介绍了Lucene的最新应用方法. 本书包括完整的搜索实现过程: 从完成索引到搜索用户界面的实现. 本书还进一步介绍了实现准实时搜索的方法, 展示了Solr 1.4版本的用法以及实现分布式搜索服务集群的方法. 最后介绍了在地理信息系统领域和户外活动搜索领域的应用. '); 创建工程 创建Maven Project(打包方式选jar即可)