前段时间做关于文本分类方面的研究,下载了开源的LUCENE代码,进行了一些初步的研究。要想利用开源代码做一些程序,环境的配置要点有点多,但都不麻烦,现在总结一下,有一下几点。
基于jdk1.6的环境在eclipse集成开发环境,完成环境的配置。
1. jdk环境:
下载安装JDK1.6,环境变量配置如下:
用户变量中添加如下变量和属性值:
Classpath ------c:\Program Files\Java\jdk1.6.0_02\lib\tools.jar; c:\Program Files\Java\jdk1.6.0_02\lib\dt.jar;
java_home------ c:\Program Files\Java\jdk1.6.0_02
Path------ c:\Program Files\Java\jdk1.6.0_02\bin; c:\Program Files\Java\jdk1.6.0_02;
系统变量中添加如下变量和属性值:
PATH----- c:\Program Files\Java\jdk1.6.0_02\bin; c:\Program Files\Java\jdk1.6.0_02;
CLASSPATH--------.;c:\Program Files\Java\jdk1.6.0_02\lib\tools.jar; c:\Program Files\Java\jdk1.6.0_02\lib\dt.jar;
JAVA_HOME------- c:\Program Files\Java\jdk1.6.0_02
TOMCAT_HOME--------c:\Program Files\Apache Software Foundation\Tomcat 5.0
CATALINA_HOME------ c:\Program Files\Apache Software Foundation\Tomcat 5.0
2.TOMCAT5.0环境配置
根据以上JDK的配置,此时,只需要将jdk安装目录下lib子目录的tools.jar和dt.jar复制到Tomat的common\li目录下,安装完后,启动“Apache Tomcat”服务,然后输入“:8080”测试。若能看到Tomcat的欢迎界面,表示安装成功。
3. lucene部署配置
Lucene是纯java程序,运行需要Java环境的支持。基于lucene-2.3.0版本的配置如下:
在环境变量中的系统环境变量一栏,在CLASSPATH的原有文字后面加上:
“D:\workshop\lucene2.3.0\lucene-2.3.0\lucene-core-2.3.0.jar;D:\workshop\lucene2.3.0\lucene-2.3.0\lucene-demos-2.3.0.jar”
其实这是在添加lucene的相关java包位置。此路径是lucene的jar包存在的路径
此处,在命令提示符中输入“echo %CLASSPATH%”可以查看环境变量是否正确添加。环境变量配置好以后,开始部署lucene中的开发工具。
将lucene中的src目录下的jsp目录复制到Tamcat的webapps\ROOT目录,改名为Luceneweb.复制lucene-demos-2.3.0.jar和lucene-core-2.3.0.jar文件到Luceneweb\WEB-INF\lib目录。(也可以直接把luceneweb.war复制到tomcat的webapps目录)。
在luceneweb下创建文件夹docs,并在docs的文件夹中放入文本文件或HTML文件。
至此,所有的环境都已经配备完毕,现在可以利用开源的lucene进行java开发了。
还不过瘾,看看分割线中关于Lucene的更多相关内容:
--------------------------------------分割线 --------------------------------------
基于Lucene多索引进行索引和搜索 www.linuxidc.com/Linux/2012-05/59757.htm
Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a9
Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a8
Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a7
Project 2-1: 配置Lucene, 建立WEB查询系统[Ubuntu 10.10]
--------------------------------------分割线 --------------------------------------