Apache Pig如何与Apache Lucene集成(2)

日期：2020-06-25 栏目：程序人生浏览：次

至此，我们已成功将索引存储在HDFS上，别高兴太宰，这仅仅是一个开始而已，在这里大家可能有疑问，存储在HDFS上的索引是否能够直接查询或访问呢？答案是肯定的，但不推荐大家直接读取HDFS上索引，即使了有了Hadoop的块缓存（Block Cache）提速，性能仍然是比较低的，除非你的集群机器不缺内存，否则，散仙还是建议大家直接把索引拷贝到本地磁盘再检索，这样做暂时比较麻烦，散仙在后面的文章里会介绍怎么把pig生成的结果集，直接以Http的方式存储到Solr或ElasticSearch里，这样以来就非常方便快捷了。

--------------------------------------分割线 --------------------------------------

基于Lucene多索引进行索引和搜索 ww w.linuxidc.com/Linux/2012-05/59757.htm

Lucene 实战(第2版) 中文版配套源代码

Lucene 实战(第2版) PDF高清中文版

使用Lucene-Spatial实现集成地理位置的全文检索

Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a9

Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a8

Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a7

Project 2-1: 配置Lucene, 建立WEB查询系统[Ubuntu 10.10]

--------------------------------------分割线 --------------------------------------

Lucene 的详细介绍：请点这里
Lucene 的下载地址：请点这里

转载注明出处：https://www.heiqu.com/eddf6d668e314bec42cbab3a663e7d51.html

Apache Pig如何与Apache Lucene集成(2)

相关推荐