試著了解 Apache Solr
这是2016年Solr圣诞日历的第11天。
首先
我在9月份读了改版的 Apache Solr 入门,并且开始使用 Solr。
在这篇文章中,我将写下我对于使用 Solr 大约两个月的真实感想。
我的初步了解
我对形式语言和自然语言处理有一定了解,因此对搜索引擎中重要的成分之一——”形态素解析”——也有所了解。
对于处理搜索引擎来说,这是重要的知识,但最好是在阅读后续的入门书籍之后再获取这些知识。
关于自然语言处理的基础知识,这本书非常好。
虽然它是一本大学教科书,但它举例丰富,并且这本书内容简洁,因此值得推荐。
只需阅读到词法分析的章节就足够了。
更新的 Apache Solr 入门指南
我被告知:“用日语仔细讲解的Solr书大概就是这本。”它从“搜索引擎是什么”开始,包括处理文档、搜索方法、…、聚类、优化等等,基本要点都被涵盖了。
只需按照入门书上的指示进行操作,即可从启动Solr到进行搜索,要到达这一步,先阅读前四章即可。
随后
仅仅通过之前展示的内容,就能够进行简单的搜索。
如果只是针对日语搜索,只需阅读上述的书籍就可以解决。
作为Solr除了全文搜索外的特点,可以提到空间搜索表现出色。与MySQL的范围搜索不同,Solr考虑了地球是椭球体的逻辑,因此在进行灵活搜索时,绝对比数据的完全匹配搜索更好的选择是使用Solr或其他搜索引擎。
最终
因为我才刚开始学习搜索引擎,所以无法写出太了不起的东西。根据今年Solr Advent Calendar上其他人的投稿,我发现大部分内容都偏向研发和工匠风格,所以我将继续修行。
我想要尝试处理Solr 6的多维数据结构…