Elasticsearch教程进阶高级特性详解

说实话，Elasticsearch 的进阶之路，您可能走偏了

做技术的朋友应该都有这种感受：入门 Elasticsearch 不难，装个环境、建个索引、写几个查询，感觉挺顺的。但真到了生产环境，数据量一上来，查询一复杂，问题就全冒出来了。您是不是也遇到过这种情况？明明索引建好了，搜索却慢得像蜗牛；明明数据量不大，内存却蹭蹭往上涨；明明想做个聚合分析，结果集群直接挂了。

坦白讲，这些坑我都踩过。今天我们就聊聊 Elasticsearch 的进阶高级特性，不是讲那些花里胡哨的概念，而是实实在在能帮您解决问题的技巧。就拿我们团队去年服务的一个电商客户来说，他们用 MySQL 做商品搜索，数据量到了 500 万条，查询响应时间直接飙到 3 秒以上。后来我们帮他们切换到了 Elasticsearch，配合一些高级特性，搜索速度直接提升到 50 毫秒以内。您说这差距大不大？

第一招：用好分片和副本，别让资源白白浪费

很多人一上来就创建索引，默认 5 个分片、1 个副本，觉得够用了。但说实话，这就像买鞋子不问尺码，穿着合不合适全靠运气。分片数量设置不合理，要么导致资源浪费，要么造成查询性能下降。

举个例子，我们有个做日志分析的客户，每天产生 10GB 的日志数据。他们开始设了 5 个分片，结果查询时只有一个分片在忙，其他四个闲着。后来我们把分片数调整到 20 个，查询速度提升了 60%。为什么？因为分片多了，数据分布更均匀，并行查询的效率自然就上去了。

那分片数到底怎么定？我的经验是：每个分片的数据量控制在 20-50GB 比较合适。比如您每天新增 10GB 数据，保留 30 天，总数据量 300GB，那分片数可以设 6-15 个。副本数呢？一般设 1 个就够，除非您对数据安全性要求特别高。记住，副本越多，写入性能越差，因为每个副本都要同步数据。

第二招：学会用 Routing，让查询快如闪电

您有没有发现，有时候明明只查一个用户的数据，Elasticsearch 却把所有的分片都扫了一遍？这就是没有用 Routing 的问题。Routing 就像给数据贴了个标签，告诉 Elasticsearch "这个用户的数据只存在某几个分片上"，查询时就能精准定位。

我们有个做会员系统的客户，每天要处理上千万次的会员查询。刚开始没用 Routing，每次查询都要扫描所有分片，平均响应时间 200 毫秒。后来我们在写入数据时，把会员 ID 作为 Routing 值，查询时也带上这个参数，响应时间直接降到 20 毫秒以内。您看，一个小小的改动，效果就是这么明显。

怎么用呢？很简单，在创建索引时指定 routing 参数，或者在查询时加个 routing 关键字。比如在 JavaScript ES6 语法里，我们可以这样写：

创建索引时：PUT /my_index?routing=user_id
查询时：GET /my_index/_search?routing=user_id

其实这个思路和 MongoDB 里的分片键设计很像，都是通过合理规划数据分布来提升性能。如果您用过 MongoDB 的分片集群，应该能很快理解。

第三招：巧用聚合分析，告别 MySQL 的慢查询

说到数据分析，很多朋友第一反应还是 MySQL 的 GROUP BY。但说实话，当数据量超过百万级别，MySQL 的聚合查询就变得特别慢。我们有个做电商报表的客户，每天需要统计各个品类的销售额，用 MySQL 跑一次要 5 分钟，领导等得都快睡着了。

后来我们用 Elasticsearch 的聚合功能，配合时间序列索引，跑同样的报表只需要 2 秒。您没看错，从 5 分钟到 2 秒，提升了 150 倍！具体怎么做的？我们用 Elasticsearch 的 date_histogram 聚合按天分组，再用 terms 聚合按品类分组，最后用 sum 聚合计算销售额。整个过程就像搭积木一样简单。

这里有个小技巧：如果您的数据量特别大，比如上亿条，可以先用 filters 聚合过滤掉不必要的数据，再执行后续的聚合操作。这就像 MySQL 里的 WHERE 子句，先把数据范围缩小，后面的计算自然就快了。

第四招：用 Alias 和 Reindex 实现无缝升级

做技术的都怕一件事：数据迁移。特别是生产环境，动不动就要停服升级，用户骂声一片。但 Elasticsearch 的 Alias 和 Reindex 功能，能帮您完美解决这个问题。

举个例子，我们有个做金融风控的客户，他们每天要处理 500 万条交易数据。原来的索引设计不合理，查询越来越慢，想重建索引又怕影响业务。后来我们用 Alias 给索引起了个别名，业务查询都指向这个别名。然后创建新的索引，用 Reindex 把旧数据迁移过去。整个过程业务完全无感知，用户该查查，该写写。

这个思路其实和 JavaScript ES6 语法里的解构赋值有点像，都是通过一层抽象来隔离变化。您想想，如果直接操作索引，改个字段类型就得重建整个索引，多麻烦。但有了 Alias，您随时可以创建一个新索引，把旧数据迁过去，然后更新 Alias 指向，一切就搞定了。