SpringBoot操作ES进行各种高级查询（值得收藏）

简介

Elasticsearch（简称ES）是一个开源的分布式搜索和分析引擎，广泛应用于海量数据的检索、日志分析等领域。SpringBoot是一个简化了Spring应用开发的框架，可以帮助我们快速构建和部署应用程序。

本文将介绍如何在SpringBoot中操作Elasticsearch进行各种高级查询，包括全文搜索、过滤器、聚合等功能，以及如何优化查询性能和处理结果。

环境准备

在开始之前，需要确保已经安装了Java和Elasticsearch，并配置好了SpringBoot项目的相关依赖。具体安装和配置步骤可以参考官方文档。

全文搜索

Elasticsearch是一个强大的全文搜索引擎，可以根据关键词进行搜索并返回相关的文档。在SpringBoot中，我们可以使用Elasticsearch的QueryBuilder进行查询。

首先，需要创建一个Elasticsearch的客户端连接：

@Configuration
public class ElasticsearchConfig {

    @Bean
    public RestHighLevelClient restHighLevelClient() {
        RestClientBuilder builder = RestClient.builder(new HttpHost("localhost", 9200, "http"));
        return new RestHighLevelClient(builder);
    }
}

然后，可以在SpringBoot中定义一个服务类来执行搜索操作：

@Service
public class ElasticsearchService {

    private final RestHighLevelClient client;

    public ElasticsearchService(RestHighLevelClient client) {
        this.client = client;
    }

    public List<Document> search(String index, String field, String keyword) {
        SearchRequest request = new SearchRequest(index);
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        QueryBuilder queryBuilder = QueryBuilders.matchQuery(field, keyword);
        sourceBuilder.query(queryBuilder);
        request.source(sourceBuilder);

        List<Document> result = new ArrayList<>();
        try {
            SearchResponse response = client.search(request, RequestOptions.DEFAULT);
            for (SearchHit hit : response.getHits().getHits()) {
                Map<String, Object> source = hit.getSourceAsMap();
                Document document = new Document();
                document.setId(hit.getId());
                document.setSource(source);
                result.add(document);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }

        return result;
    }
}

可以看到，在search方法中，我们创建了一个SearchRequest，并设置了查询的索引、查询的字段和关键词。然后，执行搜索操作并将结果转换成我们定义的Document对象。

过滤器

除了全文搜索，Elasticsearch还提供了丰富的过滤器，可以用于过滤搜索结果。在SpringBoot中，可以使用Elasticsearch的FilterBuilder来构建过滤器。

public List<Document> searchWithFilter(String index, String field, String keyword, String filterField, String filterValue) {
    SearchRequest request = new SearchRequest(index);
    SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
    
    // 构建查询
    QueryBuilder queryBuilder = QueryBuilders.matchQuery(field, keyword);
    sourceBuilder.query(queryBuilder);

    // 构建过滤器
    QueryBuilder filterBuilder = QueryBuilders.termQuery(filterField, filterValue);
    sourceBuilder.postFilter(filterBuilder);

    request.source(sourceBuilder);

    // 执行搜索操作...
}

在searchWithFilter方法中，我们首先创建了一个QueryBuilder来构建查询，然后使用QueryBuilders.termQuery()方法创建一个过滤器，并将其添加到SearchSourceBuilder中的postFilter中。

聚合

Elasticsearch提供了强大的聚合功能，可以用于统计、分组等操作。在SpringBoot中，可以使用Elasticsearch的AggregationBuilder来构建聚合查询。

public List<Document> aggregate(String index, String field, int size) {
    SearchRequest request = new SearchRequest(index);
    SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
    
    // 构建聚合
    AggregationBuilder aggregationBuilder = AggregationBuilders.terms("top_tags").field(field).size(size);
    sourceBuilder.aggregation(aggregationBuilder);

    request.source(sourceBuilder);

    // 执行搜索操作...
}

在aggregate方法中，我们创建了一个AggregationBuilder来构建聚合查询，然后将其添加到SearchSourceBuilder中的aggregation中。

性能优化

为了提高查询性能，可以采取一些措施，如使用索引、缓存、批量操作等。

使用索引

在Elasticsearch中，可以使用Index API创建一个索引，将要搜索的数据存储在里面，以提高搜索性能。

public void createIndex(String index, String id, Map<String, Object> source) {
    IndexRequest request = new IndexRequest(index).id(id).source(source);
    try {
        client.index(request, RequestOptions.DEFAULT);
    } catch (IOException e) {
        e.printStackTrace();
    }
}

缓存

Elasticsearch会自动对常用的搜索结果进行缓存，以提高搜索性能。可以通过设置缓存策略来控制缓存的行为。

public List<Document> searchWithCache(String index, String field, String keyword) {
    SearchRequest request = new SearchRequest(index);
    SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
    QueryBuilder queryBuilder = QueryBuilders.matchQuery(field, keyword);
    sourceBuilder.query(queryBuilder);
    
    // 启用缓存
    sourceBuilder.cache(true);

    request.source(sourceBuilder);

    // 执行搜索操作...
}

批量操作

如果要对多个文档进行搜索操作，可以使用批量操作来提高性能。

public List<Document> bulkSearch(String index, List<String> fields, List<String> keywords) {
    BulkRequest request = new BulkRequest();
    for (int i = 0; i < fields.size(); i++) {
        SearchRequest searchRequest = new SearchRequest(index);
        SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
        QueryBuilder queryBuilder = QueryBuilders.matchQuery(fields.get(i), keywords.get(i));
        sourceBuilder.query(queryBuilder);
        searchRequest.source(sourceBuilder);
        request.add(searchRequest);
    }

    // 执行批量搜索操作...
}

在bulkSearch方法中，我们创建了一个BulkRequest，并将多个SearchRequest添加到其中，然后一次性执行批量搜索操作。

结果处理

在搜索操作完成后，我们可以对结果进行处理，如获取文档的字段值、通过聚合分析数据等。

public void handleResult(List<Document> documents) {
    for (Document document : documents) {
        Map<String, Object> source = document.getSource();
        // 处理文档字段值...
    }
    
    // 分析聚合数据...
}

可以根据需要，解析返回的SearchHit对象，获取文档的字段值。

总结

在本文中，我们介绍了如何在SpringBoot中使用QueryBuilder、FilterBuilder和AggregationBuilder等工具来操作Elasticsearch进行各种高级查询。同时，我们还介绍了一些性能优化的技巧，如使用索引、缓存和批量操作。希望本文对于使用SpringBoot操作ES的读者有所帮助。

参考资料

本文来自极简博客，作者：开源世界旅行者，转载请注明原文链接：SpringBoot操作ES进行各种高级查询（值得收藏）