Maison  >  Article  >  Java  >  Comment résoudre le problème de l'intégration de SpringBoot dans les champs de retour de recherche d'analyse ES

Comment résoudre le problème de l'intégration de SpringBoot dans les champs de retour de recherche d'analyse ES

PHPz
PHPzavant
2023-05-16 08:13:071294parcourir

    1. Structure des données

    Index 2 des documents dans l'index de l'hôtel :

    PUT /hotel/_doc/1
    {
      "title": "文雅酒店",
      "city": "青岛",
      "price": 556,
      "create_time": "20200418120000",
      "amenities": "浴池,普通停车场/充电停车场",
      "full_room": false,
      "location": {
        "lat": 36.083078,
        "lon": 120.37566
      },
      "praise": 10
    }
    
    PUT /hotel/_doc/2
    {
      "title": "金都嘉怡假日酒店",
      "city": "北京",
      "price": 337,
      "create_time": "20210315200000",
      "amenities": "wifi,充电停车场/可升降停车场",
      "full_room": false,
      "location": {
        "lat": 39.915153,
        "lon": 116.403
      },
      "praise": 60
    }
    
    PUT /hotel/_doc/1
    {
      "title": "文雅酒店",
      "city": "青岛",
      "price": 556,
      "create_time": "20200418120000",
      "amenities": "浴池,普通停车场/充电停车场",
      "full_room": false,
      "location": {
        "lat": 36.083078,
        "lon": 120.37566
      },
      "praise": 10
    }
    
    PUT /hotel/_doc/2
    {
      "title": "金都嘉怡假日酒店",
      "city": "北京",
      "price": 337,
      "create_time": "20210315200000",
      "amenities": "wifi,充电停车场/可升降停车场",
      "full_room": false,
      "location": {
        "lat": 39.915153,
        "lon": 116.403
      },
      "praise": 60
    }

    2 . ElasticSearch interroge tous les documents dans tous les index du cluster

     GET /hotel/_search
    {
      "took" : 499,
      "timed_out" : false,
      "_shards" : {
        "total" : 5,
        "successful" : 5,
        "skipped" : 0,
        "failed" : 0
      },
      "hits" : {
        "total" : {
          "value" : 2,
          "relation" : "eq"
        },
        "max_score" : 1.0,
        "hits" : [
          {
            "_index" : "hotel",
            "_type" : "_doc",
            "_id" : "2",
            "_score" : 1.0,
            "_source" : {
              "title" : "金都嘉怡假日酒店",
              "city" : "北京",
              "price" : 337,
              "create_time" : "20210315200000",
              "amenities" : "wifi,充电停车场/可升降停车场",
              "full_room" : false,
              "location" : {
                "lat" : 39.915153,
                "lon" : 116.403
              },
              "praise" : 60
            }
          },
          {
            "_index" : "hotel",
            "_type" : "_doc",
            "_id" : "1",
            "_score" : 1.0,
            "_source" : {
              "title" : "文雅酒店",
              "city" : "青岛",
              "price" : 556,
              "create_time" : "20200418120000",
              "amenities" : "浴池,普通停车场/充电停车场",
              "full_room" : false,
              "location" : {
                "lat" : 36.083078,
                "lon" : 120.37566
              },
              "praise" : 10
            }
          }
        ]
      }
    }

    3 L'analyse du champ de résultat de la recherche ElasticSearch

    1 a pris le nombre de millisecondes que la requête de recherche a pris

    #. La valeur 🎜🎜#a pris nous indique combien de millisecondes il a fallu pour effectuer l'intégralité de la requête de recherche.

    took 值告诉我们执行整个搜索请求耗费了多少毫秒。

    2. shards 查询中参与分片的总数

    _shards 部分告诉我们在查询中参与分片的总数,以及这些分片成功了多少个失败了多少个。正常情况下我们不希望分片失败,但是分片失败是可能发生的。如果我们遭遇到一种灾难级别的故障,在这个故障中丢失了相同分片的原始数据和副本,那么对这个分片将没有可用副本来对搜索请求作出响应。假若这样,Elasticsearch 将报告这个分片是失败的,但是会继续返回剩余分片的结果。

    3. timed_out 查询是否超时

    timed_out 值告诉我们查询是否超时。默认情况下,搜索请求不会超时。

    4. hits 表示搜索结果

    返回结果中最重要的部分是 hits ,它包含 total 字段来表示匹配到的文档总数,并且一个 hits2. shards Le nombre total de shards participant à la requête

    La partie _shards nous indique le nombre total de shards participant à la requête, et ces fragments Combien ont réussi et combien ont échoué. Normalement, nous ne voulons pas que le partitionnement échoue, mais un échec de partitionnement peut survenir. Si nous rencontrons une panne catastrophique au cours de laquelle les données originales et les répliques de la même partition sont perdues, aucune réplique disponible de cette partition ne sera disponible pour répondre aux demandes de recherche. Si tel est le cas, Elasticsearch signalera cette partition comme ayant échoué, mais continuera à renvoyer des résultats pour les partitions restantes.


    3. timed_out Indique si la requête expire

    La valeur timed_out nous indique si la requête expire. Par défaut, les demandes de recherche n'expirent pas.

    4. les hits signifient les résultats de la recherche

    La partie la plus importante des résultats renvoyés est les hits, qui contiennent le total pour représenter le nombre total de documents correspondants, et un tableau hits contient les dix premiers documents des résultats de la requête. Lors de l'analyse des résultats de recherche, nous devons généralement prêter attention aux champs suivants :

    hits.total.value : le nombre total de documents correspondants.

    hits.max_score : La valeur maximale de _score du document correspondant à la requête.

    hits.hits : Liste des documents correspondants.

    hits.hits._source : Les données brutes du document correspondant.

    hits.hits._score : Le score du document correspondant. Il mesure dans quelle mesure le document correspond à la requête. Par défaut, les résultats du document les plus pertinents sont renvoyés en premier, c'est-à-dire que les documents renvoyés sont triés par ordre décroissant par score.

    hits.hits.highlight : Mettez en surbrillance les informations pour les documents correspondants.

    4. SpringBoot intègre ElasticSearch pour obtenir des résultats de recherche

    @Slf4j
    @Service
    public class ElasticSearchImpl {
    
        @Autowired
        private RestHighLevelClient restHighLevelClient;
    
        public void searchUser() throws IOException {
            SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
            SearchRequest searchRequest = new SearchRequest(new String[]{"hotel"},searchSourceBuilder);
            SearchResponse searchResponse = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
    
            TimeValue took = searchResponse.getTook();
            System.out.println("took = " + took);
    
            // 搜索结果
            SearchHits searchHits = searchResponse.getHits();
    
            // hits.total.value:匹配的文档总数
            TotalHits totalHits = searchHits.getTotalHits();
            long value = totalHits.value;
            System.out.println("value = " + value);
    
            // hits.max_score:与查询所匹配文档的_score的最大值
            float maxScore = searchHits.getMaxScore();
            System.out.println("maxScore = " + maxScore);
    
            // hits.hits:匹配的文档列表
            SearchHit[] hits = searchHits.getHits();
            for (SearchHit hit : hits) {
                // hits.hits._source:匹配的文档的原始数据
                String sourceAsString = hit.getSourceAsString();
                System.out.println("sourceAsString = " + sourceAsString);
    
                //  hits.hits._id:匹配的文档的id
                String id = hit.getId();
                System.out.println("id = " + id);
    
                Map<String, DocumentField> fields = hit.getFields();
                System.out.println("fields = " + fields);
    
                String index = hit.getIndex();
                System.out.println("index = " + index);
    
                float score = hit.getScore();
                System.out.println("score = " + score);
            }
            System.out.println(searchResponse);
    
        }
    }
    
    @Slf4j
    @Service
    public class ElasticSearchImpl {
    
        @Autowired
        private RestHighLevelClient restHighLevelClient;
    
        public void searchUser() throws IOException {
            SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
            SearchRequest searchRequest = new SearchRequest(new String[]{"hotel"},searchSourceBuilder);
            SearchResponse searchResponse = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
    
            TimeValue took = searchResponse.getTook();
            System.out.println("took = " + took);
    
            // 搜索结果
            SearchHits searchHits = searchResponse.getHits();
    
            // hits.total.value:匹配的文档总数
            TotalHits totalHits = searchHits.getTotalHits();
            long value = totalHits.value;
            System.out.println("value = " + value);
    
            // hits.max_score:与查询所匹配文档的_score的最大值
            float maxScore = searchHits.getMaxScore();
            System.out.println("maxScore = " + maxScore);
    
            // hits.hits:匹配的文档列表
            SearchHit[] hits = searchHits.getHits();
            for (SearchHit hit : hits) {
                // hits.hits._source:匹配的文档的原始数据
                String sourceAsString = hit.getSourceAsString();
                System.out.println("sourceAsString = " + sourceAsString);
    
                //  hits.hits._id:匹配的文档的id
                String id = hit.getId();
                System.out.println("id = " + id);
    
                Map<String, DocumentField> fields = hit.getFields();
                System.out.println("fields = " + fields);
    
                String index = hit.getIndex();
                System.out.println("index = " + index);
    
                float score = hit.getScore();
                System.out.println("score = " + score);
            }
            System.out.println(searchResponse);
    
        }
    }
    took=2ms
    value = 2
    maxScore = 1.0
    
    sourceAsString = {"title":"金都嘉怡假日酒店","city":"北京","price":337,"create_time":"20210315200000","amenities":"wifi,充电停车场/可升降停车场","full_room":false,"location":{"lat":39.915153,"lon":116.403},"praise":60}
    id = 2
    fields = {}
    index = hotel
    score = 1.0
    
    sourceAsString = {"title":"文雅酒店","city":"青岛","price":556,"create_time":"20200418120000","amenities":"浴池,普通停车场/充电停车场","full_room":false,"location":{"lat":36.083078,"lon":120.37566},"praise":10}
    id = 1
    fields = {}
    index = hotel
    score = 1.0
    {
        "took": 2,
        "timed_out": false,
        "_shards": {
            "total": 5,
            "successful": 5,
            "skipped": 0,
            "failed": 0
        },
        "hits": {
            "total": {
                "value": 2,
                "relation": "eq"
            },
            "max_score": 1.0,
            "hits": [
                {
                    "_index": "hotel",
                    "_type": "_doc",
                    "_id": "2",
                    "_score": 1.0,
                    "_source": {
                        "title": "金都嘉怡假日酒店",
                        "city": "北京",
                        "price": 337,
                        "create_time": "20210315200000",
                        "amenities": "wifi,充电停车场/可升降停车场",
                        "full_room": false,
                        "location": {
                            "lat": 39.915153,
                            "lon": 116.403
                        },
                        "praise": 60
                    }
                },
                {
                    "_index": "hotel",
                    "_type": "_doc",
                    "_id": "1",
                    "_score": 1.0,
                    "_source": {
                        "title": "文雅酒店",
                        "city": "青岛",
                        "price": 556,
                        "create_time": "20200418120000",
                        "amenities": "浴池,普通停车场/充电停车场",
                        "full_room": false,
                        "location": {
                            "lat": 36.083078,
                            "lon": 120.37566
                        },
                        "praise": 10
                    }
                }
            ]
        }
    }

    5 .Résultats de recherche ElasticSearch questions d'entretien

    1. Que signifie le champ _score ?

    Réponse : Le champ _score indique le score de pertinence du document correspondant. Plus le score est élevé, plus le degré de correspondance est élevé.

    2. Que signifie le champ de surbrillance dans les résultats de recherche ElasticSearch ?

    Réponse : Le champ surligné représente le champ surligné dans le document correspondant et son contenu surligné.

    3. Comment obtenir le nombre total de documents dans les résultats de recherche ElasticSearch ?

    Answer : Vous pouvez obtenir le nombre total de documents correspondants via le champ hits.total.value.

    4. Comment obtenir une liste des documents correspondants dans les résultats de recherche ElasticSearch ?

    Réponse : Vous pouvez obtenir la liste des documents correspondants via le champ hits.hits.

    5. Comment obtenir les données brutes des documents correspondants dans les résultats de recherche ElasticSearch ?

    Réponse : Les données originales du document correspondant peuvent être obtenues via le champ hits.hits._source.

    6. Comment obtenir les informations de surbrillance des documents correspondants dans les résultats de recherche ElasticSearch ?

    #🎜🎜#Answer : Vous pouvez obtenir les informations de surbrillance des documents correspondants via le champ hits.hits.highlight. #🎜🎜##🎜🎜#7. Que signifie le champ _shards dans les résultats de recherche ElasticSearch ? #🎜🎜##🎜🎜# Réponse : Le champ _shards représente les informations de partition impliquées dans la recherche, y compris le nombre total de partitions, le nombre de partitions réussies, le nombre de partitions ignorées et le nombre de partitions ayant échoué. #🎜🎜##🎜🎜#8. Que signifie le champ "take" dans les résultats de recherche ElasticSearch ? #🎜🎜##🎜🎜# Réponse : Le champ take indique le temps de recherche, en millisecondes. #🎜🎜#

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

    Déclaration:
    Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer