• 空搜索
    • hits
    • took
    • shards
    • timeout
    • 警告

    空搜索

    最基本的搜索API表单是空搜索(empty search),它没有指定任何的查询条件,只返回集群索引中的所有文档:

    1. GET /_search

    响应内容(为了编辑简洁)类似于这样:

    1. {
    2. "hits" : {
    3. "total" : 14,
    4. "hits" : [
    5. {
    6. "_index": "us",
    7. "_type": "tweet",
    8. "_id": "7",
    9. "_score": 1,
    10. "_source": {
    11. "date": "2014-09-17",
    12. "name": "John Smith",
    13. "tweet": "The Query DSL is really powerful and flexible",
    14. "user_id": 2
    15. }
    16. },
    17. ... 9 RESULTS REMOVED ...
    18. ],
    19. "max_score" : 1
    20. },
    21. "took" : 4,
    22. "_shards" : {
    23. "failed" : 0,
    24. "successful" : 10,
    25. "total" : 10
    26. },
    27. "timed_out" : false
    28. }

    hits

    响应中最重要的部分是hits,它包含了total字段来表示匹配到的文档总数,hits数组还包含了匹配到的前10条数据。

    hits数组中的每个结果都包含_index_type和文档的_id字段,被加入到_source字段中这意味着在搜索结果中我们将可以直接使用全部文档。这不像其他搜索引擎只返回文档ID,需要你单独去获取文档。

    每个节点都有一个_score字段,这是相关性得分(relevance score),它衡量了文档与查询的匹配程度。默认的,返回的结果中关联性最大的文档排在首位;这意味着,它是按照_score降序排列的。这种情况下,我们没有指定任何查询,所以所有文档的相关性是一样的,因此所有结果的_score都是取得一个中间值1

    max_score指的是所有文档匹配查询中_score的最大值。

    took

    took告诉我们整个搜索请求花费的毫秒数。

    shards

    _shards节点告诉我们参与查询的分片数(total字段),有多少是成功的(successful字段),有多少的是失败的(failed字段)。通常我们不希望分片失败,不过这个有可能发生。如果我们遭受一些重大的故障导致主分片和复制分片都故障,那这个分片的数据将无法响应给搜索请求。这种情况下,Elasticsearch将报告分片failed,但仍将继续返回剩余分片上的结果。

    timeout

    time_out值告诉我们查询超时与否。一般的,搜索请求不会超时。如果响应速度比完整的结果更重要,你可以定义timeout参数为10或者10ms(10毫秒),或者1s(1秒)

    1. GET /_search?timeout=10ms

    Elasticsearch将返回在请求超时前收集到的结果。

    超时不是一个断路器(circuit breaker)(译者注:关于断路器的理解请看警告)。

    警告

    需要注意的是timeout不会停止执行查询,它仅仅告诉你目前顺利返回结果的节点然后关闭连接。在后台,其他分片可能依旧执行查询,尽管结果已经被发送。

    使用超时是因为对于你的业务需求(译者注:SLA,Service-Level Agreement服务等级协议,在此我翻译为业务需求)来说非常重要,而不是因为你想中断执行长时间运行的查询。