• 组合过滤
    • 布尔过滤器
    • 嵌套布尔过滤器

    组合过滤

    前面的两个例子展示了单个过滤器的使用。现实中,你可能需要过滤多个值或字段,例如,想在 Elasticsearch 中表达这句 SQL 吗?

    1. SELECT product
    2. FROM products
    3. WHERE (price = 20 OR productID = "XHDK-A-1293-#fJ3")
    4. AND (price != 30)

    这些情况下,你需要 bool 过滤器。这是以其他过滤器作为参数的组合过滤器,将它们结合成多种布尔组合。

    布尔过滤器

    bool 过滤器由三部分组成:

    1. {
    2. "bool" : {
    3. "must" : [],
    4. "should" : [],
    5. "must_not" : [],
    6. }
    7. }

    must:所有分句都必须匹配,与 AND 相同。

    must_not:所有分句都必须不匹配,与 NOT 相同。

    should:至少有一个分句匹配,与 OR 相同。

    这样就行了!假如你需要多个过滤器,将他们放入 bool 过滤器就行。

    提示:
    bool 过滤器的每个部分都是可选的(例如,你可以只保留一个 must 分句),而且每个部分可以包含一到多个过滤器

    为了复制上面的 SQL 示例,我们将两个 term 过滤器放在 bool 过滤器的 should 分句下,然后用另一个分句来处理 NOT 条件:

    1. GET /my_store/products/_search
    2. {
    3. "query" : {
    4. "filtered" : { <1>
    5. "filter" : {
    6. "bool" : {
    7. "should" : [
    8. { "term" : {"price" : 20}}, <2>
    9. { "term" : {"productID" : "XHDK-A-1293-#fJ3"}} <2>
    10. ],
    11. "must_not" : {
    12. "term" : {"price" : 30} <3>
    13. }
    14. }
    15. }
    16. }
    17. }
    18. }

    <1> 注意我们仍然需要用 filtered 查询来包裹所有条件。

    <2> 这两个 term 过滤器是 bool 过滤器的子节点,因为它们被放在 should 分句下,所以至少他们要有一个条件符合。

    <3> 如果一个产品价值 30,它就会被自动排除掉,因为它匹配了 must_not 分句。

    我们的搜索结果返回了两个结果,分别满足了 bool 过滤器中的不同分句:

    1. "hits" : [
    2. {
    3. "_id" : "1",
    4. "_score" : 1.0,
    5. "_source" : {
    6. "price" : 10,
    7. "productID" : "XHDK-A-1293-#fJ3" <1>
    8. }
    9. },
    10. {
    11. "_id" : "2",
    12. "_score" : 1.0,
    13. "_source" : {
    14. "price" : 20, <2>
    15. "productID" : "KDKE-B-9947-#kL5"
    16. }
    17. }
    18. ]

    <1> 匹配 term 过滤器 productID = "XHDK-A-1293-#fJ3"

    <2> 匹配 term 过滤器 price = 20

    嵌套布尔过滤器

    虽然 bool 是一个组合过滤器而且接受子过滤器,需明白它自己仍然只是一个过滤器。这意味着你可以在 bool 过滤器中嵌套 bool 过滤器,让你实现更复杂的布尔逻辑。

    下面先给出 SQL 语句:

    1. SELECT document
    2. FROM products
    3. WHERE productID = "KDKE-B-9947-#kL5"
    4. OR ( productID = "JODL-X-1937-#pV7"
    5. AND price = 30 )

    我们可以将它翻译成一对嵌套的 bool 过滤器:

    1. GET /my_store/products/_search
    2. {
    3. "query" : {
    4. "filtered" : {
    5. "filter" : {
    6. "bool" : {
    7. "should" : [
    8. { "term" : {"productID" : "KDKE-B-9947-#kL5"}}, <1>
    9. { "bool" : { <1>
    10. "must" : [
    11. { "term" : {"productID" : "JODL-X-1937-#pV7"}}, <2>
    12. { "term" : {"price" : 30}} <2>
    13. ]
    14. }}
    15. ]
    16. }
    17. }
    18. }
    19. }
    20. }

    <1> 因为 termbool 在第一个 should 分句中是平级的,至少需要匹配其中的一个过滤器。

    <2> must 分句中有两个平级的 term 分句,所以他们俩都需要匹配。

    结果得到两个文档,分别匹配一个 should 分句:

    1. "hits" : [
    2. {
    3. "_id" : "2",
    4. "_score" : 1.0,
    5. "_source" : {
    6. "price" : 20,
    7. "productID" : "KDKE-B-9947-#kL5" <1>
    8. }
    9. },
    10. {
    11. "_id" : "3",
    12. "_score" : 1.0,
    13. "_source" : {
    14. "price" : 30, <2>
    15. "productID" : "JODL-X-1937-#pV7" <2>
    16. }
    17. }
    18. ]

    <1> productID 匹配第一个 bool 中的 term 过滤器。

    <2> 这两个字段匹配嵌套的 bool 中的 term 过滤器。

    这只是一个简单的例子,但是它展示了该怎样用布尔过滤器来构造复杂的逻辑条件。