• Geohashes

    Geohashes

    Geohashes 是一种将 经纬度坐标对(lat/lon)编码成字符串的方式。
    最开始这么做只是为了让地理位置在url上呈现的形式更加友好,
    不过现在geohash已经变成一种在数据库中有效索引地理坐标点和地理形状的方式。

    Geohashes 把整个世界分为32个单元的格子—4行8列—每一个格子都用一个字母或者数字标识。
    比如 g 这个单元覆盖了半个格林兰,冰岛的全部和大不列颠的大部分。
    每一个单元还可以进一步被分解成新的32个单元,这些单元又可以继续被分解成32个更小的单元,不断重复下去。
    gc 这个单元覆盖了爱尔兰和英格兰,gcp覆盖了伦敦的大部分和部分南英格兰,
    gcpuuz94k是伯明翰宫的入口,精确到了约5米。

    换句话说,geohash的长度越长,它的精度就越高。
    如果两个geohash有一个共同的前缀,如 gcpuuz,就表示他们挨得很紧。
    共同的前缀越长,距离就越近。

    但那也就是说,两个刚好相邻的位置,会可能有完全不同的geohash。
    一个实例,伦敦的 Millenium Dome 的geohash是 u10hbp
    因为它落在了 u这个大单元里,而紧挨着它东边的最大的单元是 g

    地理坐标点可以自动关联到他们对应的 geohash。
    需要注意的是,他们会被索引到了所有(各个层级)的 geohash 前缀prefixes)。
    例:索引伯明翰宫的门口—坐标纬度 51.501568,经度-0.141257—会在各种尺寸精度的 geohash 上建立索引,
    如下表:

    Geohash Level Dimensions
    g 1 ~ 5,004km x 5,004km
    gc 2 ~ 1,251km x 625km
    gcp 3 ~ 156km x 156km
    gcpu 4 ~ 39km x 19.5km
    gcpuu 5 ~ 4.9km x 4.9km
    gcpuuz 6 ~ 1.2km x 0.61km
    gcpuuz9 7 ~ 152.8m x 152.8m
    gcpuuz94 8 ~ 38.2m x 19.1m
    gcpuuz94k 9 ~ 4.78m x 4.78m
    gcpuuz94kk 10 ~ 1.19m x 0.60m
    gcpuuz94kkp 11 ~ 14.9cm x 14.9cm
    gcpuuz94kkp5 12 ~ 3.7cm x 1.8cm

    geohash单元过滤器( geohash_cell filter )可以使用这些geohash前缀来找出与指定坐标点(lat/lon)相邻的位置。