百万级要素优化：基于PG与PostGIS的实时矢量瓦片服务

转载

mob604756f89f2f 2021-08-08 15:48:00

文章标签 postgis 数据 json 随机数字段 文章分类 代码人生

背景介绍

对于某些应用场景，数据量很容易达到百万级要素，数据每天都在改变。而且还要考虑在1-6级这种小级别时候的数据展示，那么这个时候仅仅是PG与PostGIS简单的矢量瓦片服务比较困难达到客户想要的效果，这个时候就要考虑做一些优化了。

优化方法

百万级要素优化对于不同的业务来说，有相应不同的解决办法，没有最好，只有更好，这个时候要做考量，下面介绍几个常用的会考虑使用的方法：

1、依据业务，对要素进行抽稀过滤

根据业务层面，在不同场景浏览不同的要素，虽然总的要素在几百万，但是这个时候过滤一部分后剩余要素可以进行实时矢量瓦片展示。

2、几种抽稀过滤的算法

除第一种方法外，其余几种方法包含一些个人的想法与思路，其它小伙伴有其他好的思路，或者对我的想法思路有疑问的话，欢迎在评论区留言。

1）道格拉斯-普客算法（DP）

该算法个人理解为是简化的算法，对于线或者面的边界，可以使用该算法对节点进行抽稀，达到对线或者面的简化。但是为什么在点要素抽稀过滤中也介绍该算法呢？

答案：在轨迹数据中，每一次存储的都是点位信息（点），所以对于该种数据可以使用该算法进行过滤，但是对于一个点即代表一种信息的数据来说，该算法不太适用。

2）基于网格的抽稀过滤算法

该算法结果为均匀分布。

根据数据范围以及阈值将范围划分网格。
遍历网格，利用网格与数据求交（使用PostgreSQL的gist索引，加快速度），计算交到的要素。
将交到要素随机选取一个，其余要素舍弃。
遍历完网格后，即可完成要素过滤。

本人写了一个简单的实现，供各位参考。

--drop FUNCTION point_simplify_grid;
CREATE
OR REPLACE FUNCTION point_simplify_grid (
    PAR_minx DOUBLE PRECISION,
    PAR_miny DOUBLE PRECISION,
    PAR_maxx DOUBLE PRECISION,
    PAR_maxy DOUBLE PRECISION,
    PAR_threshold DOUBLE PRECISION
) RETURNS geometry AS $$
DECLARE REC_points RECORD ; ARR_result_points geometry []; GEO_point geometry ; grid_key VARCHAR (10) ; GEOM_result geometry ; grid_num_x INTEGER ; grid_num_y INTEGER ; grid_json jsonb ;
BEGIN
    grid_num_x := CEIL (
        (PAR_maxx - PAR_minx) / PAR_threshold
    ) ; grid_num_y := CEIL (
        (PAR_maxy - PAR_miny) / PAR_threshold
    ) ; grid_json := '{}' :: jsonb ; ARR_result_points := '{}' :: geometry []; FOR REC_points IN SELECT
        *
    FROM
        tycd_view
    WHERE
        geom && st_makeenvelope (
            PAR_minx,
            PAR_miny,
            PAR_maxx,
            PAR_maxy,
            4326
        ) LOOP grid_key := CEIL (
            (
                st_x (REC_points.geom) - PAR_minx
            ) / PAR_threshold
        ) || ',' || CEIL (
            (
                st_y (REC_points.geom) - PAR_miny
            ) / PAR_threshold
        ) ;
    IF NOT (grid_json ? grid_key) THEN
        ARR_result_points := array_append(
            ARR_result_points,
            st_setsrid (REC_points.geom, 4326)
        ) ; grid_json := grid_json || ('{"' || grid_key || '":true}') :: jsonb ;
    END
    IF ;
    END loop ; GEOM_result := st_union (ARR_result_points) ; RETURN GEOM_result ;
    END ; $$ LANGUAGE plpgsql;

--select st_asgeojson(point_simplify_grid(73,3,135,53,0.2))