菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS PostgreSQL最佳实践

菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS PostgreSQL最佳实践,第1张

概述介绍《菜鸟末端轨迹(解密支撑每天251亿个包裹数据库)-阿里云RDS PostgreSQL最佳实践》开发教程,希望对您有用。

《菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS Postgresql最佳实践》要点:
本文介绍了菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS Postgresql最佳实践,希望对您有用。如果有疑问,可以联系我们。

标签

Postgresql,PostGIS,多边形,面,点,面点断定,菜鸟

配景

菜鸟末端轨迹项目中涉及的一个关键需求,面面断定.

在数据库中存储了一些多边形记载,约几百万到千万条记载,例如一个小区,在地图上是一个多边形.

不同的快递公司,会有各自不同的多边形划分办法(每个网点负责的片区(多边形),每个快递员负责的片区(多边形)).

用户在寄件时,根据用户的地位,查找对应快递公司负责这个片区的网点、或者负责该片区的快递员.

一、需求

1、在数据库中存储了一些静态的面信息,代表小区、园区、写字楼等等.所有的面不相交.

2、为了支持分歧的业务类型,对一个地图,可能划分为分歧的多边形组成.

例如不同的快递公司,会有各自不同的多边形划分办法(网点负责的片区(多边形),某个快递员负责的片区(多边形)).

因此在一张地图上,有多个图层,每个图层的多边形划分办法可能不一样.

3、快速的根据快递公司、客户的位置,求包括这个点的多边形(即得到对应快递公司负责这个片区的网点、或者负责该片区的快递员).

二、架构设计

用到阿里云的RDS Postgresql,以及PG提供的PostGIS插件.

我们必要用到PostGIS的函数有两个

http://postgis.net/docs/manual-2.3/ST_Within.HTML

1、ST_within

ST_Within — Returns true if the geometry A is completely insIDe geometry B

boolean ST_Within(geometry A,geometry B);

Returns TRUE if geometry A is completely insIDe geometry B. For this function to make sense,the source geometrIEs must both be of the same coordinate projection,having the same SRID. It is a given that if ST_Within(A,B) is true and ST_Within(B,A) is true,then the two geometrIEs are consIDered spatially equal.

This function call will automatically include a bounding Box comparison that will make use of any indexes that are available on the geometrIEs. To avoID index use,use the function _ST_Within.

-- a circle within a circle

2、ST_Contains

ST_Contains — Returns true if and only if no points of B lIE in the exterior of A,and at least one point of the interior of B lIEs in the interior of A.

boolean ST_Contains(geometry geomA,geometry geomB);

Returns TRUE if geometry B is completely insIDe geometry A. For this function to make sense,having the same SRID. ST_Contains is the inverse of ST_Within. So ST_Contains(A,B) implIEs ST_Within(B,A) except in the case of invalID geometrIEs where the result is always false regardless or not defined.

This function call will automatically include a bounding Box comparison that will make use of any indexes that are available on the geometrIEs. To avoID index use,use the function _ST_Contains.

-- A circle within a circle

三、DEMO与性能

1 PG内置几何类型 面点搜索 压测

为了简化测试,采样PG内置的几何类型进行测试,用法与PostGIS是相似的.

1、创立测试表

postgres=# create table po(ID int,typID int,po polygon);

2、创立分区表或分区索引

create extension btree_gist;

3、创立空间排他约束,可选

如果要求单个typID内的po不重叠,可以创立空间排他约束

create table tbl_po(ID int,po polygon)

4、写入1000万多边形测试数据

insert into po select ID,random()*20,polygon('(('||x1||','||y1||'),('||x2||','||y2||'),('||x3||','||y3||'))') from (select ID,180-random()*180 x1,180-random()*180 x2,180-random()*180 x3,90-random()*90 y1,90-random()*90 y2,90-random()*90 y3 from generate_serIEs(1,10000000) t(ID)) t;

5、测试面点断定性能

查询包括point(1,1)的多边形,响应时间0.57毫秒.

postgres=# explain (analyze,verbose,timing,costs,buffers) select * from po where typID=1 and po @> polygon('((1,1),(1,1))') limit 1;

6、压测

vi test.sql

惊不惊喜、意不不测

TPS:29万,平均响应光阴:0.2毫秒

2 PostGIS空间数据库 面点搜索 压测

阿里云 RDS Postgresql,HybrIDDB for Postgresql 已经内置了PostGIS空间数据库插件,使用前创立插件即可.

create extension postgis;

1、建表

postgres=# create table po(ID int,po geometry);

2、创立空间索引

postgres=# create extension btree_gist;

3、写入1000万多边形测试数据

postgres=# insert into po

4、测试面点断定性能

postgres=# explain (analyze,buffers) select * from po where typID=1 and st_within(ST_PointFromText('POINT(1 1)'),po) limit 1;

5、压测

vi test.sql

惊不惊喜、意不不测

TPS:19.8万,平均响应光阴:0.32毫秒

四、技术点

1、空间排他约束

这个约束可以用于强制记录中的多边形不相交.例如地图这类严谨数据,绝对弗成能出现两个多边形相交的,否则就有领土纷争了.

Postgresql便是这么严谨,意不意外.

2、分区表

本例中分歧的快递公司,对应分歧的图层,每个快递公司根据网点、快递员负责的片区(多边形)划分为多个多边形.

使用List分区,每个分区对应一家快递公司.

3、空间索引

GiST空间索引,支持KNN、包括、相交、上下左右等空间搜索.

效率极高.

4、空间分区索引

《分区索引的利用和实践 - 阿里云RDS Postgresql最佳实践》

5、面面、点断定

面面判断或面点判断是本例的主要需求,用户在寄包裹时,根据用户地位在数据库的一千万多边形中找出覆盖这个点的多边形.

五、云端产物

阿里云 RDS Postgresql

六、相似场景、案例

《Postgresql 物流轨迹系统数据库需求阐发与设计 - 包裹侠实时跟踪与召回》

七、小结

菜鸟末端轨迹项目中涉及的一个关键需求,某个快递员负责的片区(多边形)).

用户在寄件时,查找对应快递公司负责这个片区的网点、或者负责该片区的快递员.

使用阿里云RDS Postgresql,用户存放约1千万的多边形数据,单库实现了每秒29万的处理哀求,单次哀求平均响应时间约0.2毫秒.

惊不惊喜、意不不测.

八、参考

http://postgis.net/docs/manual-2.3/ST_Within.HTML

《分区索引的利用和实践 - 阿里云RDS Postgresql最佳实践》

《菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS Postgresql最佳实践》是否对您有启发,欢迎查看更多与《菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS Postgresql最佳实践》相关教程,学精学透。内存溢出PHP学院为您提供精彩教程。

总结

以上是内存溢出为你收集整理的菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS PostgreSQL最佳实践全部内容,希望文章能够帮你解决菜鸟末端轨迹(解密支撑每天251亿个包裹的数据库)-阿里云RDS PostgreSQL最佳实践所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1182807.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-02
下一篇 2022-06-02

发表评论

登录后才能评论

评论列表(0条)

保存