从具有加权行概率的PostgreSQL表中选择随机行

从具有加权行概率的PostgreSQL表中选择随机行,第1张

概述示例输入: SELECT * FROM test; id | percent ----+---------- 1 | 50 2 | 35 3 | 15 (3 rows) 你如何编写这样的查询,平均50%的时间我可以得到id = 1的行,35%的时间行id = 2,15%的时间行id = 3? 我尝试像SELECT id FROM测试ORDER BY p * r 示例输入:
SELECT * FROM test; ID | percent   ----+----------  1 | 50   2 | 35     3 | 15   (3 rows)

你如何编写这样的查询,平均50%的时间我可以得到ID = 1的行,35%的时间行ID = 2,15%的时间行ID = 3?

我尝试像SELECT ID FROM测试ORDER BY p * random()DESC liMIT 1,但它给出错误的结果. 10,000次运行后,我得到一个分布,如:{1 = 6293,2 = 3302,3 = 405},但我预计分布接近:{1 = 5000,2 = 3500,3 = 1500}.

有任何想法吗?

这应该是诀窍:
WITH CTE AS (    SELECT random() * (SELECT SUM(percent) FROM YOUR_table) R)SELECT *FROM (    SELECT ID,SUM(percent) OVER (ORDER BY ID) S,R    FROM YOUR_table CROSS JOIN CTE) QWHERE S >= RORDER BY IDliMIT 1;

子查询Q给出以下结果:

1  502  853  100

然后我们在范围[0,100]中简单地生成一个随机数,并选择该数字以上的第一行(WHERE子句).我们使用通用表表达式(WITH)来确保随机数仅计算一次.

BTW,SELECT SUM(percent)FROM YOUR_table允许您以百分比表示任何权重 – 它们不会严格需要百分比(即加起来为100).

[SQL Fiddle]

总结

以上是内存溢出为你收集整理的从具有加权概率的PostgreSQL表中选择随机行全部内容,希望文章能够帮你解决从具有加权行概率的PostgreSQL表中选择随机行所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1169764.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-02
下一篇 2022-06-02

发表评论

登录后才能评论

评论列表(0条)

保存