这是greatest-n-per-group在StackOverflow上经常出现的问题的一个示例。
这通常是我建议解决的方式:
SELECt c.*, p1.*FROM customer cJOIN purchase p1 ON (c.id = p1.customer_id)LEFT OUTER JOIN purchase p2 ON (c.id = p2.customer_id AND (p1.date < p2.date OR (p1.date = p2.date AND p1.id < p2.id)))WHERe p2.id IS NULL;
说明:给定一行
p1,就不应有
p2同一位客户和更晚的日期(或者在有联系的情况下,更晚的日期id)。当我们发现这是事实时,则
p1是该客户的最近一次购买。
对于指数,我会在创建复合指数
purchase在列(
customer_id,date,id)。这可以允许使用覆盖索引来完成外部联接。确保优化在您的平台上进行测试,因为优化取决于实现。使用RDBMS的功能来分析优化计划。例如EXPLAIN在MySQL上。
有些人使用子查询来代替我上面显示的解决方案,但是我发现我的解决方案可以更轻松地解决联系。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)