用户画像标签数据开发之组合标签计算

用户画像标签数据开发之组合标签计算,第1张

用户画像标签数据开发之组合标签计算

目录

0. 相关文章链接

1. 什么是组合标签计算

2. 应用场景

3. 数据计算


注:此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一书读后笔记而来,仅供学习使用

0. 相关文章链接

用户画像文章汇总

1. 什么是组合标签计算

组合标签计算是画像开发中的一个重要模块。当业务方根据业务规则应用标签时,是需要组合多个标签来创建对应的用户群体的,此时需要 应用到组合标签计算。

2. 应用场景

        这里看一个组合标签计算的应用场景,在如下图中用户A、B、C、 D、E已经被打上了符合自己特征的标签,业务人员想给“高价值用户 群组”发放一批优惠券促使他们消费。根据运营经验,定义了 “高价 值用户群组”的特征为:①女性用户;②25〜35岁之间;③累计消费5 次以上;④累计消费500元以上;⑤活跃度在中活跃以上的用户。可以 看到同时满足这些条件的用户为用户B、用户C、用户E。组合标签计算 的任务就是根据业务人员筛选的规则,计算出符合对应条件的用户 群。

组合标签计算的实现逻辑,总结来说分为3个过程:

读取不同组合标签的计算规则;将人群规则拼接成接口传入参数的查询命令,通过接口方式进行查询;接口查询计算时,通过Elasticsearch查询符合这些条件的用户id,返回用户id作为rowkey去Hbase中查询这些用户身上的标签信息。 3. 数据计算

        业务人员在画像产品端可以组合标签圈定人群(如下图),对应地在关系数据库中将会记录该条人群规则包含的用户标签。

记录圈定人群规则的表中主要包括以下主要内容(如下图):
•    人群id:创建该条人群规则对应的唯一id标识。
•    人群名称:该条人群规则在业务定义上的名称。
•    人群规则:人群组合标签规则中包含的标签及标签值。
•    人群数量:该人群对应的数量。
•    创建时间:该人群规则的首次创建时间。
•    修改时间:该人群规则的最近一次修改时间。
•    是否应用:该人群是否应用到线上。

        在调用接口查询时,将人群规则拼接成字符串,通过Elasticsearch查询符合该规则的用户id。例如针对上面id 为“100003”的人群,将其规则拼接成“ATTRITUBE_U_06_001,6||ACTI0N_U_05_003,3||C0NSUME_U_05_003,15”,柞为参数传入接 口地址。
        本博文介绍了一种组合标签计算用户人群的解决方案,总结来说包 括两个过程:首先从关系库表中(如MySQL)读取业务人员圈定人群的 规则,将人群规则拼接成接口的传入参数,然后通过接口请求 Elasticsearch的方式查询对应的用户id。


注:再次声明,此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一书读后笔记而来,仅供学习使用

注:其他相关文章链接由此进 -> 用户画像文章汇总


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5715538.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-18

发表评论

登录后才能评论

评论列表(0条)

保存