什么是用户画像

什么是用户画像,第1张

什么是用户画像

用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际 *** 作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性,能代表产品的主要受众和目标群体。

用户画像的起源

用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。

用户画像的优点

用户画像可以使产品的服务对象更加聚焦,更加的专注。在行业里,我们经常看到这样一种现象:做一个产品,期望目标用户能涵盖所有人,男人女人、老人小孩、专家小白、文青屌丝...... 通常这样的产品会走向消亡,因为每一个产品都是为特定目标群的共同标准而服务的,当目标群的基数越大,这个标准就越低。换言之, 如果这个产品是适合每一个人的,那么其实它是为最低的标准服务的,这样的产品要么毫无特色,要么过于简陋。

用户画像还可以提高决策效率。在产品设计流程中,各个环节的参与者非常多,分歧总是不可避免,决策效率无疑影响着项目的进度。而用户画像是来自于对目标用户的研究,当所有参与产品的人都基于一致的用户进行讨论和决策,就很容易约束各方能保持在同一个大方向上,提高决策的效率。

先说说“用户画像”这个词,它对应的英文有两个:Personas 和 User Profile。Personas 属于交互设计领域的概念,不在本文讨论范围内,请出门右转去找交互设计师们聊,留下来的人,我们聊聊 User Profile 这种用户画像。

User Profile 原本用于营销领域。营销人员需要对营销的客户有更精准的认识,从而能够更有针对性地对客户和市场制定营销方案。

这个理念本身没有错,但是有一个问题:传统营销领域,是以市场销售人员为第一人称视角去看待客户的,也就是用户画像为营销人员服务。

在这种用途下谈论的用户画像,和我们即将在推荐系统领域谈论的相差有点大;但是很遗憾,今天在媒体上看到的大多数“用户画像”案例分享,都停留在这个意思上。

比如最常见的用户画像出现在高大上的 PPT 上:用标签云的方式绘制一个人的形状,或者在一个人物形象旁边列出若干人口统计学属性,以此来表达“用户画像”这个概念。

看上去非常酷炫,但是我得悄悄告诉你一个赤裸裸的真相:越酷炫的用户画像越没什么用。

既然是给机器看的,那么画像是不是酷炫、是不是像、维度是不是人类可读,都不重要。那它到底是个什么样子呢?先别急,听我慢慢讲。

一个推荐系统来到这个世界上,它只有一个使命,就是要在用户(User)和物品(Item)之间建立连接。

一般方式就是,对用户和物品之间的匹配评分,也就是预测用户评分或者偏好。推荐系统在对匹配评分前,则首先就要将用户和物品都向量化,这样才能进行计算。

而根据推荐算法不同,向量化的方式也不同,最终对匹配评分的做法也不同,在后面讲到具体推荐算法时你会看到这一点。

用户向量化后的结果,就是 User Profile,俗称“用户画像”。所以, 用户画像不是推荐系统的目的,而是在构建推荐系统的过程中产生的一个关键环节的副产品。

另外,通常大型推荐系统一般都分为召回和排序两个阶段,这个在后面我会专门讲到。

因为全量物品通常数量非常大,无法为一个用户(User)逐一计算每一个物品(Item)的评分,这时候就需要一个召回阶段,其实就是预先筛选一部分物品(Item),从而降低计算量,用户画像除了用于最终匹配评分,还要用在召回。所以,构建用户画像就要以这两个阶段为目的。

举个例子,我想去吃点夜宵,楼下有五家大排档,那么从推荐系统的思路来看,我怎么选择呢?

首先就是将五家大排档向量化,我暂定向量的维度有:

现在每一个大排档都有一个向量,我自己也要有一个对应的向量,就是你有多看中这三个元素:

这样一来就可以对五家大排档做匹配打分了,你很容易得出哪家大排档最适合。

假如我的向量是:

价格: 3 种类: 5 味道: 5

这就是一个大排档推荐系统的简单用户画像了,是不是很简单!

这里可以简单计算一下:每一个因素相乘后再相加,就得到每一个大排档的评分了。

接下来我来围绕这个大排档推荐系统的用户画像,看看建立用户画像的关键因素: 第一个是维度,第二个是量化。

首先我先来说说“维度”。

看前面这个例子,我定下来的几个维度:价格、种类、味道。这几个维度有三个特点:

当我们去给每一个大排档计算评分时,想象你是一台计算机,你读取了用户画像的“价格”取值为 3,再去取出一个大排档的“价格”评分,两者相乘,用户画像的维度“价格”和大排档的“价格”天然匹配上了。

因为是同一个名字;但是计算机很傻,你把大排档的这个维度换成“价钱”,它就不知道该如何是好了。

另一方面,对这三个维度,把两边同时换成 1、 2、3 或者 a、b、c 都是可以的,也不影响计算结果,计算机依然能够匹配上;所以用户画像的维度不一定需要人类能够理解,只要计算机能把两边对应上就可以了。

假如是根据用户的阅读历史挖掘阅读兴趣标签,那么我们无法提前知道用户有哪些标签,也就不能确定用户画像有哪些维度,所以第二点也不是必须的。

因为这一点也不是必须的,用户画像的维度个数可以不用确定。理论上来说维度越多,画像越精细,但带来的计算代价也是很大的,需要权衡。

虽然这里以标签作为例子,但是你要注意,用户画像是向量化结果,而不是标签化。标签化只是向量化的一种,因为向量的维度不一定需要人理解。

我们这里的量化都是主观的,而在实际生产系统上,用户画像每个维度的量化,应该交给机器,而且以目标为导向,以推荐效果好坏来反向优化出用户画像才有意义,像这里这个简单的例子,没有去管推荐效果而先行主观量化了每一个维度,是大忌。

所以用户画像的量化是和第三个关键元素“效果”息息相关的。前面已经说过,不要为了用户画像而用户画像,它只是推荐系统的一个副产品,所以要根据使用效果(排序好坏、召回覆盖等指标)来指导用户画像的量化。

再来整体说说怎么构建用户画像,按照对用户向量化的手段来分,用户画像构建方法分成三类:

直接使用原始数据作为用户画像的内容,如注册资料等人口统计学信息,或者购买历史,阅读历史等,除了数据清洗等工作,数据本身并没有做任何抽象和归纳。这就跟查户口一样,没什么技术含量,但通常对于用户冷启动等场景非常有用。

方法就是堆积历史数据,做统计工作,这是最常见的用户画像数据,常见的兴趣标签,就是这一类,就是从历史行为数据中去挖掘出标签,然后在标签维度上做数据统计,用统计结果作为量化结果。这一类数据贡献了常见的酷炫用户画像。

就是用机器学习方法,学习出人类无法直观理解的稠密向量,也最不被非技术人员重视,但实际上在推荐系统中承担的作用非常大。

比如使用潜语义模型构建用户阅读兴趣,或者使用矩阵分解得到的隐因子,或者使用深度学习模型学习用户的 Embedding 向量。这一类用户画像数据因为通常是不可解释,不能直接被人看懂。

我会在后面专门讲解这些技术手段,以及它们在推荐系统中的实际使用。

现在总结一下今天的内容:

作者介绍

@王志杰

明略科技的大数据架构师;

毕业于北京大学计算机科学与技术专业。

往期回顾:

比你更了解你,浅谈用户画像(一)

02  为什么要做用户画像?

前面所讲的内容,是对于画像进行了理论上的定义和直观上的认识。

我们知道画像后,为什么要去构建画像?构建出来有什么用呢?下面和大家分享一下我的看法。

首先,我们从理论上去分析一下,具体分为业务和技术两个方面。业务层面上,我们通过用户画像可以构建一个具象的认知,构建战略和战术的方向。同时,也可以去探索用户的足迹,形成以用户为导向的方向。

具体是什么意思呢?就是构建具体认知,构建战略、战术方向。其实就是说,我们为了在这个层面跟核心用户,达成一个统一和具象的认识。达成了认识之后,我们才方便在后续的投入上面能有的放矢,至少我们知道应该向哪个方向投入。

当我们在为用户去设计产品的时候,我们必须要清楚的知道用户长什么样子,他有什么行为的特征,有什么样的属性特征。这样我们才能以用户为导向。所以,我们根据用户画像的信息去做产品设计,这样才是为我们公司提出战略和战术层面的指导。

探索用户的足迹形成用户的导向,其实是说在我们详细的了解了真实用户,他是如何和产品的相关内容进行互动后,我们才能进一步的深化产品。当我们对用户进行画像的时候,我们一定要从业务场景出发,带业务场景目标,去解决实际的一个业务问题。

比如,我们要去进行画像,要么就是去获取新用户,要么就是去提升用户体验,再或者可能就是去挽回一个流失用户。总之,我一定是有一个非常明确的目标。这些是从业务上去构建用户画像一些必要性而做出的努力。

从技术层面上来讲,我们通过用户画像的构建,可以帮助去构建底层的数据基础,来服务上层的应用。同时,也是在某些层面上方便信息的处理。

为什么呢?用户画像除了可以做直观的展示之外,更多的是服务一些上层的应用。其实刚刚几位老师也提到过,比如在推荐系统里,用户画像是可以做推荐系统非常重要的一环而存在,它对推荐的效果有较大的提升。

另外,像刚刚提到的在金融里面的应用,用户画像也可以应用在风控的应用里,做一些规则特征来存在,来量化系统等级。

所谓方便信息的处理,其实是说我们标签之后,计算机就可以方便地来处理一些量化的需求。

比如去做一些分类统计,某个视频网站上最近比较火的脱口秀,希望知道看脱口秀大会的用户到底有多少,男女比例是多少;或者可以去做数据挖掘,喜欢买榴莲的用户,通常他们喜欢的是什么服装品牌;或者经常买咖啡、又买大蒜的用户,他们的年龄分布是什么样子。等等。可以帮我们去做一些量化分析。

总之,用户画像可以完美地抽象出一个用户的信息全貌,这是企业应用大数据的根基。

用户画像可以帮助企业,为用户提供个性化的产品和服务。我们也总是在说千人千面,每个给客户提供服务的企业,最终的目的都是,当用户打开产品、打开APP或者网站时,他看到的内容和得到的体验,都是针对他来设计的,或者说符合他的调性。只有这样,他的体验才会有一个真正的提升。

下面给大家举个例子,结合明略的用户画像和营销自动化的场景,举一个画像支撑业务的非常浅显的例子。

当我们想要举行一场营销活动的时候,可能不会面向所有的用户群体,就是针对某一类具有一定特征的用户来进行。

首先,我们就会用到用户画像,根据我们对于用户的画像,或者根据用户构建的标签,去进行人群的圈选。

根据业务上的条件,去确定用户群体,我们就可以在群体里面通过条件把它圈选出来。比如这个例子里面,就是通过一个消费行为的标签,把360天内都没有购买过的用户圈出来。

当真正去做营销活动的时候,我就可以在营销自动化产品里面,在规划和实施营销活动的时候,将刚刚筛选出来的用户群体作为标准群,就是我画红圈的部分。我们就可以轻松地实现定向的营销。

总体来讲,画像作为一个整体,它到底有什么作用?刚刚提到画像、标签,它其中有几个联系。下面具体来谈一谈标签,标签到底有什么样的作用?为什么会有这么大的重要性?

标签可以将数据及其含有的信息转化成带有明确的可决策行为的指导。“人”参与决策越多的地方,越需要将数据/信息进行标签化,以提升人对数据的理解和处理效率,实现人机协同。

这个总结出来的具体是什么含义呢?我们可以来详细地交流一下。

我们来观察一下这些所谓的数据产品,比如营销领域的DNT、CPP,或者大家不太熟悉的话,我们可以举一些通用的例子,比如BI等等,这些数据产品的特征,就是怎么样用数据让人们去产生快速地理解。

举一个具体的例子,当前的疫情的环境下,可能有一个大家经常会遇到的标签,我们在测体温的时候,如果超过37度,可能就是发烧了,就需要去看医生,我们可能就会被带走隔离,这个点就是一个重要的标签,就是一个发烧点。

再比如开车的时候,如果时速超过120码,我的导航上的显示就变成红色了,这个也是一个非常重要的标签,它就会告诉我,说我超速了。

所以,我们在日常生活中,总是遇到一些特别底层的标签,比如说到某个标签,我就能知道去怎么做,或者下一步该怎么走。比如我看到超速了,就知道该把速度降下来了。

再从另一个角度来看一下,为什么需要去做标签?比如说我们现在的各种新闻类或者短视频类的APP,他们的背后都有一个非常好的推荐,这些推荐可能不需要标签。比如它知道你喜欢这个东西,它就推给你看,然后你去看,它可能再给你推荐另外一个,可能你又看了。

当所有的这些数据由机器去处理的时候,它可能不需要理解是什么,因为它有大量的用户的反馈数据去帮它做决策,它就可以不断地去刷新、去训练模型。

但是如果某些场景中是需要人参与做决策,也就是说人参与决策的地方越多,我们就越需要将数据进行标签化。为什么呢?因为人处理信息就没有办法像机器通过大量的预算,毕竟人处理的信息是有限的。

所以,为了快速地让人对数据进行理解,可以去提升处理效率,最终实现人机协同。我们用标签的目的,就是为了把大量的数据验算完的结果,通过信息的标签化,变成快速去理解,快速去做决策的一个形式。

就像我们刚刚提到的,在数据产品里,如果可以把数据变成一个明确的标签,提醒用户你现在需要降速了,或者提醒用户你发烧了,该去看医生了。这就是一个非常好的标签,因为它已经加速了我们处理的速度,直接帮忙我们去做决策。

下面举一个例子,我们进一步来看一下标签的作用。

这个标签的作用也和后面要讲到的标签的流程相关。在这个地方,它分成了四个步骤,我们来看一下,它是怎么通过这几个步骤,一步一步地转化成标签,最终指导我们去做决策。

第一个步骤,就是最左边的一列叫做数据在线,数据在线指的是什么呢?就是我要通过数字化的转型,将我们的业务流程在线化,在业务流程中产生的数据,它就自然到线上,具备了让人不去处理的条件。

比如,以前我们在超市里面买东西,很难去统计每个用户买的什么东西,这样的话,你后续的分析也就很难进行。现在呢?很多人都在电商上买东西,购物环节的数据就在线了,以后可能随着越来越多的业务流程在线化,我们分析的内容也越来越多。

回到这个例子里,就是我的一个数据在线或者一个采购的过程,通过线上的购物,已经记录到我的系统里。

数据在线之后,我们第二个要做的就是去进行一个数据转成信息的过程。比如,我们现在看到这个用户叫王二妮,这个信息是什么呢?其实这个信息就是,比如说用户转化成信息,转化成什么样的信息呢?这个信息就是说在我的业务场景下,能够解读出来的内容。

我们在这个例子里面看到王二妮,它典型就是一个净化的文字,这个可能并不是一个非常直接的转换。但这也是我们在从数据到信息的过程中,也是要基于我们对于业务场景的理解,我们不仅需要直接地分析数据、转换数据。其实,我们还可以给这些数据附一些新的信息,这个就是我们所谓信息的转换,以及我们的信息的一个争议。

第三步,就要把我们的信息转换成标签了。比如我们可以通过一些规则的设定,当我看到这个信息的时候,我们就可以判断,大概率90%以上这个人就是一个女性,叫王二妮。所以这个时候,我可以给她一个标签,一个应该算是一种性别的标签,比如这个例子里面给了她一个标签,叫做女性。

第四步,就是我怎么样根据这个标签去产生一个决策。在这个标签里面,我就是产生一个决策,在后续和这个用户去沟通的时候,我更可能用一种妈妈性的沟通方式和称呼。为什么会有这个决策呢?就是因为我们发现她购买婴儿奶粉。

在电商的场景中,我们的一个用户购买了一款婴儿奶粉,我们接下来该如何去跟她互动,在做这个决策的过程中,就结合她的性别标签,我们可能会去判断大概率是一个妈妈,就应该使用妈妈性的沟通方式和称呼去和她沟通。

这里会不会有一些错误?那当然会有,比如我买的这个东西是帮别人买的,也可能会有这种情况发生。

不过,我们还会进行更深入地分析,比如我们看到她买过的是三段奶粉,就意味着可能不是一种新生儿奶粉,一般小孩儿到一两岁的年纪,也不会有人再去看他的时候,去送奶粉了,通常刚出生的时候,可能性会比较大。

所以,我们通过结合多种标签,将他们去结合起来,帮助我们去做出决策,就是适合用一种什么样的方式去沟通。

在这个环节中,我们并不要求这个决策100%是正确的,因为在大多数的业务里面,我们只需要它给我们推荐,至少会让我们去尝试一下。

未完待续……敬请关注《比你更了解你,浅谈用户画像(三)》


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/8934136.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-23
下一篇 2023-04-23

发表评论

登录后才能评论

评论列表(0条)

保存