用户画像的标签体系_工具

一、为什么需要标签？

随着互联网的兴起，每天有大量的内容以视频等形式被生产并上传到各大平台，面对海量的内容，如何提升这些内容的智能分发效率是各大平台面临的重要课题。

而要实现这一目标，第一步就是更好地认识我们的用户。构建用户画像的过程的本质就是对用户信息进行标签化管理的过程。通过标签体系的建设，一方面让数据变得可阅读、易理解，方便业务使用；另一方面通过标签类目体系将标签组织排布，以一种适用性更好的组织方式来匹配未来变化的业务场景需求。如何合理规划标签体系对产品的运营影响非常大，因此，标签是产品策略中特别关键的一环。

二、标签是什么？

对于标签的定义在不同场景中往往是不同的，太纠结或执着于单一概念定义，会无法推进实际的业务和工作。我们所有的技术和业务层面的工作是为了业务目标，并且要实用和适用，并不是纯学术层面的研讨。

一般来说，我们认为标签是指 “利用原始数据，通过一定的加工逻辑产出，能够为业务所直接使用的可阅读、易理解、有业务价值的数据。”

标签体系有两种组织方式：结构化标签和半结构化/非结构化标签。

所谓结构化标签是按照某个分类法制定一个层次标签体系，其中上层的标签是下一层的父节点，在人群覆盖上是包含关系。一些面向品牌广告的受众定向往往采用这种结构化较强的标签体系。需要指出，这一体系中的标签是根据需求方的逻辑而制定，某些在媒体方意义很大的分类标签，如军事等，由于没有明确的需求对应，不宜出现在标签体系中。

另外一种兴趣标签的组织方式，是根据具体需求设置相应的标签，所有的标签并不能为同一个分类体系中所描述，也不存在明确的父子关系。这种半结构化或非结构化的标签体系往往包含一些比较精准的标签的集合，因而主要适用于多种目标，特别是效果目标并存的对内容精准投放的诉求。

选择结构化兴趣标签体系还是非结构化的兴趣标签体系更多地是基于业务场景的决策，当标签仅仅是投放系统需要的中间变量，作为CTR预测或者其他模块的变量输入时，那么结构化的标签体系其实是没有必要的，应该完全按照效果驱动的方式来规划或挖掘标签，而各个标签之间也不太需要层次关系的约束。

还有一种特殊的标签形式，关键词。直接按照搜索或浏览内容的关键词划分人群和投放广告，往往可以达到比较精准的效果。关键词这种标签体系是无层级关系、完全非结构化的，它虽然很容易理解，但并不太容易 *** 作。不过由于搜索在互联网中的重要地位，选择和优化投放关键词这样一项专门技术已经发展得相当充分，因此这种标签也是实践中常用的。

三、如何构建标签体系？

1确定对象

进行标签建设，首先要清楚对哪类对象建设标签，也就是确定对象。对象是客观世界中研究目标的抽象，有实体的对象，也有虚拟的对象。在企业经营过程中可以抽象出非常多的对象，这些对象在不同业务场景下交叉产生联系，是企业的重要资产，需要全面刻画了解。

经过对多个行业、多个标签体系建设经验的总结，可把对象分为 “人”“物”“关系”三大类。三种对象是不一样的，“人”往往具有主动性和智慧，能主动参与社会活动，主动发挥推动作用，往往是关系的发出者。“物”往往是被动的，包括原料、设备、建筑物、简单 *** 作的工具或功能集合等，是关系的接收者。当常规意义上的设备具有了充分的人工智能，变成了机器人，那么它就属于“人”这一类对象。“人”和“物”是实体类的对象，即看得到、摸得着的对象，而“关系”属于一种虚拟对象，是对两两实物实体间的联系的定义。因为关系很重要，企业大多数情况下反而是在对关系进行定义、反复发生、记录、分析、优化，因此需要“关系”这种对象存在，对关系进行属性描述和研究。关系按照产生的动因不同，又分为事实关系和归属关系，事实关系会产生可量化的事实度量，归属关系只是一种归属属性。

明确了对象的定义和分类，就可以根据业务的需要确定要对哪些对象建立标签体系。基于内容的对象非常多，不可能对所有对象都建立独立的标签体系，一般我们会根据业务流量的需求，稿件数量的多少，类目的相似性，类目间的关系进行排名，确定标签的优先级和必要性。

2设计框架

一般来说，互联网产品需要使用的标签类目数量非常庞大，当标签项超过一定数量时，业务人员要使用或查找标签就开始变得麻烦，管理标签也会变得困难。因此笔者借鉴了图书管理学中的经典方法：海量图书需要有专门的图书分类体系对书本进行编号并按照编号分柜排放，阅读者在查阅图书时只需要按编号索引即可快速找到自己所需图书，图书管理员也可以方便、有效地理清所有图书状况。

构建标签类目体系首先需要确定根目录。根目录就是上文提到的对象，因此有三大类根目录：人、物、关系。根目录就像树根一样直接确定这是一棵什么树。

如果根目录是人，即这个标签类目体系就是人的标签类目体系，每个根目录都有一个识别列来唯一识别具体对象。人这种大类下包括自然人和企业法人两种亚根，同时自然人群体或企业法人群体也可以认为属于人的对象范畴内，也是亚根。自然人实例可以有消费者、员工、加盟商等，因此可以形成消费者的标签类目体系、员工的标签类目体系、加盟商的标签类目体系。同样法人也可以细分为实体公司、营销公司、运输公司等。从最大的“人”根目录、到“自然人/法人/自然人群体/法人群体”亚根，再到实例“用户/员工/加盟商”，都属于根目录的范畴。

根据类似的方式，也可以将物细分为“物品”“物体”“物品集合”“物体集合”等亚类，各亚类下也可以细分根；关系也可以细分“关系记录”“关系集合”。

标签类目体系是对业务所需标签采用类目体系的方法进行设计、归属、分类。类目体系本身是对某一类目标物进行分类、架构组织，分类通常使用一级类目、二级类目、三级类目等作为分类名。

类目结构可以用树状结构来比拟，根上长出的第一级分支，称为一级类目；从第一级分支中长出的第二级分支，称为二级类目；从第二级分支中长出的第三级分支，称为三级类目。一般类目结构设为三级分层结构即可。没有下一级分类的类目叫叶类目，挂在叶类目上的具体叶子就是标签。

需要注意的是，类目框架的建设一般是基于业务展开的，因为类目体系存在的核心意义即为帮用户快速查找、管理数据/标签。

下图为某银行构建的客户标签类目体系，其中客户是根目录，会由custom_id来进行唯一识别，根目录下有“基本特征”“资产特征”“行为特征”“偏好特征”“价值特征”“风险特征”“营销特征”等一级类目。“基本特征”一级类目下又分“ID信息”“人口统计”“地址信息”“职业信息”等二级类目。“地址信息”二级类目下再细分为“账单地址”“家庭地址”“工作地址”“手机地址”等三级类目。“账单地址”三级类目下挂有“账单详细地址”“账单地址邮编”“账单地址所在省”等标签。

标签类目设计完成，整个标签体系的框架就有了，接下来要做的就是往每个叶类目下填充有业务价值并且可以加工出来的标签，进而完成整个标签体系的设计。

3填充内容

通过标签类目设计，已经有了某类对象的标签体系框架，只是还没有具体的标签内容。标签设计就是设计合适的标签并将其挂载到标签类目。在这一部分，笔者将尽量脱离技术视角，从产品视角出发，剖析如何“制作标签”。

首先，是如何拆解内容。对内容的拆解首先还是分为三个部分：“用户”“内容”“关系”，作为根目录。接下来，关于“人”这个部分，我们可以拆分为：人口属性、兴趣属性、行为偏好、发表时间等；同理，关于内容，我们可以拆分成“统计类”、“质量类”、“向量类”。接着，我们再对二级类目进行拆分，比如“统计类”中包含“点击率”“时长”“完播率”“转评赞”“跳出率”等。

要特别注意的是，往常习惯给别人打标签、贴标签的动作，其实不是在设计标签，而是在设计特征值。例如对某个人的定义“女、20～30岁、白领、活泼开朗”，分别是性别、年龄段、职业、性格标签的具体特征值。

这些特征会进行一定的交叉，赋予这个特征更多的含义。比如说使用用户画像和内容画像做交叉，可以得到用户的长短期的兴趣匹配、Session兴趣泛化匹配、用户年龄对于某些内容类别的偏好、用户性别对于某些内容类别的偏好等。如果拿用户特征与请求的上下文进行特征的交叉，则会得到用户常驻地在什么地方、用户的兴趣随时间的变化，比如有的用户会在早上看新闻，而在晚上看一些娱乐类的资讯；还有一些场景的刻画，如用户喜欢在地铁上看视频，而在办公的时候喜欢看图文。通过这些特征值组合，我们可以尽可能高效地对用户群进行划分，从而实现内容的精准分发。

现在，我们知道了如何建设标签体系以及如何通过标签体系对用户群进行划分，但想要做好标签，我们不仅要从需要解构技术，还要立足于“好的内容”。在这一部分，笔者将通过运营&创作者的视角简单分析如何制作“好的标签”。

要想制定能够打动人心的标签，首先要了解用户，切中他们的痛点。

如何才能了解用户？一种办法是角色转换，换位思考，把自己看作用户，而且是什么都不懂的“小白用户”，以这样的视角去看问题、去思考。

举个例子，你作为一个UP主，接了一份宣传“降噪耳机”的营销单，你的任务是让用户下单，完成内容的价值转化。思考一下，该怎么设计这个故事？

下面的一段参考文案：你在银行做经理，维护客户关系很艰难，你的职位不上不下。你有房贷和车贷，每月按揭五千元。你孩子的数学成绩不好。你老婆在市人民医院做护士，她母亲有尿毒症并透析多年，她不爱你。你年轻的时候觉得能成一番事业，但现在也就这样，朋友们混得都比你好。生活太糟了，你需要一个独立的环境抒发情绪，这时候你戴上了降噪耳机。

这就是一个典型的“用户视角”，它描述的是一个场景，它让你一边看一边产生强烈的代入感，不由自主受到内容的感染，产生情绪波动，在情绪的驱使下完成下单的行为，实现价值转化。

除了上面这种基于内容体验的打标方法，还有另一种方式，也就是我们之前提过的“特征值”，基于算法生成的高精度内容标签，一般是基于视频帧、标题、作者、内容属性、地理属性、时间等。这些由算法生成的内容标签可以替换人工标注，从而节省人力成本，提高内容标签生产效率。目前的内容标签技术，其精度已经达到了90%以上，通过算法对内容的分析自动生成一些标签值。

比如上面这个视频，所生成的标签值就可能是“中华田园犬”“农村”“百万播放”“狗”“华农兄弟”“萌宠”“动物”等。

经过对象确定、框架设计、类目设计、标签设计、打标这几个步骤，我们就完成了整个标签体系的建设，文章写得比较简单，全当抛砖引玉。

四、一些问题

在标签体系落地的过程中我们还会遇到很多问题，以下几个问题也是笔者一直在思考的。如果有任何好的建议可以加笔者微信一起交流：shmusk

内容的时效性：任何一个内容，包括视频或者图文，是有生命周期在里面的，内容有长有短，其中预测一个内容的生命周期是一个挺难的事情，不论通过算法也好或者其它技术也好；假设我们已经知道内容的生命周期，如何在有效的周期内给予内容有效的曝光量，也是个很难的问题。如何Balance这两个问题，时效性是非常重要的，因为过了内容的生命周期，再给用户推荐，是没有意义的，用户体验会非常差。

内容质量的判定：怎样判定一个内容质量到底是好还是坏，好的标准到底是什么，以及我们如何去建模，如果可以建模，特征是什么，以及我们的模型如何有效的利用特征去判别？

冷启动问题：分为内容冷启动与用户冷启动。内容冷启动就是一个新内容进入平台，没有被分发出来；而用户冷启动就是一个新的用户，交互数据和行为非常的稀疏，如何做比较好的推荐、能够引导进行后续更加稠密的交互，增加粘性，以此来提升用户体验，更好的满足用户的需求？

作者介绍

@王志杰

明略科技的大数据架构师；

毕业于北京大学计算机科学与技术专业。

往期回顾：

比你更了解你，浅谈用户画像（一）

02 为什么要做用户画像？

前面所讲的内容，是对于画像进行了理论上的定义和直观上的认识。

我们知道画像后，为什么要去构建画像？构建出来有什么用呢？下面和大家分享一下我的看法。

首先，我们从理论上去分析一下，具体分为业务和技术两个方面。业务层面上，我们通过用户画像可以构建一个具象的认知，构建战略和战术的方向。同时，也可以去探索用户的足迹，形成以用户为导向的方向。

具体是什么意思呢？就是构建具体认知，构建战略、战术方向。其实就是说，我们为了在这个层面跟核心用户，达成一个统一和具象的认识。达成了认识之后，我们才方便在后续的投入上面能有的放矢，至少我们知道应该向哪个方向投入。

当我们在为用户去设计产品的时候，我们必须要清楚的知道用户长什么样子，他有什么行为的特征，有什么样的属性特征。这样我们才能以用户为导向。所以，我们根据用户画像的信息去做产品设计，这样才是为我们公司提出战略和战术层面的指导。

探索用户的足迹形成用户的导向，其实是说在我们详细的了解了真实用户，他是如何和产品的相关内容进行互动后，我们才能进一步的深化产品。当我们对用户进行画像的时候，我们一定要从业务场景出发，带业务场景目标，去解决实际的一个业务问题。

比如，我们要去进行画像，要么就是去获取新用户，要么就是去提升用户体验，再或者可能就是去挽回一个流失用户。总之，我一定是有一个非常明确的目标。这些是从业务上去构建用户画像一些必要性而做出的努力。

从技术层面上来讲，我们通过用户画像的构建，可以帮助去构建底层的数据基础，来服务上层的应用。同时，也是在某些层面上方便信息的处理。

为什么呢？用户画像除了可以做直观的展示之外，更多的是服务一些上层的应用。其实刚刚几位老师也提到过，比如在推荐系统里，用户画像是可以做推荐系统非常重要的一环而存在，它对推荐的效果有较大的提升。

另外，像刚刚提到的在金融里面的应用，用户画像也可以应用在风控的应用里，做一些规则特征来存在，来量化系统等级。

所谓方便信息的处理，其实是说我们标签之后，计算机就可以方便地来处理一些量化的需求。

比如去做一些分类统计，某个视频网站上最近比较火的脱口秀，希望知道看脱口秀大会的用户到底有多少，男女比例是多少；或者可以去做数据挖掘，喜欢买榴莲的用户，通常他们喜欢的是什么服装品牌；或者经常买咖啡、又买大蒜的用户，他们的年龄分布是什么样子。等等。可以帮我们去做一些量化分析。

总之，用户画像可以完美地抽象出一个用户的信息全貌，这是企业应用大数据的根基。

用户画像可以帮助企业，为用户提供个性化的产品和服务。我们也总是在说千人千面，每个给客户提供服务的企业，最终的目的都是，当用户打开产品、打开APP或者网站时，他看到的内容和得到的体验，都是针对他来设计的，或者说符合他的调性。只有这样，他的体验才会有一个真正的提升。

下面给大家举个例子，结合明略的用户画像和营销自动化的场景，举一个画像支撑业务的非常浅显的例子。

当我们想要举行一场营销活动的时候，可能不会面向所有的用户群体，就是针对某一类具有一定特征的用户来进行。

首先，我们就会用到用户画像，根据我们对于用户的画像，或者根据用户构建的标签，去进行人群的圈选。

根据业务上的条件，去确定用户群体，我们就可以在群体里面通过条件把它圈选出来。比如这个例子里面，就是通过一个消费行为的标签，把360天内都没有购买过的用户圈出来。

当真正去做营销活动的时候，我就可以在营销自动化产品里面，在规划和实施营销活动的时候，将刚刚筛选出来的用户群体作为标准群，就是我画红圈的部分。我们就可以轻松地实现定向的营销。

总体来讲，画像作为一个整体，它到底有什么作用？刚刚提到画像、标签，它其中有几个联系。下面具体来谈一谈标签，标签到底有什么样的作用？为什么会有这么大的重要性？

标签可以将数据及其含有的信息转化成带有明确的可决策行为的指导。“人”参与决策越多的地方，越需要将数据/信息进行标签化，以提升人对数据的理解和处理效率，实现人机协同。

这个总结出来的具体是什么含义呢？我们可以来详细地交流一下。

我们来观察一下这些所谓的数据产品，比如营销领域的DNT、CPP，或者大家不太熟悉的话，我们可以举一些通用的例子，比如BI等等，这些数据产品的特征，就是怎么样用数据让人们去产生快速地理解。

举一个具体的例子，当前的疫情的环境下，可能有一个大家经常会遇到的标签，我们在测体温的时候，如果超过37度，可能就是发烧了，就需要去看医生，我们可能就会被带走隔离，这个点就是一个重要的标签，就是一个发烧点。

再比如开车的时候，如果时速超过120码，我的导航上的显示就变成红色了，这个也是一个非常重要的标签，它就会告诉我，说我超速了。

所以，我们在日常生活中，总是遇到一些特别底层的标签，比如说到某个标签，我就能知道去怎么做，或者下一步该怎么走。比如我看到超速了，就知道该把速度降下来了。

再从另一个角度来看一下，为什么需要去做标签？比如说我们现在的各种新闻类或者短视频类的APP，他们的背后都有一个非常好的推荐，这些推荐可能不需要标签。比如它知道你喜欢这个东西，它就推给你看，然后你去看，它可能再给你推荐另外一个，可能你又看了。

当所有的这些数据由机器去处理的时候，它可能不需要理解是什么，因为它有大量的用户的反馈数据去帮它做决策，它就可以不断地去刷新、去训练模型。

但是如果某些场景中是需要人参与做决策，也就是说人参与决策的地方越多，我们就越需要将数据进行标签化。为什么呢？因为人处理信息就没有办法像机器通过大量的预算，毕竟人处理的信息是有限的。

所以，为了快速地让人对数据进行理解，可以去提升处理效率，最终实现人机协同。我们用标签的目的，就是为了把大量的数据验算完的结果，通过信息的标签化，变成快速去理解，快速去做决策的一个形式。

就像我们刚刚提到的，在数据产品里，如果可以把数据变成一个明确的标签，提醒用户你现在需要降速了，或者提醒用户你发烧了，该去看医生了。这就是一个非常好的标签，因为它已经加速了我们处理的速度，直接帮忙我们去做决策。

下面举一个例子，我们进一步来看一下标签的作用。

这个标签的作用也和后面要讲到的标签的流程相关。在这个地方，它分成了四个步骤，我们来看一下，它是怎么通过这几个步骤，一步一步地转化成标签，最终指导我们去做决策。

第一个步骤，就是最左边的一列叫做数据在线，数据在线指的是什么呢？就是我要通过数字化的转型，将我们的业务流程在线化，在业务流程中产生的数据，它就自然到线上，具备了让人不去处理的条件。

比如，以前我们在超市里面买东西，很难去统计每个用户买的什么东西，这样的话，你后续的分析也就很难进行。现在呢？很多人都在电商上买东西，购物环节的数据就在线了，以后可能随着越来越多的业务流程在线化，我们分析的内容也越来越多。

回到这个例子里，就是我的一个数据在线或者一个采购的过程，通过线上的购物，已经记录到我的系统里。

数据在线之后，我们第二个要做的就是去进行一个数据转成信息的过程。比如，我们现在看到这个用户叫王二妮，这个信息是什么呢？其实这个信息就是，比如说用户转化成信息，转化成什么样的信息呢？这个信息就是说在我的业务场景下，能够解读出来的内容。

我们在这个例子里面看到王二妮，它典型就是一个净化的文字，这个可能并不是一个非常直接的转换。但这也是我们在从数据到信息的过程中，也是要基于我们对于业务场景的理解，我们不仅需要直接地分析数据、转换数据。其实，我们还可以给这些数据附一些新的信息，这个就是我们所谓信息的转换，以及我们的信息的一个争议。

第三步，就要把我们的信息转换成标签了。比如我们可以通过一些规则的设定，当我看到这个信息的时候，我们就可以判断，大概率90%以上这个人就是一个女性，叫王二妮。所以这个时候，我可以给她一个标签，一个应该算是一种性别的标签，比如这个例子里面给了她一个标签，叫做女性。

第四步，就是我怎么样根据这个标签去产生一个决策。在这个标签里面，我就是产生一个决策，在后续和这个用户去沟通的时候，我更可能用一种妈妈性的沟通方式和称呼。为什么会有这个决策呢？就是因为我们发现她购买婴儿奶粉。

在电商的场景中，我们的一个用户购买了一款婴儿奶粉，我们接下来该如何去跟她互动，在做这个决策的过程中，就结合她的性别标签，我们可能会去判断大概率是一个妈妈，就应该使用妈妈性的沟通方式和称呼去和她沟通。

这里会不会有一些错误？那当然会有，比如我买的这个东西是帮别人买的，也可能会有这种情况发生。

不过，我们还会进行更深入地分析，比如我们看到她买过的是三段奶粉，就意味着可能不是一种新生儿奶粉，一般小孩儿到一两岁的年纪，也不会有人再去看他的时候，去送奶粉了，通常刚出生的时候，可能性会比较大。

所以，我们通过结合多种标签，将他们去结合起来，帮助我们去做出决策，就是适合用一种什么样的方式去沟通。

在这个环节中，我们并不要求这个决策100%是正确的，因为在大多数的业务里面，我们只需要它给我们推荐，至少会让我们去尝试一下。

未完待续……敬请关注《比你更了解你，浅谈用户画像（三）》

先说说“用户画像”这个词，它对应的英文有两个：Personas 和 User Profile。Personas 属于交互设计领域的概念，不在本文讨论范围内，请出门右转去找交互设计师们聊，留下来的人，我们聊聊 User Profile 这种用户画像。

User Profile 原本用于营销领域。营销人员需要对营销的客户有更精准的认识，从而能够更有针对性地对客户和市场制定营销方案。

这个理念本身没有错，但是有一个问题：传统营销领域，是以市场销售人员为第一人称视角去看待客户的，也就是用户画像为营销人员服务。

在这种用途下谈论的用户画像，和我们即将在推荐系统领域谈论的相差有点大；但是很遗憾，今天在媒体上看到的大多数“用户画像”案例分享，都停留在这个意思上。

比如最常见的用户画像出现在高大上的 PPT 上：用标签云的方式绘制一个人的形状，或者在一个人物形象旁边列出若干人口统计学属性，以此来表达“用户画像”这个概念。

看上去非常酷炫，但是我得悄悄告诉你一个赤裸裸的真相：越酷炫的用户画像越没什么用。

既然是给机器看的，那么画像是不是酷炫、是不是像、维度是不是人类可读，都不重要。那它到底是个什么样子呢？先别急，听我慢慢讲。

一个推荐系统来到这个世界上，它只有一个使命，就是要在用户（User）和物品（Item）之间建立连接。

一般方式就是，对用户和物品之间的匹配评分，也就是预测用户评分或者偏好。推荐系统在对匹配评分前，则首先就要将用户和物品都向量化，这样才能进行计算。

而根据推荐算法不同，向量化的方式也不同，最终对匹配评分的做法也不同，在后面讲到具体推荐算法时你会看到这一点。

用户向量化后的结果，就是 User Profile，俗称“用户画像”。所以， 用户画像不是推荐系统的目的，而是在构建推荐系统的过程中产生的一个关键环节的副产品。

另外，通常大型推荐系统一般都分为召回和排序两个阶段，这个在后面我会专门讲到。

因为全量物品通常数量非常大，无法为一个用户（User）逐一计算每一个物品（Item）的评分，这时候就需要一个召回阶段，其实就是预先筛选一部分物品（Item），从而降低计算量，用户画像除了用于最终匹配评分，还要用在召回。所以，构建用户画像就要以这两个阶段为目的。

举个例子，我想去吃点夜宵，楼下有五家大排档，那么从推荐系统的思路来看，我怎么选择呢？

首先就是将五家大排档向量化，我暂定向量的维度有：

现在每一个大排档都有一个向量，我自己也要有一个对应的向量，就是你有多看中这三个元素：

这样一来就可以对五家大排档做匹配打分了，你很容易得出哪家大排档最适合。

假如我的向量是：

价格： 3 种类： 5 味道： 5

这就是一个大排档推荐系统的简单用户画像了，是不是很简单！

这里可以简单计算一下：每一个因素相乘后再相加，就得到每一个大排档的评分了。

接下来我来围绕这个大排档推荐系统的用户画像，看看建立用户画像的关键因素： 第一个是维度，第二个是量化。

首先我先来说说“维度”。

看前面这个例子，我定下来的几个维度：价格、种类、味道。这几个维度有三个特点：

当我们去给每一个大排档计算评分时，想象你是一台计算机，你读取了用户画像的“价格”取值为 3，再去取出一个大排档的“价格”评分，两者相乘，用户画像的维度“价格”和大排档的“价格”天然匹配上了。

因为是同一个名字；但是计算机很傻，你把大排档的这个维度换成“价钱”，它就不知道该如何是好了。

另一方面，对这三个维度，把两边同时换成 1、 2、3 或者 a、b、c 都是可以的，也不影响计算结果，计算机依然能够匹配上；所以用户画像的维度不一定需要人类能够理解，只要计算机能把两边对应上就可以了。

假如是根据用户的阅读历史挖掘阅读兴趣标签，那么我们无法提前知道用户有哪些标签，也就不能确定用户画像有哪些维度，所以第二点也不是必须的。

因为这一点也不是必须的，用户画像的维度个数可以不用确定。理论上来说维度越多，画像越精细，但带来的计算代价也是很大的，需要权衡。

虽然这里以标签作为例子，但是你要注意，用户画像是向量化结果，而不是标签化。标签化只是向量化的一种，因为向量的维度不一定需要人理解。

我们这里的量化都是主观的，而在实际生产系统上，用户画像每个维度的量化，应该交给机器，而且以目标为导向，以推荐效果好坏来反向优化出用户画像才有意义，像这里这个简单的例子，没有去管推荐效果而先行主观量化了每一个维度，是大忌。

所以用户画像的量化是和第三个关键元素“效果”息息相关的。前面已经说过，不要为了用户画像而用户画像，它只是推荐系统的一个副产品，所以要根据使用效果（排序好坏、召回覆盖等指标）来指导用户画像的量化。

再来整体说说怎么构建用户画像，按照对用户向量化的手段来分，用户画像构建方法分成三类：

直接使用原始数据作为用户画像的内容，如注册资料等人口统计学信息，或者购买历史，阅读历史等，除了数据清洗等工作，数据本身并没有做任何抽象和归纳。这就跟查户口一样，没什么技术含量，但通常对于用户冷启动等场景非常有用。

方法就是堆积历史数据，做统计工作，这是最常见的用户画像数据，常见的兴趣标签，就是这一类，就是从历史行为数据中去挖掘出标签，然后在标签维度上做数据统计，用统计结果作为量化结果。这一类数据贡献了常见的酷炫用户画像。

就是用机器学习方法，学习出人类无法直观理解的稠密向量，也最不被非技术人员重视，但实际上在推荐系统中承担的作用非常大。

比如使用潜语义模型构建用户阅读兴趣，或者使用矩阵分解得到的隐因子，或者使用深度学习模型学习用户的 Embedding 向量。这一类用户画像数据因为通常是不可解释，不能直接被人看懂。

我会在后面专门讲解这些技术手段，以及它们在推荐系统中的实际使用。

现在总结一下今天的内容：

用户画像分析就是基于大量的数据，建立用户的属性标签体系，同时利用这种属性标签体系去描述用户。

可以运用营销自动化微信用户标签库来给用户打标签，“标签“就是带有特定含义用于描述真实的用户自身带有的属性特征。“标签”相较于其他用户画像基础要素来说，标签可以是动态的，通过动态的社交活动行为，例如：搜索、浏览、评论、点赞等构建出3D的用户画像。

通过对折叠屏手机用户的标签数据分析，可以得知用户的购物偏好特征和生活属性，从而品牌可以更针对性地展示不同用户想看的内容，还有为以用户需求为导向的产品研发，提供数据支持。

用户画像基本要素

1、地域

即用户所在的地理位置，不同城市的生活消费形态也是不同的。普遍一二线城市的居民平均收入要比三四线城市的居民平均收入要高一些。

2、性别

性别也是对消费需求影响较大的因素之一。参考该要素来宣传产品或服务，能够大大提高品牌的营销效率。

3、年龄

即用户的社会角色，每个年龄段的用户社会角色也不同，感兴趣的商品特性也不同。

4、受教育程度

受教育程度不同的用户对营销内容的要求也会不同，对于生活的态度和关注的事情也不同。

5、行业特征

了解用户所在行业，对产品或服务的关注点不同。

用户画像最核心的组成部分其实是其中所包含的用户标签，用户标签其实可以理解成用户特征的一系列符号表示，每个标签可以理解成认识用户的一个角度。用户画像其实是标签的集合，每个标签之间都有一定的联系，整体上看各个维度的标签组合到一起形成了一个完整的用户画像。所以说用户画像其实可以用标签的集合来表示。

1Persona 人物角色

Persona是用来描绘一个抽象自然人的属性，这种感觉有点像实例化的一个对象，Persona具有一定的代表性，在市场运营的过程中我们会用Persona做什么？首先我们在做产品研发或者内容产出的时候，要最优先设定一个Persona，此后这个人就会不断的出现在脑海中，这个人物角色会指导我们一切工作，我们产品和内容就是为这个人为创造。

2 、Profile

Profile指的是用户信息标签化，通常应用于运营和数据分析中，企业通过数据分析平台（易观方舟）搜集用户搜集用户的基础属性、社会属性、产品事件行为等信息，刻画一个用户的全貌，得到较完整的用户标签信息后，运营人员可以按照标签分群进行精准定向营销。

3 、受众定向

很多人在谈论用户画像的时候，其实并不是在以上两者可能之间，他们只是隐约觉得自己说的事情可能跟用户画像相关，这个时候就要去剖析原始诉求，比如，有个客户是想知道我的用户在哪，我要去那个地方投广告，做内容营销。那么我想知道我的用户画像是什么？这个时候我们就可以明显感觉到用户要知道的是受众定向，而不是用户画像，方向不同是完全不同的。

4 、单用户档案和用户行为

对于营销和运营来说，用户档案和用户行为的应用和persona完全不同，persona是为了抽象的用户示例，用来进行标尺。而用户档案是Marketingdatabase用来存储用户信息的核心数据，用户行为更是洞察用户，精细化运营的必要数据。

我们在讨论用户画像的时候，一定要知道自己要的是什么，并且根据自己的需求进行用户画像的应用，组合几种用户画像经常出现的场景，可以更好的了解用户、更精准的人群投放、和更聚焦的产品内容创作。

用户画像是什么？

为什么要做用户画像？

在古代，通过画像识别一个人。在大数据时代，品牌通过用户画像，识别消费者，提高决策效率，实现精准营销。

画像画不好，无法取到识别人的作用。用户画像做不好，浪费财力和精力。

用户画像的定义品牌通过对用户社会属性、生活习惯、消费行为等数据信息的分析，高度精练后形成一个标签化的用户画像。简单理解，用户画像就是通过数据归纳运用，为客户贴标签。

构建用户画像四个维度

①性别区分

不同的性别有着不同的消费心理、不同的消费习惯、不同的品类要求、不同的支付习惯。

②用户年龄段

在我们接触的很多客户中，常把年龄段划分得很长，例如20岁-30岁、30岁-38岁等。

互联网时代，变化总是很快，五年一个阶段要比十年一个阶段更为精确。

③出入场所及时间用户经常出入的场所和在场所消耗时间，最能体现不同年龄段、不同职业、家庭构成、平均收入、消费需求等情况。

④社交属性

社交关系极大地影响着用户接收到的信息，分析用户从哪里接受信息，可以判断用户的关注点和兴趣爱好，甚至于价值取向。

以下三类情况

暂缓不做用户画像

1弄不清用户画像作用时

也画不出精准图像

2品牌发展初期

未形成稳定客户群

3未迈入精细化运营的B端产品

以上就是关于用户画像的标签体系全部的内容，包括:用户画像的标签体系、比你更了解你，浅谈用户画像（二）、推荐系统04：用户画像等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/9766830.html

用户画像的标签体系

发表评论

评论列表（0条）