标签的类型及分类

“ 标签的分类,是理解用户标签、理解用户画像的基础。优秀的标签分类,将使得标签画像系统易于用户的使用。”

(1)用户自己填写的数据生成的标签

这部分标签是用户在注册产品或者在各个模块自行填写的信息。一般就是【性别】、【生日】、【真实姓名】、【居住地】、【身份证】等

例如下图是联想的官网,用手机号注册成功后,进入个人信息页面,可以看到各种信息的填写。

互联网早期,很多网站的注册比较麻烦,必填的信息项目较多,因此能拿到的数据也就多。但随着互联网红利的消失,用户的获取愈发困难,在注册阶段收集用户信息变得越来越简洁,目前绝大部分网站的收集就只保留了手机号,用手机号及验证码即可完成注册。后续则通过一些积分、优惠等方式激励大家主动填写。

【优缺点】这部分数据用来做标签,往往是最基础的。但存在的巨大的问题是标签覆盖度过低,有意愿填写的用户尝尝比例不过半。而且对于部分敏感信息,例如身份证、地址等,如果逼迫用户填写,用户经常会填写虚假信息。这对于后续标签画像而言,不太好用。除非是12306这种强制性的网站,对身份信息能保障。

(2)通过日志、数据库统计的用户行为,生成的统计指标

这类标签指标是最多的。

比如可以根据订单表,统计用户的订单金额;可以根据搜索表,统计用户的搜索次数……

【优缺点】这部分数据用来做标签,是比较客观的,用户的行为不会说谎。但存在的一个问题是,要对标签画像系统产生价值,需要较多的逻辑处理。例如,想给用户打一个【购买力高低】的标签,是统计最近7天的成交金额,还是最近30天的?是按照订单口径还是金额口径?是大于1万算高,还是大于1000就算高?这里都需要大量的逻辑。如果只是一个统计值,只能算是一个宽口径的半加工的标签,真正用起来的时候,存在一些障碍。

(3)通过算法生成的标签

算法,很万能。

这玩意就是,很多场景不得不用。比如,想打一个【准妈妈】标签。这时,你咋办?你想尽各种逻辑,比如最近有搜索宝宝装行为的、最近有买孕妇服的……很多特征都能反映【准妈妈】的特点,但是通过简单的逻辑,是无法实现的。这个时候,就扔给算法团队吧……他们会基于大量的特征,训练模型,最后打上【准妈妈】的标签。

【优缺点】算法标签的缺点很突出,就是费时费力,做一个标签的时间可能要一两个月,做统计标签都做了几十个了……但如果算法靠谱,效果常常也不错,对业务的价值往往也比较大。如果公司算法资源富裕,那就做吧!当然,要有业务价值哦~

(4)通过第三方采购、积累的

土豪的方式很简单,买!

比如采购点身份证信息、采购点用户的征信信息等等。

【优缺点】优点就是省事。缺点就是费钱,而且能买的标签通常都是比较通用的,一些个性化的,例如网站的访问频次等,也是不太好采购的。当然还涉及数据安全的风险。

二按照数据类型分类

按照数据类型,主要分为以下几类:

(1)数值型标签

刚才上文提到的【用户最近7天购买金额】、【用户近1天浏览天数】等,这些标签都是按照一定的规则统计生成的,均是数值型标签。其实本质上和指标没有太大区别。

【优缺点】按照不同的时间范围、不同的行为方式、不同的统计方式,可以组成大量的标签。数量虽多,但是价值密度很低。因此,在成熟的标签系统中,这类标签不会大量在计算,往往是用户创建了啥就用啥。优点是比较容易生成。

(2)单选型标签

这种标签可以是用户自己填写生成的,也可以是通过数值型标签进行加工,或者算法,生成的。

这类标签的最大特征,就是一个用户在这个标签中,只能有一个选项值。而且,和数值型标签的区别在于,单选型标签的选项值是可穷举的,是离散的。

例如:【用户的生命周期】,用户肯定是处于【成长期】、【成熟期】、【衰退期】、【沉睡期】其中的一个,不可能属于两个或者多个。

例如:【性别】

(3)复选型标签

和单选型标签的区别就在于,一个用户可以有多个值。

同样,复选型标签也是离散值,选项是可穷举的。

例如:【用户的收货城市】,用户可以有多个城市

(4)文本型标签

这类标签最大的特征,是不连续、且不可穷举。

例如,【用户常用热搜词】,每个用户都可以有自己的常用热搜词,但热搜词的数量是巨大的,不能像单选型标签或者复选型标签那样,几个、甚至最多几十个选项,就能覆盖所有。

为啥要进行这个分类呢?

其实主要是在标签系统中,用标签筛选人群的时候有用。不同数据类型的标签,在前端的交互是一定要有区分的。这个后续详细展开。

三按照业务场景分类这种分类方式,根据各自业务的不同,就见仁见智了。

这个分类,主要是用于标签系统的标签管理,按照业务方式进行组织标签类别,有助于用户的便捷使用。

比如电商中,按照主体不同,可以分为【用户标签】、【店铺标签】、【商品标签】。咱们一直在讲的,都是【用户标签】,因为这部分在各个行业都是通用的(都需要用户嘛!)

THE END
0.LabelHierarchies(六)标签生产时效性:标签生产的时间间隔,时间间隔越短,时效性越强。时效性对实时类标签尤为重要。 标签取值覆盖量:具有某标签的有效标签值的对象个体数量。由于每个对象个体的数据完善程度不同,同一个标签能覆盖到的对象群体不同。例如在用户信息中,有的用户登记有性别信息,有的用户没有登记,“性别”这个标签的取值覆盖量就是那些有性别有效取值(“男”或“女”; jvzquC41yy}/lrfpuj{/exr1r1k4cm=9:fh6dm
1.一文快速解锁:标签体系全流程jvzquC41yy}/7:hvq0ipo8ftvkimg8<696710qyon
2.标签体系,这么做才有实用价值标签体系,绝对是数据分析年度工作中,最值得摆在开年做的。因为它和所有工作都有关系,经营分析、投放分析、用户画像、推荐策略、商品运营……都得靠标签带动。 标签体系做得好,后续分析才有足够多素材,才能积累经验。标签体系做得差,白费功夫不说,后边做深入分析的时候还没有依靠。 jvzquC41dnuh0lxfp0tfv8|gkzooa<94:26728ftvkimg8igvcomu86448>47B>
3.一文看懂“标签体系”基础原理:开发思路,模型,业务价值标签体系,是数据分析工作的重要基建。经营分析、用户画像、推荐策略、商品运营、投放优化、用户运营……都和标签体系有关,今天一篇文章,跟大家讲清楚。文章较长,同学们记得先给陈老师点个赞,回来慢慢看哦。 理解标签含义 标签是有业务含义的分类维度。举个例子,领导想看高价值用户数量: 提前打了标签:看下本月高价值用户有多少? 没有标 jvzquC41o0ou3?=0eqs0c{ykenkra?=:2:?:0qyon
4.快手:由慢向快同粉丝层级创作者粉丝数量均能实现稳定增长,平台流量向中尾部倾斜反而有利于头部账号的增长。快手平台上,粉丝量在300W以下的创作者占比高达78.19%,粉丝量在100-300W的创作者是300-500W创作者的3.5倍。在快手300W粉丝量对于创作者来说是明显的门槛,快手中腰部创作者占比远高于行业平均,头部账号占比较少,这正是其流量jvzquC41ycrmu}wggvio0lto1cxuklqgu1972@:24
5.倾斜标签检测确保消费品上的标签位置正确,避免产品因质量问题召回或影响声誉。jvzquC41yy}/exlpgz4dp8j/et0kwiwuvxjg|4eqpyvonw/rtuewlyu1ngcgunpi/sbttnpi1ylg€jf/ngcgu2kpuvfe}nqp
6.连续数值变量的一些特征工程方法:二值化、多项式、数据倾斜处理二值化处理:将细粒度的度量转化成粗粒度的度量,使得特征的差异化更大。 特征多项式交互:捕获特征之间的相关性 数据分布倾斜的处理: log变化:log变化倾向于拉高那些落在较低的幅度范围内自变量的取值,压缩那些落在较高的幅度范围内自变量的取值,log变化能够稳定数据的jvzquC41yy}/ewgnqiy/exr1y|jM[8u1;8=24:90jvsm
7.供应tipn欢迎前来供应商网(https://www.gys.cn)了解深圳市艾克生科技有限责任公司发布的供应tip-n-tell人字形防倾斜标签 人字形倾斜指示器 防倒置标贴价格、厂家信息,产品和服务质量好,性价比高,为您节省采购成本!进网站查看卖家电话。jvzquC41yy}/eqnpc0io1lmcproo1<6:7:749<50jvsm
8.国际智库发展趋势特点与我国新型智库建设四川省社会科学院天府智库尽管目前我国政策研究与咨询类机构的数量不少,但没有形成各类智库竞争发展的良好环境。政府智库类机构尽管可以通过内部渠道对决策过程发挥特殊影响力,但政策研究与建议范围受限于政府指定的研究项目,利用研究成果传播和宣传政府采取的政策措施;大而不强,研究质量、学术独立性等都有待提高;比较脱离社会大众,社会公信力不jvzq<84yyy4tc|x0ep524?4552910jxrz
9.2)试管应略倾斜试管应略倾斜,(3)标签应向着手心标签应向着如图是某同学取用液体药品的操作装置图.请指出图中的错误之处.(1)瓶塞应倒放瓶塞应倒放,(2)试管应略倾斜试管应略倾斜,(3)标签应向着手心标签应向着手心.jvzq<84yyy422:5lkcpjcx3eqo5d|q}1ujoukhnfa29b3o=df2h3dA587:hcf>g8eelef@6e8
10.防倾斜标签TILTOKEEPLUS价格,厂家,求购,使用说明中国制造网(cn.made-in-china.com)为您提供中山沃克条码科技有限公司相关的公司及产品信息介绍,囊括了防倾斜标签 TILTOKEE PLUS价格、厂家、图片、使用说明等参数。想了解更加全面的防倾斜标签 TILTOKEE PLUS信息及中山沃克条码科技有限公司的公司信息就上中国制造网。jvzquC41ep4ncmj/kp3djrsc0eun1ptpi{ooi8uymqk{lu/VuxSqI[tQIqz7mvon
11.常规设置—KritaManual5.2.0文档你可以在此标签页配置光标显示的有关选项。 光标形状 选择在使用笔刷工具时显示的光标形状,只要光标移动到画布视图中就会一直显示在笔尖位置。你可以在选单中选择下列形状: 工具图标 显示当前工具图标,在使用笔刷工具时也显示一个笔刷图标。 箭头 显示常规鼠标光标。 准星 显示准星状十字线。 小圆圈 显示一个白底黑线jvzquC41fqit0twkvc4ptp4|jaIO1{jhgtkoendocp{bn8utghksgwhgu1mfpnwcnayfv}npiu4ivvq
12.R语言柱状图排序和x轴上的标签倾斜操作R语言这篇文章主要介绍了R语言柱状图排序和x轴上的标签倾斜操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用!【 如果你想靠AI翻身,你先需要一个靠谱的工具!】R语言做柱状图大致有两种方法, 一种是基础库里面的 barplot函数, 另一个就是ggplot2包jvzquC41yy}/lk:30pku1jwvkerf1;5:988/j}r