那数据标签到底是什么?
它与数据分类体系相比,是“真的香”,还是“弱爆了”?
01. 概念的澄清
无论是在数据中台,还是传统产品设计中,绕不开的几个概念:分类、属性、标签。
1、什么是分类
分类,就是指按照种类、等级、性质或特征的归类。也就是把相同属性或特征的“对象”归集在一起,形成不同的类别,方便人们通过类别来对“对象”进行的查询、识别、管理和使用。“对象”可以是人、产品、物料或其他实体,例如:人可以分为男人、女人,也可以分为老年人、中年人、青少年。
2、什么是属性
属性是事物所具有的性质或特征,重点强调的是事物本身,例如:人的性别、身高、胖瘦、年龄、性格等都是人的属性。可以将某个事物的属性抽象出来作为事物的分类,如我们上边举的例子,男人、女人是按照性别属性对人的分类;老年人、中年人、青少年是按照年龄属性对人的分类。事物可以按照属性来分类,分类也是事物的属性之一。
3、什么是标签
标签,原意是标明物品的品名、重量、体积、用途等信息的简要标牌,例如:商品标签、图书标签、车检标签、文件标签、服装吊牌等。从这个概念衍生到网络标签,是人工
或系统自动或用户自发的,通过相关性很强的关键字对事物或内容进行描述,帮助人们分类内容,以便于检索和分享。例如:我们也可以给“人”这个对象打上男人或女人,老人或青年的标签。可见,标签也有维度或分类,而属性也是一种标签。
02. 分类VS标签,到底有啥区别?
前边的例子中,男人、女人,老人、青年,这既可以是对人的分类,也可以是人的标签。分类和标签有时候没有明确的分界线,分类可以作为一个标签,标签也可以抽象出分类。那么,分类和标签到底有什么不同?
关于这个问题,知乎上网友的一个回答挺有意思的:
分类由于只能隶属于一个,所以往往带有武断和不恰当的色彩,它是一个“is a”的问题,属于本质论的范畴,而对事物的“本质”的认定,严格来说,这事只有上帝才能做,换句话说,谁做都不合适。标签则不同,它是一个“has a”的问题,说某个东西有某种属性,要求就没那么严格了。
笔者理解:分类是一种严谨的数据组织方式,一般按照一个或多个维度自上而下、从整体到明细的穷举,遵循“相互,完全穷举” 的原则。而标签是一种灵活的数据组织方式,放弃大而全的框架,基于业务场景自下而上地倒推标签需求。
除此之外,分类和标签还存在如下不同点:
1、分类一般是面向团队或组织的,注重标准化;而标签可以面向组织,也可以是面向个人,注重的是个性化。
2、分类具有排他性,分类之间是的、不能交叉;而标签允许交叉,标签之间可以相互关联、相互依赖。
3、分类体系需要事先规划,在标准化的框架下进行使用;而标签可以静态的,也可以是动态的,允许随时添加。
4、分类注重结构化,具有层级控制,是一个树状结构;而标签的结构是松散、灵活、开放的,整体看是一个网状结构。
三级
二级
树状多级结构
网状结构
无主次去中心化
分主次从上到下
来源:PMCAFF产品社区《知识管理——如何使用印象笔记的多级目录标签做知识分类管理?》
03. 分类VS标签,哪个“香”?
在数字化应用中,分类和标签其实根本无法分出个伯仲。标签体系也需要一定的分类,而基于某个维度的分类也可以作为一种标签,只是他们支持的应用场景或有不同。
分类一直存在,它源于人的认知,可以追溯到人类的起源。
在几百万年前的原始部落,人们将打回来的猎物、采集回来的种子进行分类存放,以便存储和管理。分类的作用自然不必多说,它可以让我们条理清晰,层次清晰,一目了然的识别和管理事物。
即使在当今由互联网、计算机构成的数字化世界中,分类体系也一直是我们组织数据、处理数据、查询数据、管理数据的一个重要的手段。