信息的载体和具体表现形式是什么(数据、信息、数据库管理系统与数据仓库,你能分清吗?)
麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”随着大数据时代的到来,各行各业都在使用大数据提升自身的竞争力,数据的重要性不言而喻。此前推文中介绍过的ChatGPT底层逻辑、神经网络、强化学习都是以大数据为基础运行输出的,那么组成大数据的数据和信息有什么区别和联系呢?大量的数据需要依托数据库储存以便使用,数据库管理系统与数据仓库,二者有哪些区别和联系呢?
一、数据与信息
首先从数据和信息的定义角度认识这两个词。数据(data),是指尚未被整理成人们理解和使用的形式之前的表示,即发生于组织或组织所处环境中的原始事实的符号串。信息(information),是指已被转化为对人有意义和有用的数据。在大数据时代,我们可以获得很多数据,数据量大(volume)也是大数据的特点4V(Value、Variety、Volume、Velocity)之一,在大量的数据中我们更希望获得的是信息,因为只有当数据转化为信息才能参与到决策中进而创造价值。
虽然数据转化为信息才能够创造价值,但是信息离不开数据。数据是信息的载体,是信息的具体表现形式;信息是数据的含义,需要经过数字化转变成数据才能存储和传输。他们是形与质的关系,两者密不可分。我们可以通过下面的例子来区分数据与信息。超市收银台在扫描产品条形码时,源源不断地得到了数百万条数据,汇总并分析这些数据就会得到有意义的信息,哪些洗涤剂的销售量最高;瓶装水的月销售量是多少;糖果的周销售额是多少,这三条都属于信息。
信息会因场景而定,同一条信息不一定对所有人都是有用的,“有意义”和“有用”根据每个人的主观认识而定。例如上一段例子中“糖果的周销售额”,对超市的财务人员而言这是一条信息,对超市的顾客而言这只是一条数据。
二、数据库管理系统与数据仓库
首先从数据库管理系统和数据仓库的定义角度来认识这两个词。数据库管理系统(database management system,DBMS)是用来集中并有效管理数据,且可由应用程序存取数据的软件,分为关系型数据库管理系统、非关系型数据库管理系统和云数据库。数据仓库(data warehouse,DWH)是一个数据库,存储着决策者认为有潜在价值的当前和以往的企业数据。
数据库管理系统,主要是关于事务操作,可以进行基本的增、删、改、查等操作。数据仓库,可以进行数据分析,但只能查询、无法增删改,本质上是数据库管理系统的一种,但更好地支持了前端的分析,辅助管理决策。数据仓库从企业内多个业务系统中提取出当前和历史的数据,将其与外部的数据相结合,并通过纠正不准确和不完整的数据进行转换,被重新组织管理和分析,然后被加载到数据仓库中。
我们将数据库管理系统和数据仓库从数据处理类型、面向对象、功能实现等角度进行对比,总结见下表。
相关文章
-
二句三年得指的是什么意思(“苦吟诗人”贾岛)
2024-11-14 10:34:34
-
社会科学研究方法有哪些(社会科学研究方法导论)
2024-11-14 10:19:36
-
存款准备金利率下调对楼市的影响
2024-11-14 10:04:36
-
醍醐灌顶的意思及成语解释(“醍醐”是什么东西?)
2024-11-14 09:48:53
-
神秘集团公司——保利集团董事长是谁?
2024-11-14 09:34:03
-
海南社保查询方法(海南打工人如何查询自己的社会保险情况?)
2024-11-14 09:18:38