您的位置: 首页 > 生活常识 >

信息的载体和具体表现形式是什么(数据、信息、数据库管理系统与数据仓库,你能分清吗?)

100次浏览     发布时间:2024-10-26 09:48:01    

麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”随着大数据时代的到来,各行各业都在使用大数据提升自身的竞争力,数据的重要性不言而喻。此前推文中介绍过的ChatGPT底层逻辑、神经网络、强化学习都是以大数据为基础运行输出的,那么组成大数据的数据和信息有什么区别和联系呢?大量的数据需要依托数据库储存以便使用,数据库管理系统与数据仓库,二者有哪些区别和联系呢?

一、数据与信息

首先从数据和信息的定义角度认识这两个词。数据(data),是指尚未被整理成人们理解和使用的形式之前的表示,即发生于组织或组织所处环境中的原始事实的符号串。信息(information),是指已被转化为对人有意义和有用的数据。在大数据时代,我们可以获得很多数据,数据量大(volume)也是大数据的特点4V(Value、Variety、Volume、Velocity)之一,在大量的数据中我们更希望获得的是信息,因为只有当数据转化为信息才能参与到决策中进而创造价值。

虽然数据转化为信息才能够创造价值,但是信息离不开数据。数据是信息的载体,是信息的具体表现形式;信息是数据的含义,需要经过数字化转变成数据才能存储和传输。他们是形与质的关系,两者密不可分。我们可以通过下面的例子来区分数据与信息。超市收银台在扫描产品条形码时,源源不断地得到了数百万条数据,汇总并分析这些数据就会得到有意义的信息,哪些洗涤剂的销售量最高;瓶装水的月销售量是多少;糖果的周销售额是多少,这三条都属于信息。

信息会因场景而定,同一条信息不一定对所有人都是有用的,“有意义”和“有用”根据每个人的主观认识而定。例如上一段例子中“糖果的周销售额”,对超市的财务人员而言这是一条信息,对超市的顾客而言这只是一条数据。

二、数据库管理系统与数据仓库

首先从数据库管理系统和数据仓库的定义角度来认识这两个词。数据库管理系统(database management system,DBMS)是用来集中并有效管理数据,且可由应用程序存取数据的软件,分为关系型数据库管理系统、非关系型数据库管理系统和云数据库。数据仓库(data warehouse,DWH)是一个数据库,存储着决策者认为有潜在价值的当前和以往的企业数据。

数据库管理系统,主要是关于事务操作,可以进行基本的增、删、改、查等操作。数据仓库,可以进行数据分析,但只能查询、无法增删改,本质上是数据库管理系统的一种,但更好地支持了前端的分析,辅助管理决策。数据仓库从企业内多个业务系统中提取出当前和历史的数据,将其与外部的数据相结合,并通过纠正不准确和不完整的数据进行转换,被重新组织管理和分析,然后被加载到数据仓库中。

我们将数据库管理系统和数据仓库从数据处理类型、面向对象、功能实现等角度进行对比,总结见下表。


相关文章