20210202-1 大数据云计算介绍和基础(上)

iphone 有 3 个传感器 ,三星有 6 个传感器,每天都会收集大量数据

云计算可以理解为大数据的底层支撑

我国云计算规模,已经可以达到 四千三百亿元

 

一、大数据系统介绍

麦肯锡全球研究院 (MGI)

《大数据:下一个创新、竞争和生产力的前沿》

大数据是继传统 IT 之后 下一个提高生产率的技术前沿

麦肯锡公司是全球最著名的管理咨询公司,在全球44个国家和地区开设了84间分公司或办事处。麦肯锡目前拥有9000多名咨询人员,分别来自78个国家,均具有世界著名学府的高等学位。

 

什么是数据

数据(data资料)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。

数据是信息的表现形式和载体,可以是:符号、文字、数字、语音、图像、视频等

定位数据:北纬26度,东经106度;用数字和字母书写是:26°N,106°E.

定性数据:XX市XX路X号X单元号(靠近省委、十八中学、甲秀小学)

定量数据:建筑面积90,使用面积75

定时数据:建于1987年,1998年购置

信息数据:周矩,男,XX岁,电话13888888888

结论:估价45万

数据结合在一起形成某种结论,使用数据的意义就是产生某种结论

 

大数据概念

2008年,部分计算机专家首次提出大数据概念。

2009年,美国政府通过Data.gov网站开放政府数据。

2011年,麦肯锡公司发布《大数据:创新、竞争和生产力的下一个新领域》报告,大数据开始备受关注。

2012年,美国政府发布了《大数据研究和发展倡议》,标志着大数据已经成为重要的时代特征。

2013年大数据元年,数据成为资源,几乎所有世界级互联网企业,都将业务触角延伸至大数据产业。

2014年3月1日贵州·北京大数据产业发展推介会在北京隆重举行,贵州大数据正式启航

2015年9月5日,国务院印发《促进大数据发展行万门大动纲要》,大数据上升为国家战略

 

大数据与传统数据

传统数据: 

普查数据统计数据

抽样数据测量数据

例如:国民经济和社会发展统计公报

 

大数据有两层含义:一是海量数据,指其量大,或者称为全数据;二是指分析方法,指的是对所有数据进行分析

 

大数据到底有多大?

从Byte、KB、MB、GB、TB到PB、EB、ZB、YB。

·TB(1024GB-1TB) 2的40次方

·PB(1024TB=1PB) 2的50次方 100万G

·EB(1024PB-1EB) 2的60次方 10亿G

·ZB(1024EB-1ZB) 2的70次方 1万亿G

·15寸500G电脑(22亿台)排成行可以往返一次月球。

·YB(1024ZB-1YB) 2的80次方 1千万亿G

Intel:人类文明开始到2003年,地球共产生5EB数据。

2012年全年,全球产生数据2.7ZB是2003年以前的500倍。

2015年,全球估计产生数据8ZB,等于1800万个美国国会图书馆。

 

大数据的定义 

·大数据

指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

大数据分析相比与传统的数据仓库应用,具有数据量大、查询分析复杂等特点。

大数据是无法用几台服务器处理的,所以必须用分布式计算,大数据本身就是天然的分布式计算。

 

大数据的5V特点 (IBM提出)

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwsjjx.html