大数据是什么?
顾名思义,是海量的数据或巨量的数据。简单理解为:"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。
大数据有多大?
根据维基百科的定义,大数据的大小从TB级别到PB级别(1PB=1024TB,1TB=1024GB)不等。
这样说吧,传统的个人电脑,处理的数据,是GB/TB级别,TB、GB、MB、KB的关系:
1 KB = 1024 B (KB - kilobyte)
1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
大数据是什么级别呢,PB/EB级别。
其实也就是继续翻1024倍:
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
到目前为止,尚未有一个公认的标准来界定“大数据”的大小。换句话说,“大”只是表示大数据容量的特征,并非全部含义。
大数据是一个抽象的概念,对当前无论是企业还是政府、高校等单位面临的数据无法存储、无法计算的状态。
大数据的数据类型不仅仅是单一的文本以及便于存储、处理的结构化数据,还包括越来越多的非结构化、半结构化的异构数据(如网络日志、音频、图片、视频、地理位置信息等),大数据的容量是没有边界的。
大数据技术和传统的数据挖掘技术的本质不同,大数据处理速度快,数据呈爆炸性增长,需要数据处理的速度相应地提升,并要求对数据进行快速、实时地处理。在成都转行学习大数据,加米谷大数据培训,大数据开发零基础班正在报名中。
大数据的作用:挖掘数据价值。简单地说,大数据让数据产生各种“价值”,这个将数据价值化的过程就是大数据要做的主要事情。
主要体现在两个方面:
1、 帮助企业了解用户
2、 帮助企业了解自己
简单来介绍大数据的十大应用领域:
1.了解和定位客户
2.了解和优化业务流程
3.提供个性化服务
4.改善医疗保健和公共卫生
5.提高体育运动技能
6.提升科学研究
7.提升机械设备性能
8.强化安全和执法能力
9.改善城市和国家建设
10.金融交易安全性
除此之外,能够跨数据搜索且与特定事件或主题相关的所有可用信息也是至关重要的。
De Menezes解释到,ECM不是一个新概念,早在上世纪90年代它就已经出现了,并且带来了可跨越不同数据类型的弹性搜索,数据类型包括声音、视频和图像。并且发展到现在已经是颠覆性级别的了。
将所有的数据保存在一起,企业业务运行效率必然很低,企业希望数据可以被分类保存,不需要的数据可以及时被剔除掉,并且有相关审计实时追踪存储时间、访问权限以及处理权限的人员。这也是大数据目前面临的巨大挑战之一。
De Laporte总结到,数据是一个企业的必须品,每个公司员工都希望有权限访问它们,但是又不能对所有的员工开放数据访问权限,最好的方法就是企业内容管理和数字化。
最新评论