概述
三次信息化浪潮
技术支撑:
存储设备容量不断增加、CPU处理能力大幅提升、网络带宽不断增加
数据生产方式的变革
4V
大量化、快速化、多样化、价值化(价值密度低)
影响
在思维方式方面,大数据完全颠覆了传统的思维方式,全样而非抽样、效率而非精确、相关而非因果
两大核心技术
与云计算、物联网概念的区别

Hadoop
特性


架构和组件


HDFS

块

主要组件

NameNode

多副本冗余数据
三副本数据的存放策略

SecondaryName的冷备份作用

数据读取过程

数据写入过程

Hbase
为什么需要HBase

Hbase与传统关系数据库的区别
数据模型

主要组件

三层结构和Region的定位


系统架构

Region服务器原理

数据写入过程
缓存刷新

store的合并与分裂

HLog的作用
二级索引构建
Hindex方式
Redis+Hbase方式
Hbase+Solr方式
NOSQL数据库

兴起原因

与关系数据库的对比




四大类型数据库





理论基础
CAP

Hive




Spark










