先说一下火车与动车

先来说一下我们来对比一下他们的最高速度:

  • 火车 – 160km/h
  • 和谐号 – 300km/h
  • 复兴号 – 400km/h

我们用一张图表来看一下

普通火车为什么没有高铁快?--分布式概念入门_服务器

普通的老式火车为什么这么慢?

  • 同上,我么画一张图来看一下:
    普通火车为什么没有高铁快?--分布式概念入门_分布式_02
    这样图表示:普通火车的动力全部都压在了车头一个人身上,就像我们平时所说:**要想火车跑的快,全凭车头带!**但是火车头的动力再足,拉着几十个车厢跑,也是很费力的!

我们来看一下高铁的动力是怎么输出的

普通火车为什么没有高铁快?--分布式概念入门_大数据_03
高铁的动力分布在了多个车厢中,也就是多个车厢一起发力!
这样设计有什么好处呢?

  • 1.如果一辆车厢的动力发生了故障,其余的车厢的动力一样可以保证列车正常运行
  • 2.多个车厢的动力一起发动/制动将要比一节车厢稳丶准(这也就是为什么高铁可以准确的停在高铁站的站台所对应的车厢的原因之一)
再来回到我们编程上面的分布式

说一下最近几年最火的大数据

大数据具有分布式存储,分布式计算等功能

  • 普通的数据存储与处理就犹如老式的绿皮火车
  • 所有的数据读写都靠服务器一人发力
    普通火车为什么没有高铁快?--分布式概念入门_分布式_04

大数据分布式存储就犹如高铁

分布式(计算与存储)

分布式计算

是一种计算方法,是将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。

分布式存储

是一种数据存储技术,通过网络使用企业中的每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在企业的各个角落,多台服务器。
普通火车为什么没有高铁快?--分布式概念入门_分布式_05

总结一下:

多台服务器一起发力,一起存,一起算.当然会比一台服务器读写算要好的太多,像企业级的Web项目,如果想做到人多时服务器自动增加扩容,就必须是分布式的部署服务器.

大数据的存储计算:

  • 一台服务器的算力,磁盘大小是有限的,一群服务器的算力磁盘是可变的,不论你给的文件是1个G还是1个T还是一个PB,只要有服务器,我就可以给你存进去,这既是大数据的牛逼之处!
  • 大数据文件存储是多副本机制存储的,也就是一个文件会分成N个块,每个块会存放在多个节点(服务器)中,如果一台服务器坏掉了,还要别的两个节点中存放着这个块文件,这样就大大的提高了容错率