当下的NoSQL经典应用
- 一:阿里巴巴中文站商品信息如何存放
- 1、架构发展历程
- 1、演变过程
- 2、第5代架构
- 2、多数据源多数据类型的存储问题
- 1、商品基本信息
- 2、商品描述、详情、评价信息(多文字类)
- 3、商品的图片
- 4、商品的关键字
- 5、商品的波段性的热点高频信息
- 6、商品的交易、价格计算、积分累计
- 二:总结大型互联网应用(大数据、高并发、
- 多样数据类型)的难点和解决方案
- 1、难点
- 2、解决办法
- 1、是什么?
- 2、什么样?
- (1)、映射
- (2)、API
- (3)、热点缓存
当下的应用是sql和nosql一起使用
一:阿里巴巴中文站商品信息如何存放
看看阿里巴巴中文网站首页
以女装/女包包为例
1、架构发展历程
1、演变过程
2、第5代架构
2、多数据源多数据类型的存储问题
1、商品基本信息
名称、价格,出厂日期,生产厂商等
关系型数据库:mysql/oracle目前淘宝在去O化(也即拿掉Oracle),
注意,淘宝内部用的Mysql是里面的大牛自己改造过的
为什么去IOE
2008年,王坚加盟阿里巴巴成为集团首席架构师,即现在的首席技术官。这位前微软亚洲研究院常务副院长被马云定位为:将帮助阿里巴巴集团建立世界级的技术团队,并负责集团技术架构以及基础技术平台搭建。
在加入阿里后,带着技术基因和学者风范的王坚就在阿里巴巴集团提出了被称为“去IOE”(在IT建设过程中,去除IBM小型机、Oracle数据库及EMC存储设备)的想法,并开始把云计算的本质,植入阿里IT基因。
王坚这样概括“去IOE”运动和阿里云之间的关系:“去IOE”彻底改变了阿里集团IT架构的基础,是阿里拥抱云计算,产出计算服务的基础。“去IOE”的本质是分布化,让随处可以买到的Commodity PC架构成为可能,使云计算能够落地的首要条件。
2、商品描述、详情、评价信息(多文字类)
多文字信息描述类,IO读写性能变差
所以把它存在文档数据库MongDB中
3、商品的图片
存放在分布式的文件系统中
淘宝自己的TFS
Google的GFS
Hadoop的HDFS
4、商品的关键字
搜索引擎,淘宝内用 ISearch
5、商品的波段性的热点高频信息
内存数据库
Tair、Redis、Memcache
6、商品的交易、价格计算、积分累计
外部系统,外部第3方支付接口
支付宝
二:总结大型互联网应用(大数据、高并发、
多样数据类型)的难点和解决方案
1、难点
①数据类型多样性
②数据源多样性和变化重构
③数据源改造而数据服务平台不需要大面积重构
2、解决办法
阿里、淘宝干了什么?UDSL
1、是什么?
2、什么样?
(1)、映射
(2)、API
(3)、热点缓存