常 见 业 务 架 构 常见业务架构


  • HDFS:分布式文件系统
  • Hbase:分布式数据库
  • MapReduce(批量) 、Storm(实时) 、Spark

常见业务架构_搜索
分布式锁服务:zookeeper

常见业务架构_搜索_02

主要的业务

1、搜索
以前:人->内容
现在:人->服务

大数据:人产生

音乐->物品(item)-> itemid
用户->人(user)-> userid

大数据:用户多、物品多
用户多:产生用户行为多(用户行为挖掘)
物品多:产生大量的元数据(Metadata)

元数据:物品的属性Schema(描述数据的数据)

用户行为:通过监控实时获取
物品元数据:

2、广告

搜索广告
展示广告

3、推荐

学习重点:
(1)检索/推荐系统定位
(2)架构/框架层次思维