一. FastDFS介绍
- 用c语言编写的一款开源的轻量级分布式文件系统。
- 功能包括:文件存储、文件访问(文件上传、文件下载)、文件同步等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。
- 为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标。
- 可以帮助我们搭建一套高性能的文件服务器集群,并提供文件上传、下载等服务。
1、FastDFS架构
包括Client、Tracker server和Storage server。
- Client请求Tracker进行文件上传、下载,Tracker再调度Storage完成文件上传和下载。
- Client: 客户端,业务请求的发起方,通过专有接口,使用TCP/IP协议与Tracker或Storage进行数据交互。FastDFS提供了upload、download、delete等接口供客户端使用。
- Tracker server:跟踪服务器,主要做调度工作,起负载均衡的作用。在内存中记录集群中所有存储组和存储服务器的状态信息,是客户端和数据服务器交互的枢纽。
- Storage server:存储服务器(存储节点或数据服务器),文件和文件属性都保存到存储服务器上。Storage server直接利用OS的文件系统调用管理文件。
- Storage群中的横向可以扩容,纵向可以备份。
2. FastDFS上传和下载流程
上传:
1、Storage Server 定时向 Tracker Server 上传状态信息
2、Client 上传链接请求到Storage Server
3、Tracker Server查询可用 storage
4、Tracker Server返回给客户端可用的Storage的IP和端口
5、Client 上传文件到 Storage Server
6、Storage Server生成 file_id
7、Storage Server 将上传内容写入磁盘
8、Storage Server 返回 file_id (包含路径信息和文件名)给Client
9、Client 存储文件信息
下载:
1、Storage Server 定时向 Tracker Server 上传状态信息
2、Client 下载链接请求到Storage Server
3、Tracker Server查询可用 storage
4、Tracker Server返回给客户端可用的Storage的IP和端口
5、发送file_id(包含组名、路径、文件名)到Storage Server
6、Storage Server根据file_id查找文件
7、Storage Server返回file_content给Client
3. FastDFS文件索引
- FastDFS上传和下载流程 可以看出都涉及到一个数据叫文件索引(file_id)。
- 文件索引(file_id)是客户端上传文件后Storage返回给客户端的一个字符串,是以后访问该文件的索引信息。
- 文件索引(file_id)信息包括:组名、虚拟磁盘路径、数据两级目录、文件名等信息。
- 组名:文件上传后所在的 Storage 组名称。
- 虚拟磁盘路径:Storage 配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
- 数据两级目录:Storage 服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
- 文件名:由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。