目前,国内自主研发的文件系统可谓凤毛麟角。淘宝在这一领域做了有效的探索和实践,Taobao File System(TFS)作为淘宝内部使用的分布式文件系统,针对海量小文件的随机读写访问性能做了特殊优化,承载着淘宝主站所有图片、商品描述等数据存储。 文章首先概括了TFS的特点: TFS是什么 TFS,Taobao File System,淘宝内部使用的分布式文件系统,主要针对海量小文件的随机读写访问性能做了特殊优化,承载着淘宝主站所有图片、商品描述等数据的存储。 TFS有什么特点
TFS在淘宝的应用规模
TFS的性能参数TFS在淘宝的部署环境中前端有两层缓冲,到达TFS系统的请求非常离散,所以TFS内部是没有任何数据的内存缓冲的,包括传统文件系统的内存缓冲也不存在。我们主要的性能参数不是IO吞吐量,而是单台PCServer提供随机读写IOPS。由于大家硬件型号不同,当然也是因为一些技术保密的原因,我们很难给出一个参考值来说明性能。但基本上我们可以达到单块磁盘随机IOPS理论最大值的60%左右,整机的输出随盘数增加而线性增加。 TFS的逻辑架构图
总结 以上是TFS的一个简要的应用情况和架构介绍,后续将逐步丰富,欢迎大家拍砖。并再次做个广告,TFS计划在今年9月份建立开源社区,请大家支持。 文章发表以后,读者反响热烈,在评论中提出了各种问题与作者楚材进行技术交流,由此可见国内社区对自主研发文件系统的关注程度。 |