全站搜索

行业应用案例

INDUSTRY APPLICATION CASES

灵活伸缩存储平台,全力支撑冷冻电镜科研计算

项目背景

PROJECT BACKGROUND

人类基因组计划的完成,标志着科学已进入后基因组时代,虽然大量的基因序列得到阐明,但是生物大分子如何从这些基因转录、翻译、加工、折叠、组装,形成有功能的机构单元,尚需进一步的研究。后基因组时代人类面临的一个挑战,是解析基因产物–蛋白质的空间结构,建立结构基因组学,并在原子基础上水平上解释核酸-蛋白、蛋白-蛋白之间的相互作用,从而阐明由这些生物大分子和复合物所行使的生物学功能。

某大学生物系通过冷冻电镜技术进行分子及细胞结构的研究,每天都会产生大量的高分辨率图像及附属数据。前期数据量较少,数据会存储在每台数据分析服务器和一台传统的存储内。后期数据量越来越大,前期的存储设备无法满足容量要求;同时因为传统存储不能很好的满足高带宽和多客户端数据共享的要求,实验室急需扩展一套大容量、高带宽、可共享、易管理的存储系统,保障后续研究工作的流畅进行。

应用需求

APPLICATION SCENARIOS

-需要一个可共享的存储系统,支持数台数据分析设备存取数据
-需要提供全局管理平台,实现存储容量灵活分配、实时监控系统状态、提供读写性能曲线、硬件状态等,提供故障预警,确保存储数据的安全
-需要一个可共享的存储系统,支持数台数据分析设备存取数据
-存储容量需求约800TB,存储分为热数据区域和冷数据区域,以应对冷数据的调用需求
-存储总的带宽要求为9GB/S
-采用冗余存储架构,实现系统内节点冗余,单台设备故障不再影响整体存储的使用,保障数据安全,保障研究处理的过程不中断

解决方案

SOLUTIONS

根据用户的需求,并结合用户的实际应用场景,融科联创做出了以下计算解决方案:
在该项目中推荐采用了Super-storage分布式存储,为客户构建海量、高效、且可扩展的分布式存储系统。
引入高速Infiniband网络,4个节点即实现高达9GB/s的写入带宽,很好地保障了多台分析计算设备对数据存取的高带宽要求。
提供800TB的统一命名的存储空间,并实现冷热数据的分层存储,适应了不同应用任务对不同数据的调用要求。
采用了分布式存储架构,支持高HA,确保整体系统的稳定性和安全性。
实现了存储容量按需灵活分配,并提供了实时的系统状态监控、读写性能曲线、硬件状态监控等界面,提供直达底层的故障预警,保障了数据安全和应用的稳定运行。

分布式存储系统,提供分布式的文件读写和共享服务,本次配置的集群实现了9GB/s的读写带宽性能,而且未来可通过集群扩展,提供更高的带宽。支持万兆网卡及Infiniband网络,通过RDMA优化并发读写性能。用完全去中心化的的分布式存储架构,无独立元数据服务器设计,消除元数据信息交互瓶颈;动态扩展,快速在线增删节点,最高可实现512个节点集群,可管理近100PB的海量数据,并以全局命名空间的形态实现存储资源的呈现,为客户端提供统一的逻辑视图和资源访问入口。分布式集群架构,全活冗余节点,节点故障后可在数秒内实现故障接管,实时一致的数据副本及智能自修复机制,可选采用纠删码保护,提升容量利用率,整个集群存储具有数据的可靠性、可恢复性和存储服务的高可用性,可有效支持业务的连续性。

客户价值

CUSTOMER VALUE

融科联创为该高效部署了Super-storage后,提供了稳定、高效、共享的数据支持能力。对于清华大学的教授和学生而言,实现了在一个平台内进行独立方向研究, 清华大学在Super-storage部署使用后表示:”高校的科研项目经费有限,但对设备的性能要求却不能低。融科联创的解决方案既为学院提高了整体的计算能力,还节省了大量的成本,后期维护首理也很方便,是高校科研非常理想的好助手。

相关产品方案

​​RELATED PRODUCT SOLUTIONS​