起订量:
免费会员
在云计算带来新一代数据中心技术融合和技术变革的背景下,终端的多样化与海量化、应用的虚拟化与分布化、数据中心的大型化对存储系统带来巨大挑战。传统存储系统在新一代数据中心需求面前捉襟见肘:半手工式使用和管理、低速低并发访问性能的硬件结构,单一存储介质的技术成本局限、预设和固定的应用与存储资源绑定、封闭式数据管理等缺陷都严重制约着数据中心的发展。以云计算为代表的新一代应用系统对存储系统软硬件设计提出了严峻挑战,要求数十倍地提高性能、实现动态配置和自动化管理、实现应用驱动和智能化管理、大幅降低一次性采购成本、能耗和人员维护管理成本。局部功能的增加和改进已无法应对,必须对传统存储软硬件架构进行变革性设计和根本性创新。
在硬件架构上,MS5000创新性地采用芯片技术,设计出高性能和高可靠的硬件结构,为海量应用并发提供了大缓存、高带宽、高处理能力的百G级硬件平台。在资源管理上,MS5000采用基于Cell的虚拟化技术,通过创新的ICMT管理机制,实现资源的弹性部署。在可靠性上,MS5000除了采用双控全冗余模块化设计、提供丰富的数据保护特性外,还通过创新的CRAID技术和IDDC硬盘诊断安全机制,将硬盘故障导致的宕机时间和机率减少80%。此外,MS5000基于开放式数据存储平台(ODSP),能够通过接口开放、规格功能定制、行业特性开发移植等方式,将存储系统真正与用户业务系统无缝融合。
MS5000系列存储整机视图
MS5000系列产品功能与特性
(一)高性能体系架构
在架构设计上,MS5000采用了业界的技术,包括超大缓存扩展、PCI-E 3.0、SAS 3.0、SSD等,构建了端到端的的高性能存储平台。
(1)大容量智能缓存管理
缓存调度是存储阵列的核心机制,也是影响存储控制器性能的最主要因素之一。由于技术上的限制,传统存储阵列的缓存容量小,扩展困难,而且调优管理非常复杂。在云计算环境下,存储的并发I/O访问量快速增长,数据存取热点变动频繁,对存储缓存的容量要求也急剧增长。与此同时,大容量缓存对于存储的缓存管理也提出了更高的要求。
MS5000在支持超大容量缓存的同时,采用业界的智能缓存管理机制,大大提升了缓存的效率。
容量按需配置:缓存大小是决定存储阵列档次的重要标准,通过增加缓存能够显著的提升存储性能。在缓存大小上,MS5000支持24-384GB的灵活配置,用户可根据实际的应用需求来选择。相对于采用更高的产品型号来增加性能的传统方式,这种通过扩展缓存来提高性能的方式,具有更高的性价比。
全局智能调度:MS5000采用智能缓存调度机制,对全局性缓存进行管理。不仅单个控制器内的读、写缓存可根据实际情况动态调整, 而且两个控制器的缓存也无需对称分配,以充分发挥控制器的性能。在具体调度策略上,读、写缓存被划分为预留、共享、突发三大区块,以满足LUN的实时变化的性能需求。在这种机制下,LUN在大压力下获得大缓存空间,在小压力下获得小缓存空间,既保证单个LUN不存在性能瓶颈,也使得整个系统的缓存使用非常高效。
数据安全可靠:在缓存数据的安全性上,不仅采用了缓存镜像机制,而且具备掉电保护功能。在外部电源故障的情况下,写缓存里的数据能够被下刷保存到存储阵列的前四块硬盘(保留硬盘)里。当供电恢复后,能够从保留硬盘中将数据恢复回来。
(2)高性能SAS/SSD硬盘
SAS硬盘技术:SAS硬盘是硬盘领域的一次技术变革。SAS硬盘在继承SCSI硬盘稳定、可靠性等优点的基础上,还具备大量新的特性,比如6.0Gb接口速率、双冗余接口、全双工模式、兼容SATA硬盘等。由于这些优势,SAS硬盘已经成为了主流的硬盘技术,并且将服务器、存储阵列两个不同领域的硬盘进行了统一。如今的SAS硬盘不仅同时支持15000/10000/7200转三种速率,而且还支持2.5/3.5二种尺寸,给用户带来了更多的选择。
高性能SSD硬盘:SSD硬盘的高性能已经获得了业界的一致认可,MS5000将这一的硬盘技术融入高性能体系架构之中,大幅提升硬盘的IO响应能力。此外,通过自动分层存储和自动数据迁移机制,能够将数据热点与SSD硬盘进行的融合,使存储阵列只需要配置少量的SSD硬盘,却能获得整体性能的大幅提升。
(二)基于Cell的智能资源管理
Cell,形象称之为“细胞”,指带“活性”的数据单元,是MS5000进行存储资源管理的基本单位。MS5000采用Cell机制从数据块底层改变了传统的卷(LUN)管理机制,并在此基础上构建了的存储虚拟化架构,实现了资源的精细化管理和弹性调度。
传统意义的存储逻辑资源管理是以卷(LUN)为基本的操作单元。LUN、RAID、硬盘三者是串行关系,一旦LUN分配之后,LUN所在的空间就被牢牢固化到具体的RAID类型和硬盘之上,不仅性能、容量难以扩展,而且配置改动困难。任何一次资源配置的改动都是“伤筋动骨”,最严重的情况是整个应用需要重做。
ICMT(Intelligent Cell Management Technology,基于Cell的智能资源管理技术)是宏杉科技的一项创新技术。采用ICMT技术后,LUN所对应的不再是一整块的RAID空间,而是由多个Cell组成的一个逻辑空间。LUN不关心Cell采用的是何种的RAID方式,也无需知道Cell所在的实际位置。MS5000以Cell为核心来进行逻辑资源的管理,破除LUN与RAID、Disk之间的捆绑关系,在存储阵列内部形成的虚拟化架构。
容量弹性配置:初始空间分配时,系统自动在Cell池中获取存储空间,无需管理员。此后,再通过自动精简配置技术实现空间的自动增长。比如:应用系统需要1TB的逻辑空间,存储阵列初始只为其分配500GB的物理空间,当应用的实际容量接近或达到500GB时,会按照预设策略为应用系统分配新的物理空间,比如再分配200GB,使得实际的物理空间达到700GB。通过ICMT和自动精简配置技术,应用系统只需向存储阵列提出空间需求,而不关心资源的空间限制和物理位置,由存储系统自动进行容量的弹性配置和管理。
自动分层存储:采用ICMT技术后,LUN与RAID、硬盘之间没有绑定关系。通过基于Cell的数据拷贝和迁移,可以依据数据的访问频度,实现数据在不同的硬盘介质上的自由流动,从而实现自动的分层/分级存储。比如对于热点的数据,将其放置在SSD硬盘上;对于非热点的在线数据,将其放置在高速SAS盘上;对于归档/备份数据,将其放置在低速SAS盘上,并将其休眠。通过ICMT和自动分层存储策略,解决动态数据热点的性能问题。
(三)创新的CRAID技术
传统的RAID机制是以硬盘为基本的操作单元,当硬盘内出现少量坏块后,整块硬盘会被作为问题硬盘“踢”出RAID组,然后在热备盘上对整块硬盘的数据进行重建。随着硬盘容量的急剧增大,这种粗颗粒度的RAID机制遇到了巨大的挑战,不仅数据重建过程漫长,而且会消耗大量的系统资源。例如,1块2TB的SATA硬盘的RAID5重建时间,在无流量压力的情况下需要20个小时,在有流量压力下需要数天甚至超过一个星期的时间。
CRAID(基于Cell的RAID技术)是宏杉科技在RAID机制上的一项创新技术。在CRAID环境中,建立传统的RAID组之后,系统会再将RAID空间划分成一个个的小数据块,称之为Cell,然后以Cell为单元进行资源的管理。比如当硬盘内出现部分数据坏块时,其影响的只是坏数据块所在的Cell,系统只会针对这个Cell进行数据重建,而硬盘的其它数据部分不会受到影响。CRAID通过Cell来实现对硬盘的精细化管理,不仅提高了对硬盘故障的容忍度,而且将数据重建的效率提高了数倍,具体包括:
同一RAID组允许多块硬盘出现介质故障:在RAID组内,只要同一Cell内的两个数据块不同时出现故障,RAID组允许多块硬盘发生介质损坏,而数据不会丢失。
容忍任意三块磁盘物理故障:传统RAID方式,RAID5/6的磁盘利用率较高,但数据丢失风险较大,RAID5只允许坏1块硬盘,RAID6只允许同时坏2块硬盘;相对之下,RAID1/10等安全性较高,但空间使用率只有一半,并且同为镜像的两块硬盘一旦同时出现物理故障,数据同样丢失。在保证数据安全、磁盘空间使用率和性能的基础上,宏杉科技CRAID2.0技术,打破了传统RAID技术的瓶颈限制,采用三重数据校验机制,可允许同一个磁盘组中任意三块硬盘出现整盘物理故障,数据不丢失。
只重建数据Cell:如果硬盘出现严重故障(比如物理故障)需要数据重建时,CRAID只对已有数据的Cell进行重建,空闲Cell不重建。
局部重建:如果硬盘发生暂时性故障(比如被拔出后快速插回), CRAID只重建数据发生变化的Cell,不对整个硬盘进行重建。
快速重建:如果硬盘发生不损坏(存在部分介质错误),CRAID只对发生介质错误的Cell进行校验重建,其它数据通过拷贝的方式重建。
(四)完善的硬盘安全策略
传统意义的存储安全,主要关注系统冗余性、数据保护二个方面,对硬盘安全的关注度不高。但是,据统计,存储系统的硬件故障90%以上都是由硬盘故障引发的。可以说,硬盘的安全才是存储安全的根本。
在硬盘安全方面,MS5000建立了一整套完善的机制,通过主动式硬盘诊断中心(IDDC),在硬盘检测、故障修复、故障处理三个环节实现了对硬盘故障的主动预防、快速修复和减少误判,以达到将硬盘故障导致的宕机时间减少80%的目标。
主动式硬盘检测:传统的硬盘故障处理是一种事后模式,即在发生故障后进行修复。MS5000的硬盘诊断机制是一种故障前的主动检测。在系统正常运行过程中,硬盘检测模块会周期性的检测数据盘的RAID校验信息和对空白盘、热备盘进行全盘扫描,从而能够比应用系统更早感知到硬盘故障,并提前启动对应的修复措施。
快速故障修复:在检测到硬盘故障后,MS5000支持多种数据修复策略。对于硬盘的假性故障,可以通过自动的硬盘上/下电等操作进行修复;对于硬盘的少量坏块,可以采用硬盘的Remap和RAID/CRAID机制进行坏块替换;对于硬盘的大量坏块,可以通过CRAID技术进行快速重建。
硬盘故障确诊:硬盘的故障误判,在存储系统中是一种常见的现象。为了减少对硬盘故障的误判,对于发生初次检测发生故障的硬盘,会在硬盘检测中心再次进行硬盘检测和修复,将硬盘故障的误判减到。
(五)双控全冗余高可靠设计
在硬件架构上,MS5000采用双控全冗余模块化设计,不仅实现了数据通道的端到端冗余,而且主要模块均支持即插即用和快速更换。
双冗余架构:数据从服务器写入硬盘,会经过主机通道、控制器、缓存、硬盘通道、硬盘柜、硬盘等组件。在这整个数据的通道上,MS5000采用了冗余的架构,保障系统的可靠性。MS5000采用双控制器设计,当单个控制器发生故障时,能够自动实现业务切换;MS5000采用缓存镜像机制,写缓存被一式两份保存,并且能在掉电后,将缓存数据下刷到保留硬盘;MS5000支持ALUA多路径机制,能够实现主机路径的故障切换;MS5000的双SAS链路设计,为每个SAS硬盘柜提供两个冗余的外接端口,当其中一条链路发生故障时,自动进行路径切换;MS5000采用双接口SAS硬盘,提供两条数据通路,实现硬盘链路的冗余互备。
双活控制器:MS5000的双控制器不仅仅支持故障冗余,而且支持负载均衡。MS5000的双控制器平时都处于活动状态,承载独立的业务,当某个控制器的性能出现瓶颈时,控制器之间能够自动进行调整,将部分业务迁移到另一个控制器上,从而实现自动的负载均衡。
模块化设计:MS5000控制器的机箱、控制器、电源、风扇、电池、主机接口卡等主要组件采用模块化设计,支持单独组件的热插拔和在线更换。当个别组件发生故障时,能够实现快速的故障隔离和组件更换,避免对整个系统造成大的影响。
多类型IO接口卡:MS5000每个控制器配置多个IO接口卡插槽,可根据需要灵活选择1Gb/s iSCSI、8Gb/s FC、10Gb/s iSCSI、10Gb/s FCoE、12Gb/s SAS等类型的接口卡。通过接口卡的灵活选择,可轻松搭建IP SAN、FC SAN、混合SAN等存储环境。
完善的供电和冷却系统:MS5000采用冗余电源设计,电源模块提供完善的保护功能,能够在输出过流、输出短路、输出过压等异常情况下保证设备的安全性;MS5000的涡轮风扇能够根据温度变化自适应调整;MS5000控制器上、下轴对称设计,不仅提高了风扇的冷却效果,而且使得单个风扇发生故障的情况下,整机的冷却效果不受大的影响。
(六)丰富的数据保护功能
在采用全冗余高可靠设计、完善的硬盘安全策略的基础之上,MS5000还能够提供丰富的数据保护功能,包括连续数据快照、数据复制、数据镜像等特性。通过这些特性,实现了从在线到近线、从本地到远程的数据管理和保护,为用户轻松提供多层次、跨地域的存储解决方案。
数据快照:MS5000的连续数据快照功能,可以为数据卷创建多个基于增量的历史时间点拷贝。当发生数据“软”故障,比如软件程序导致的数据损坏、病毒破坏、意外删除等,可以通过对合适的时间点标记进行“回滚”来快速恢复数据。该功能特别适用于关键性业务的连续数据保护。
数据复制:MS5000的数据复制功能,可以为用户数据实现异地的备份,在发生意外灾难时能够对数据进行快速恢复,确保用户的业务持续性。MS5000通过IP接口能够与广域IP链路无缝对接,无须协议转换就实现跨IP广域网的远距离数据灾备,有效降低灾备链路成本。
数据镜像:MS5000的数据镜像功能,通过在两台硬盘阵列之间建立镜像数据,为主数据保存一份同步的实时镜像。每一个写入的IO都会同时保存到主存储和镜像存储上,当主存储发生故障时,可以由镜像存储提供存储业务。
(七)全面支持IPv6