从QLC新品D5-P5336看数据中心市场的发展
Solidigm补齐数据中心产品组合的最后一块拼图
2023年对数据中心存储产品是一个机遇与挑战共存的一年。在经过长达20年的发展,中国的数据中心产业正在进入新的转型阶段,数字经济的发展催生更多对数据中心存储与算力的需求,并且在“东数西算”、“双碳”等国家战略国策,以及AI等科技新浪潮的带动下,数据中心市场在大势上呈现出10年的基线市场的成长曲线(“十四五”期间产业营收规模复合增速预计保持在25%左右)。但是,即使在产业供需走势的大方向平稳增长的背景下,今年的数据中心市场还是受到了全球经济趋缓的影响。
在数据中心在长期向好与短期压力的复合作用的背景下,数据中心存储品牌也面临巨大的考验,像我们熟悉的Solidigm会以何种方式发展求变?对Solidigm来说,最好的方式莫过于用产品说话,用服务来获得市场,近期Solidigm发布的一款数据中心存储新品就能够充分体现它为2023年定下的策略和思路。
在我们和媒体同行的持续报道下,相信大家对Solidigm品牌的发展历程也较为熟悉了。Solidigm同时拥有以前英特尔闪存部门和SK海力士的不同技术路线,正是两者从堆叠架构到技术节点演进的差别,也为Solidigm带来产品多样化发展的最好的土壤。目前来看,从MLC、TLC一路走来,Solidigm基于Floating Gate技术的第四代QLC NAND(堆叠192层)也拿出了最为丰富的产品组合。
加上以往英特尔数据中心行业的服务经历,Solidigm在这个市场上拥有非常显著与领先的优势,其设计质量控制和可靠性设计上陆续增加了数据准确性的PLI检查,其完整数据路径保护,覆盖了99%的SRAM;而且,Solidigm产品的测试流程与规格也是超越行业标准的,其UBER测度达到1E-17,静默数据损坏(SDC)测试到1E-23,并建模到1E-25,如此深度的测试规格在同级产品中并不多见;当然,这里就不得不提Solidigm拿出过业界最佳的SDC事件保护,在在超过600万年的模拟运行中,没有发现任何SDC事件;不仅如此,Solidigm QLC在行业内也有比较低的失效率,Solidigm承诺的失效率是不超过0.44%,产品实际上的表现是远远低于这个标称的。
Solidigm良好的口碑还要归功于稳定的团队与为全球一流客户服务的经历——Solidigm的24小时全天候服务在超过190个国家和地区的全渠道提供支持,客户满意度高达92%,在数据中心市场,这个满意度数值对一个品牌来说是一个极高的肯定。
正是多年深耕中国市场,倪锦峰和Solidigm的整个中国团队也被称为“最懂用户”的团队。一直以来,Solidigm中国团队秉持三个方理念:一、与客户的业务紧密结合,并非单纯卖产品,更是为客户提供成套解决方案;二、以工作负载驱动,为客户提供新技术、新方案的改造;三、以方案为驱动,以成套方案帮助客户解决实际问题。所以,Solidigm一直在数据中心客户中拥有极佳的口碑。
关注我的朋友还记得,Solidigm数月前就发布过一次数据中心新品D5-P5430,这款体现高价值的主流工作负载的产品与高性能、高耐用性的D7两款产品组成了应对TLC阵列或HDD+TLC混合阵列升级的第四代QLC SSD产品组合,正是更高容量密度的QLC产品发布,QLC的产品耐用度也在持续提升,产品的生命周期完全可以覆盖数据中心的大量数据工作负载。从DWPD评级结果来看,将存储系统的写入负载调整至接近QLC的PE周期极限并不会有风险,因为99%的系统使用寿命不会超过其额定寿命的15%。
正因如此,而QLC大容量、低能耗、低成本的优势也进一步凸显,QLC拥有的高存储容量使得机架、能耗的投资大幅度降低,也能够更好地满足数据中心、边缘基础设施、边缘端对大小、能耗、可靠性的需求。可以看到,数据中心的主流工作负载也为QLC的普及提供了最好的机会,数据中心对存储的要求变为数据读取为主——94%的企业工作负载均为80%读/20%写;另外,一些AI模型在过去3年增长了10000倍以上,诸如最新的ChatGPT 4大模型的演进对存储需求呈极大数量级的增长;而视频时代的到来,也使高清电影的数据量比几年前增长了9倍之多……这些需求都是与QLC产品特性高度契合的。
在大众的认知里,第一印象便是QLC在性能、耐用性和故障率等参数上表现不佳。但事实上,如今的QLC在读性能上已经做到入门级TLC的水准,不论顺序还是随机;写入性能的确QLC会差一些,其实差距并不大。4K IU的QLC同样可以做到入门级TLC水准;而16K IU在工作负载修正后,已经能够做到与TLC性能相同;延迟方面,Solidigm的QLC在延迟和长期稳定性上比入门级TLC好得多,也快追上TLC的平均水准;而耐用性方面,Solidigm QLC擦写次数标称为3000,事实上做到5000也不成问题,比一般的TLC更好;故障率上,Solidigm QLC也能提供与业界领先TLC质量相同的水准。
在此前Solidigm公布的产品组合中,我们还看到一块空白——从产品性能、容量、成本的维度来看,它是一款提供足够耐用性的第四代QLC,这次发布会,Solidigm便按计划补齐了这块产品拼图,其产品型号名为D5-P5336。
D5-P5336采用了与D5-P5430相同的架构和NAND,但两者的定位是不同的:D5-P5430的定位是为主流及读取密集型工作负载服务,而D5-P5336则是完全为了读取密集型这个单一需求而设计。可以看到D5-P5336在不同形态规格上提供的容量比D5-P5430更大,以国外数据中心常用的E1.L规格为例,D5-P5336可提供15.36TB~61.44TB的容量,而D5-P5430仅能提供3.84TB~15.36TB的容量,仅有D5-P5336的四分之一。另外,D5-P5336在U.2和E1.L规格的最大PBW(耐用性指标)上也比D5-P5430大得多。聊到这里,也给大家提供一个小小的TIPS:目前国内数据中心普遍使用U.2规格(成本便宜、生态普及),但在Gen 5时代它就会出现性能和散热的瓶颈,未来高密度的产品使用更多的是E1.L和E3.S规格。
D5-P5336与此前D5-P5430最大的不同,是它采用的是16KB IU(D5-P5430为4K IU,优势在于可以与所有4K IU的入门级TLC实现直接替换),这也是两者在架构、NAND相同的情况下,D5-P5336成本大大降低的主要原因。可以看到16KB IU在写入操作上,对16KB以上的数据写入进行了优化,加快了所有读取工作的响应时间。针对小于16K的写入数据,写入修正(Write Shaping),将小文件整合成大文件,才能更好地发挥SSD的能力。值得注意的是,与上一代QLC相比,D5-P5336的IU大小减少4倍,目前来看,16KB IU是第四代QLC成本与性能较佳的平衡点。
在数据中心的实际工作负载下,可以看到CDN、HPC以及AI和机器学习等工作主要集中在大数据块的读取上,D5-P5336正是针对这个区域打造的特型产品。可以看到,D5-P5336与D5-P5430相比,可以满足QLC区域全部的读取需求,以及大于16K的写入需求。16KB IU的引入,可大大降低SSD成本,同时仍可满足大部分高容量密度的存储使用需求,所以D5-P5336更适应如今读取密集型存储工作负载的需求。
从参数表来看,D5-P5336提供7.68TB的最小容量,可以向上堆叠到61.44TB,与上一代P5316相比容量更大,容量选择的区间也更为宽泛。与上一代相比,D5-P5336新增了E3.S规格,也是面向未来Gen 5、甚至Gen 6而设计的。Solidigm的第四代QLC采用192层堆叠,相信大家已经非常熟悉,虽然给大家说明的是它采用NVMe 1.4c新平台,并可为PRQ2提供NVMe 2.0支持。另外,这款产品采用全新的Trim架构以及OCP 2.0功能支持,可以便于跟踪历史信息,实现远程Debug。在采用PCIe 4.0主控后,其延迟和管理能力大大优于前代产品,而且作为一款读密集型产品,它的读取性能可以顶满PCIe 4.0的带宽。
比较不同容量的D5-P5336在不同用途下的工作负载,可以看到它能在内容分发网络中提供更大带宽;在随机/顺序读取上远超TLC产品;在AI应用的大块数据读写上,也明显超越B、D两款产品(读写与耐用性表现较好的两款产品);而在写入压力测试上,也比TLC产品更优秀(越小越好)。
在存储密度这种QLC本就领先的领域上,D5-P5336更是拥有绝对的优势。在1U和2U两种服务器上,D5-P5336均拥有出色的表现,在2U 24驱动器的配置上,D5-P5336的服务器容量可以达到1.47PB ,容量最大的C款TLC容量也仅能达到0.74PB。
D5-P5336的最终设计目标还是在于更好地替代全HHD阵列或TLC阵列,这其实是符合中国数据中心客户和政策需求的。在实际方案中,数据中心客户是非常关注机柜的大小和重量,比TLC拥有更高密度的QLC产品无疑更占优势。当前,有些HDD阵列的确可以做到高密度,但它极大的重量限制了超高密度机柜的部署,QLC完全不用考虑这些问题。在“东数西算”工程中,明确提出了能耗控制的指标和要求,在这方面,QLC无疑也是拥有绝对优势的。而在日常使用中,HDD的失效率高达每年2%-3%,而SSD则可将这个指标控制在0.4%以下,且能在服务中提供远程Debug、远程维护的能力,能够更好地满足边缘端的服务器或边缘数据中心的需求。
从实际参数来看,D5-P5336阵列与HHD阵列相比,不仅在容量、服务器总数、机架数、功率密度、能耗支持上大大领先后者,5年总支出的TCO指标也降低的47%,长时间来看绝对是更为划算的投资。
而与高密度的TLC(C产品)相比,D5-P5336同样在各个项目上领先于TLC阵列,5年的总支出(TCO)降低了17%。
就产品特点来看,D5-P5336以超大容量、更好读取性能、更低TCO,以及领先行业的质量和可靠性取胜,可以满足从数据中心到边缘端的不同存储需求。在参数上,D5-P5336改变了以往人们对QLC的误解,甚至能够提供比TLC更高的读取性能和PBW。在我看来,D5-P5336真正的优势在于低购买成本和低运营成本,这能够加速国内的数据中心的换代节奏,也为以后更新软件能力和管理效率建立更好的基础。
当前,QLC在数据中心市场中还是拥有巨大发展潜力的,举个例子“东数西算”仅定下了“十四五”末增加900万架机架的目标,在有限机架内实现更高密度、更大容量的存储,自然就是QLC的机会;另外,该战略还定下了存量节能改造投资340亿元体量,安全、运维等增值服务投资的占比也在逐步增加,这同样也给QLC替代老旧存储介质带来更多机会。不论是Solidigm还是其他存储品牌,只要熬过了短暂的衰退期,数据中心的春天就会到来。
加载更多