SCM+MLC/TLC NAND混合SSD性能探究

存储级内存(SCM)带来的存储革命

随着数据量的大幅增长以及各种数据分析应用的出现,存储市场保持着快速增长势头。然而,这些应用极大地消耗着硬件性能。随着性能需求的不断提升,即使是闪存也显得力不从心了。因此,我们需要新的技术和新的架构来应对这个新的挑战。


性能需求的快速增加,存储系统需要变得更快、更加密集、更加便宜,同时还要更加绿色。内存中处理(毫无疑问会极大的消耗内存)也带来了不断增加的内存配置以及动态随机访问内存(DRAM)的成本和能耗之间的平衡问题。


这些发展的结合形成了一个近乎完美的风暴,那就是存储级内存(SCM)。SCM已经成为了一个新的流行词,代表着下一代的非易失性内存(NVM)。


将下一代持久性存储应用到自己产品中的先行者将获取每年十亿计的收入,而且还会随着时间推移不断增加。SCM技术在目前的生态系统中有多个切入点,每一个切入点都能带来高价值。这一轮的变革大致顺序可以用以下三个场景来说明:

  • 作为下一代的闪存替代技术,将彻底改变外部存储。

  • NVM到DRAM的扩展将带来更大规模的内存中处理(in-memory processing)。

  • 持久性内存能彻底改变存储架构。


SCM+MLC/TLC NAND混合SSD探究

在SCM+MLC/TLC NAND混合SSD系统中,利用SCM低延迟的优势来提高SSD整体性能,但由于SCM价格较高,则利用TLC NAND低成本的优势来降低SSD整体价格,而MLC NAND则在SCM和TLC NAND充当中间介质。


SCM存储中没有类似NAND中的erase/program,而是通过set/reset来改变介质的状态达到存储的效果。如下图,在SCM中具有更短的set/reser时间,基本在ns级别。

与MLC NAND相比,TLC NAND具有更长的延迟。同时,TLC NAND 出错几率也大很多。如下图,


(1) SCM+MLC/TLC NAND混合SSD的架构长什么样子呢?如下图:


Host传进来的数据要写入SCM?MLC NAND?TLC NAND?怎么判断呢?主要看data management的“慧眼”。

如上图,来自Host的Cold/Sequential数据会直接写入MLC NAND,而Hot或者Random数据会写入SCM,当SCM满时,在挑选出相对cold的数据写入MLC NAND。最后已经写入MLC NAND的数据再将Frozen的数据趁MLC NAND做GC时搬入TLC NAND。

 SCM与MLC NAND之间数据判断采用的是CDE算法

MLC NAND与TLC NAND之间数据判断采用的是RR-FDCA算法


(2) SCM+MLC/TLC NAND混合SSD效果如何呢?

针对Hot workloads情况下,SCM对混合SSD的整体提升效果很明显。


针对Cold/Random workloads情况下,SCM对混合SSD的性能也有一定的提升。不过,此时混合SSD的性能已经看到有收到NAND flash的制约。


针对Cold/Sequential workloads情况下,SCM的作用基本没有了,混合SSD的性能基本与Only NAND-based SSD的性能差别不大。


写在最后

实现SCM+MLC/TLC NAND混合SSD,需要在不同workloads与cost之间做出平衡。随着QLC的问世,相信QLC凭借更低的价格优势,会助力混合SSD更加多样化。


欲了解更多研究细节,请点击"阅读原文"下载原版英文文献,谢谢!

精彩推荐:

更多精彩内容,敬请关注公众号: 存储随笔,Memory-logger.