一年前,三星把PCIe SSD技术运用在三星950 PRO产品上,并推向消费市场,这也是一款采用三星V-NAND闪存的NVMe M.2 SSD。在950 Pro发布之前,三星已经生产了两代M.2 PCIe SSD,但没有直接面向消费市场销售。
现在950 Pro的继任者即将上市,从某种角度来看,三星960 Pro只是950 Pro的换代更新:32叠层V-NAND被替换成48叠层V-NAND,单Die比之前提升了两倍容量,UBX主控被替换成了Polaris主控,此款主控在今年早些亮相的OEM产品SM961和PM961 SSD上已经应用过。
然而从960 PRO的性能规格来看,这显然不仅仅是一个升级,其中由于这样的事实:PCIe SSD有着比SATA SSD有更大的改进空间,三星得以提高1GB/s的持续读取速度和三倍的随机写入速度。但为了达到这样的性能改进,以在每个月都有新厂商加入竞争的激烈市场中保持领先地位,三星不得不对硬件的几乎每个方面都作显著的改进。
在4TB版850 EVO首次发布的时候,我们已经分析了三星的48叠层V-NAND。三星960 Pro用了单Die 256Gb的闪存,允许16个Die就可以封装成512GB大小的NAND芯片,为之前950 Pro的两倍。三星得以加大SSD两倍的容量,并将四个NAND封装挤压到M.2 2280卡的单侧一面,这样做的好处就是可以在另外一面释放出空间来安装DRAM,这部分通过叠层体封装(PoP)的方式堆叠在主控上面。
从950 Pro上的UBX主控到Polaris主控也是一个重大的改变,为了获得更高的性能,UBX主控明显需要更高频率,但架构上能力分配无法支撑,作为代替,Polaris主控从三个ARM核心增加到了五个,并且有一个单独的核心用于与主机进行通讯。
更小尺寸的M.2接口,结合与PCIe 3.0 ×4 SSD一样水平的高供电要求,这意味着发热是M.2 PCIe SSD上的一个严重问题。一般的来说,这类SSD在进行基准测试和压力测试的时候可以通过降低自身的频率来降温,但大多数的SSD在真实使用环境中都会避免过热保护,大多数重度工作负载是突发性的,尤其是在2GB/s的时候。
即便如此,消费者还是更喜欢有良好散热的SSD,以保证性能可靠,所以几乎每个M.2 PCIe SSD都在散热上面作努力,东芝的OCZ RD400有一个可选的PCIe x4转M.2扩展卡,将散热垫直接放在SSD主控后面,Silicon Motion在SM2260主控封装的上面贴了一块薄铜散热片,浦科特的M8Pe有一个全覆盖的散热器。三星在960 Pro的背面标签下贴上了几层散热片,这个散热片非常薄,没有对SSD单面的兼容性产生影响。据三星介绍,这块散热标签在960 Pro的散热性上有显著改进。
960 Pro的保修期为五年,这与950 Pro相同,但只是850 Pro的一半。当推出950 Pro时,三星解释说,之所以在高端产品上减少质保期,是由于NVMe的PCIe SSD的技术相比SATA SSD还不成熟。尽管现在950 Pro已成功推出一年,但三星也不会将保修期提升回10年,如果他们再次发布这样长时间保修期的消费级SSD,我会感到惊讶。
与保修期并列的是写入耐久性,512GB和1TB型号的耐久性相当于950 Pro提供的每天写入量,2TB 960 Pro的耐久性只有1200TB,而不是1TB 960 Pro(耐久性为800TB)两倍的1600TB,当这个问题在之前的三星SSD全球峰会上被问及时,三星回避了这个问题,没有给出令人满意的解释。
960 Pro另一个问题是价格。尽管切换到更密集的闪存,512GB 960 Pro的建议零售价仅略低于512GB 950 Pro首发时的建议零售价,稍高于950 Pro的当前零售价。960 Pro使用更先进的封装在主控和NAND上,而主控本身可能又需要更多成本,但使价格上涨的更大因素可能是缺乏真正的竞品。
当三星950 Pro推出时,其在PCIe领域的主要竞争对手是英特尔SSD 750,这款来自企业级PCIe SSD的衍生品,配备了面向消费级市场的固件,虽然体积很大且耗电,但这款产品将NVMe带入了消费级市场,创下一些性能记录。950Pro无法在所有项目上打败Intel 750,但在日常普通用户最主要的使用负载上领先。从那时起,Marvell、Silicon Motion和Phison就陆续开发新的NVMe主控。我们测试了OCZ RD400,发现它能够在几个测试中击败950 Pro,但当时用的是1TB RD400,而950 Pro最高只有512GB型号。我们将比较2TB三星960 Pro与其前身和这些高端PCIe固态硬盘竞品,以及三个2TB级SATA SSD。
关于驱动的解释:
英特尔750、三星950 Pro和OCZ RD400都使用SSD制造商各自提供的NVMe驱动程序进行评测。在过去,SSD制造商总会表示使用NVMe驱动会比Windows自带驱动程序在性能上更有优势,但主要原因是微软的自带驱动程序未能实现所有功能。在Windows 7 SP1和Windows Server 2008 SP1上通过更新加入的NVMe驱动程序,并不包括用于更新SSD固件的必要接口,甚至在Windows 8.1及更高版本上,SSD制造商用于执行类似安全擦除任务的管理工具,仍需要自己的驱动程序。
三星960 Pro在这次评测中并没有准备好NVMe驱动,他们计划在11月中旬与Magician 5.0实用程序一起发布。三星NVMe驱动将用于支持Magician 5.0上新的“Magic Vault”安全存档/备份功能和新的安全文件擦除功能。
与此同时,这次评测也没有破解三星950 Pro的NVMe驱动用在960 Pro上,而是使用微软Windows 8.1自带的NVMe驱动程序。大多数SSD制造商(特别是较小的)都表示微软的NVMe驱动程序已经提供了足够的性能,没有必要使用自定义的驱动以获得全面的性能,因为会有一些缺陷。
Windows为SSD的写入缓存提供了两个设置策略,默认情况下,在内部SSD上启用缓存,另外有一个未选择的选项可以关闭缓存刷新,这两个选项都是与电源故障时数据可能会丢失的有关警告。SSD进行缓存和组合写入而不是立即将所有写入数据直接发送到闪存是正常的,并且是必要的,这也是为什么NAND闪存写入操作固有地比读取操作慢得多。只要SSD写缓存,我们就永远看不到良好的随机写入性能,更别指望随机写入性能会超过随机读取性能。
微软自带驱动默认的写缓存策略设置适用于SATA SSD,但不利于NVMe SSD的使用。微软的NVMe驱动在默认配置中对写缓存极为保守,导致某些测试的性能极差。勾选第二个框可以恢复正常的性能,对于高端NVMe SSD取消选中会导致比低端SATA硬盘更差的性能。通常我不会在评测中改变设置,特别是这个还会增加数据丢失的风险,但微软的默认设置明显是不正确和不符合行业标准做法。960 Pro使用上述设置进行了基准测试,未来将会更全面地比较NVMe驱动和操作系统版本对性能的影响。
性能一致性
我们的性能一致性测试探讨SSD在长时间随机写入测试期间,可以可靠地保持性能的程度。消费级SSD的规格通常只列出在理想条件下达到的峰值性能数值,但在高强度的使用情况下,性能可能会非常不同,因为在长时间的测试中,SSD可能耗尽备用区,必须开始执行垃圾回收,有时甚至达到过热保护的程度。
除了性能的整体下降,长时间的测试可以显示性能在较短时间段内如何变化的曲线。一些SSD在从秒与秒之间显示非常小的性能变化,一些SSD在每个垃圾收集循环期间表现出巨大的性能下降,其它时候保持良好的性能,而有些SSD则出现大范围的波动。如果SSD周期性地降低到HDD的性能水平,即使其总体平均性能非常高,也可能在使用时感觉缓慢。
为了最大程度地测试SSD的主控并强制它执行垃圾收集和耗损均匀,该测试进行4kB随机写入,队列深度为32。在测试开始之前SSD被填满,测试持续时间为一小时。任何备用区域将在测试的早期耗尽,在一小时后结束时,即使拥有大OP预留区的大容量SSD也将达到稳定状态。 我们使用测试的最后400秒的每秒稳态平均写入速度,根据其性能除以标准偏差。
英特尔750继承了企业级SSD的特征,在随机写入性能上保持最稳定的地位,但三星960 Pro已经相当接近,相比950 Pro也有巨大的进步,后者的稳态还不如普通的SATA SSD。很少消费级SSD可以提供稳定的随机写入性能,最显著的是基于Indilinx Barefoot 3主控的OCZ SSD,但现在960 Pro是第一个达到英特尔SSD 750级别的。
在相当接近的性能差距上,960 Pro具有极佳的一致性分数,几乎与英特尔750的分数一样好。虽然OCZ的Vector 180在其稳定状态下提供了非常高的平均性能,但它其稳态性能的标准偏差远远不如三星960 Pro和英特尔750,差距在十倍以上。
在非常高性能的初始阶段后,960 Pro进入稳定状态,具有非常好的短期一致性,但性能逐渐长期变化。这种性能特性与三星此前的SSD不同,而与英特尔750更类似。但有趣的是,960 Pro在转换到稳定状态之前的初始阶段,其性能比英特尔750快了两倍多。
测试中最后400秒的成绩表明960 Pro的稳定状态基本上无瑕疵,整个页面都保持一致,可以说是一个消费级SSD的完美分数。这种性能甚至会使960 Pro成为一款相当不错的企业级SSD,对于使用面向消费级固件的SSD通常不会这样。
AnandTech Storage Bench - The Destroyer
The Destroyer是一个很长的测试,还原了台式机使用中的IO密集型访问模式,详细的内容可以在这篇文章中找到。在现实情况使用中,不像我们的IOmeter测试,SSD确实得到一些休息,允许一些后台垃圾回收和刷新缓存,但那些闲置时间被限制为25毫秒,以便它不需要一周的时间来运行测试 。
我们通过记录SSD的平均数据吞吐量、SSD延迟的几个数据点以及SSD在测试过程中功耗,来量化SSD的性能。
2TB 960 Pro创造了一个新的记录,平均数据速率高于950 Pro,但是改进不算是很大,特别是相比512GB 950 Pro,容量已大幅增加。
与第二快的SSD相比,2TB 960 Pro将平均服务时间减少了近30%, SATA SSD即使在ATSB Light测试中也无法提供这么低的平均服务时间。
这是首次有SSD在没有超过100毫秒处理便完成了测试,虽然在更严格的10ms级对比下,960 Pro相比950 Pro的提升较小。
960 Pro基本上没有牺牲功耗效能来提高的性能,保持与上代一样的水平,尽管不如一些SATA SSD更高效。
AnandTech Storage Bench - Light
我们的Light存储测试比Destroyer或Heavy测试具有相对更多的持续读写和更低的队列深度,并且它是迄今为止最短的测试。它主要基于不过度依赖于存储性能的应用程序,因此这更多是针对应用程序启动时间和文件加载时间的测试。 该测试可以看作是日常使用中所有小延迟的总和,将空闲时间调整为25ms后,运行需要不到半小时。 Light测试的细节可以在这里看到。
三星再一次在Light测试的平均数据速率中打破了自己无法被挑战的记录。 NVMe SSD在空盘和满盘的成绩上显示相对较大的性能差异,而较快的SATA SSD在空盘时表现得更好的差距就很小。
960 Pro在平均服务时间几乎没有任何改善,但它并不需要,因为它满盘时的性能在最差的情况下,也要比竞品在最好的情况下要好。
在PCIe SSD中,只有OCZ RD400在少数操作中需要超过10毫秒才能完成。 三星850 EVO本身是一个例外,因为Light测试完全在其SLC缓存中进行,所以没有操作需要超过10ms。
960 Pro的功耗再次类似950 Pro:比其它PCIe SSD更好,但不如SATA SSD。
随机读取性能
随机读取测试4kB区块,测试范围从1到32的队列深度,队列深度每三分钟增加一倍,总测试持续时间为18分钟。测试跨越整个驱动器,在测试开始之前被填满。我们列出的主要分数为队列深度1、2和4处的性能的平均值,因为普通用户通常主要进行低队列深度操作。
三星960 Pro扩大了低队列深度随机读取性能的统治级领先优势。
960 Pro的功耗与其提高的性能成正比,只有一小部分SATA SSD的功耗更好,但总体性能只有960 Pro的一半。
虽然它们在较低队列深度的表现无与伦比,但960 Pro和950 Pro在QD32上的表现都不如预期,但这对消费级SSD几乎没有影响。
随机写入性能
随机写入测试4kB区块,测试队列深度范围从1到32,队列深度每三分钟增加一倍,总测试持续时间为18分钟。测试限制在SSD的16GB区域,除开保存的16GB测试文件外,SSD的其它部分为空。我们列出的主要分数为队列深度1、2和4处的性能的平均值,因为普通用户通常主要进行低队列深度操作。
960 Pro的随机写入性能相比950 Pro有了很大进步,赶上了OCZ RD400,但仍然远远落后于英特尔750。
除了相比950 Pro极大地提高了随机写性能外,960 Pro还大大降低了功耗,跳到了效率排名的前面,刚好在Crucial MX300前面。
960 Pro在950 Pro过热保护的QD2阶段有改善,在QD4开始稳定,并且测试的后半段都能保持,在某种程度上比OCZ RD400有更稳定的性能,后者功耗更高,因此有更明显的过热保护,而英特尔750有大的散热器完全避免了过热。
持续读取速度:
持续读取测试128kB区块,测试范围从1到32的队列深度。队列深度每三分钟增加一倍,总测试持续时间为18分钟。测试跨越整个SSD,并且在测试开始之前驱动器被填满。我们列出的主要分数为队列深度1、2和4处的性能的平均值,因为普通用户通常主要进行低队列深度操作。
2TB 960 Pro的低队列深度顺序读取速度比950 Pro快约300MB/s,这再次给三星带来了性能的明显优势,也表明过温度控制是960 Pro可以显著优于950 Pro的一个因素。
960 Pro比前代的功耗更高,但考虑到其高性能,它是效率最高的SSD。
在QD1之后性能略微下降表明960 Pro在这个测试的大部分阶段受过热保护,像950 Pro那样如果有散热器表现会更好。
持续写入性能
持续写入测试128kB区块,测试队列深度范围从1到32。队列深度每三分钟增加一倍,总测试持续时间为18分钟。测试跨越整个SSD,并且在测试开始之前SSD被填满。我们列出的主要分数为队列深度1、2和4处的性能的平均值,因为普通用户通常主要进行低队列深度操作。
与持续读取相比,温控是影响持续写入测试的更大因素,960 Pro比排在后面的M.2 SSD快60%,几乎赶上散热垫位于主控后面、可以使用适配卡作为散热器的RD400A。
960 Pro的功耗仅略高于其M.2竞品,远低于RD400A。考虑到性能,这使得960 Pro在这个测试中是迄今为止最高效的SSD,每瓦性能比排在其后一位的SSD高约30%。
960 Pro在QD1阶段的性能明显高于SSD受过热保护后其余阶段的性能。 QD1阶段的功耗仅略高,因为在其温度达到极限之前消耗了更多一点电力,之后达到平均大约4.4W。
混合随机读/写性能
混合随机I/O基准从纯读测试开始,并逐渐增加写入的比例,以纯写入完成。 整个测试的队列深度为3,每个子测试持续3分钟,总测试持续时间为18分钟。 与纯随机写入测试一样,此测试仅限于SSD的16GB区域,除16GB测试文件外,SSD其它部分为空。
三星950 Pro在混合随机I/O测试中从未有过明显的领先优势,OCZ RD400要高一些,而960 Pro比OCZ快22%,独占鳌头。
960 Pro具有与速度不到其一半的SATA SSD相当的功耗,并且明显低于其它NVMe SSD的功耗。
测试中的大多数SSD在测试的前半部分都在200MB/s以下,但后面开始提高并以快速的随机写入成绩结束,960 Pro在第二阶段达到200MB/s,并在整个测试期间持续增加,最后以甚至击败英特尔750的随机写入速度完成。
混合顺序读/写性能
混合持续存取测试覆盖SSD的整盘,并使用队列深度1。它从纯读测试开始,并逐渐增加写入的比例,以纯写入完成。每个分测验持续3分钟,总测试持续时间为18分钟。SSD在测试开始之前填满。
960 Pro的混合持续速度让任何过去的SSD无法望其项背,比OCZ RD400A快约30%,是任何SATA SSD的三倍以上。
960 Pro的功耗大约与OCZ RD400相同,略高于950 Pro,因此它比任何其它SSD的效率只高了约15%。
在测试的开始和结束,960 Pro似乎都受到过热保护,功耗高于4W。 在测试的中间阶段通常可以看到最低性能,960 Pro并没有降到接近SATA速度, 它性能上最接近的竞争对手(OCZ RD400)在测试早期的重读部分的性能差得多。
ATTO
ATTO的磁盘基准是一个快速和容易的免费软件工具,用来衡量磁盘在传输各种大小文件时的性能。
960 Pro在传输32kB或更大的文件时发挥出最大性能,而英特尔750在1MB传输之前并没有达到最高读取速度,OCZ RD400要达到最高读取速度需要在512kB传输。与512GB 950 Pro不同,960 Pro没有任何触发过热保护。
AS-SSD
AS-SSD是另一个快速免费的基准测试工具,它使用不可压缩的数据进行所有的测试,使它成为一个简单的方法来监视哪些SSD依赖于数据压缩。测试持续时间短使其成为峰值驱动器性能的可靠指标。
960 Pro读取速度远超其它PCIe SSD,但还没有达到宣称的3.5GB/s,而写速度更突出,略微超过2100MB/s的宣称速度。
闲置功耗
由于基于现实情况使用的ATSB测试将闲置时间缩短至25ms,因此其功耗分数不适合反映SSD在移动使用时的情况,在普通用户的实际使用中,SSD的闲置时间远比执行命令的时间要多得多。
NVMe SSD主要有两种方式可以在闲置时节省电量。第一种方法是通过活动状态电源管理(ASPM)机制挂起PCIe链路,类似于SATA链路电源管理机制。两者都定义两种省电模式:具有严格唤醒延迟要求的中间功率节省模式(例如,对于SATA“Partial”状态为10μs)和具有更宽松唤醒要求的更深状态(例如对于SATA“Slumber”状态为10ms )。几乎所有SSD和主机系统都支持SATA链路电源管理,但台式机往往是默认关闭这个功能。 另一方面,PCIe ASPM支持是一个雷区,通常会遇到无法实现它或不正确地实现它的设备。对于默认禁用它的系统,强制启用PCIe ASPM可能导致系统锁定; 这是我们当前的SSD测试台的情况,因此我们无法测量PCIe ASPM对SSD闲置功耗的影响。
NVMe标准还定义了与PCIe链路电源管理分开的SSD电源管理机制。SSD可以定义多达32种不同的电源状态,并通知主机进入和退出这些状态所需的时间。这些电源状态中的一些可以是操作状态,其中SSD以受限制的功率预算继续执行I/O,而其它的是非操作的闲置状态。主机系统可以直接设置这些电源状态,或者它可以声明用于在闲置不同长度的时间之后SSD可以自主地转变到哪些电源状态的规则。
对NVMe电源管理是一个问题,虽然我可以在Linux下使用低级工具进行手动设置电源状态,但我还没有看到任何操作系统或NVMe驱动自动采取这种节电。接下来的工作是将自动电源状态转换(APST)支持添加到Linux NVMe驱动程序的工作,并且可以配置Windows以使用某些SSD和NVMe驱动使用此功能。 NVMe电源管理包括APST好在不依赖于主板支持PCIe ASPM的方式,所以它应该最终能达到与SATA link电源管理相同的广泛可用性。
我们报告每个SSD的两个空闲功率值:在没有上述电源管理状态进行的情况下进行的活动闲置测量,以及具有SATA LPM睡眠状态或最低功率NVMe非运行电源状态(如果支持的话)的闲置功耗测量 。
PCIe SSD的活动闲置功耗仍然远高于SATA SSD的典型值,这同样使得他们的温度相对较高,960 Pro 2TB只比950 Pro的功耗稍大。
在启用省电模式的情况下,三星的NVMe SSD几乎与典型的SATA SSD一样高效,960 Pro并不令人惊讶地比低容量950 Pro略多。虽然OCZ RD400确实受益于一些电源管理,但仍然比它应有的表现要远高很多。
总结
三星为这个SSD定下过高的指标,使得2TB 960 Pro没有达到规格上的性能,但对任何其它标准来说,这是一个非常快的SSD。它相比其前代提升了性能,它几乎在每个测试中都创下新的性能记录,同时保持在大致相同的功耗和在温控保护之内,而与在以前的PCIe SSD倾向于牺牲效率以达到更高性能的不同,它也用其效率创下了许多新的记录。
960 Pro的性能甚至表明它可能是一个合适的企业级SSD,虽然它缺少在大多数企业级SSD上的电源损耗保护电容器(这也是企业级M.2 SSD用更长的M.2 22110尺寸的原因)。960 Pro在我们的随机写入一致性测试的性能明显是企业级,在服务器的高气流环境中,它应该提供更好的持续性能,而在我们的桌面测试台会因高温而温控。除了写入耐久性等级,三星可能不需要改变很多,便可以制造一个基于这个Polaris主控的好的企业级SSD。
SATA SSD做好也只能提高几个百分点的性能,而效能大多数没有改善太多。 目前的产品没有充分利用PCIe 3.0,因此NVMe SSD的换代改进可能会更大,这个大放在SATA SSD市场都将是革命性的,无论是相对提升的百分比还是绝对提升的MB/ s和IOPS。
另一方面,这是一个2TB SSD与大多数都小的PCIe SSD的比较,它具有四倍的容量于和两倍的NAND芯片数于最大和最快的950 Pro。更高的容量几乎总是能够实现更高的性能,512GB 960 Pro可能在很多测试中,未必比其前代或当前最快的相近容量的SSD更有明显优势。
这此评测不应该作为三星960 Pro最后的总结,我们仍然打算测试更小和价格更适合的容量版本,并对其温控特性进行更彻底的研究。我们还需要测试Windows 10的NVMe驱动,并将与三星发布的任何驱动对比测试。 此外,我们更期待测试三星960 EVO,它使用相同的Polaris主控,但用了TLC V-NAND与SLC缓存。960 EVO的保修期更短和耐久性等级更低,但仍然承诺比950 Pro有更高的性能,价格也更低。
2TB 960 Pro的1299美元建议零售价几乎和4TB 850 EVO的1499美元建议零售价一样令人震惊。这个SSD不是为每个人所有,虽然它可能被每个人所梦寐以求,但对于那些有钱的人来说,每GB的价格并不夸张。除了英特尔的基于TLC闪存的600p,PCIe SSD目前价格约为每GB要0.50美元,960 Pro每GB为0.63美元,比Plextor M8Pe贵,但比英特尔750或OCZ RD400A便宜。三星没有强调价格,而仅从性能和效能方面比竞争对手有优势。960 Pro和960 EVO尚未在亚马逊上市,只列出为“即将推出”,在Newegg上没有价格,但它们可以直接从三星预订,预计发货时间为2-4周。
从32叠层V-NAND转换到48叠层V-NAND,960 Pro似乎没有提供比950 Pro更节省成本。这个48叠层V-NAND遇到了麻烦,无法达到预期,比三星计划的更晚推出到市场上:最初应该在今年上半年在950 Pro上转换,并获得1TB的容量。 这并不影响960 Pro被关注,但显然三星对于扩展3D NAND过于乐观,这难免应该用越来越多的怀疑眼光来看待他们对64层代的预测。
此稿件翻译来源于:AnandTech,点击链接访问原文:
http://www.anandtech.com/show/10754/samsung-960-pro-ssd-review