2017年1月4日,英特尔正式解禁了最新的第七代智能酷睿处理器家族全系新品,加上早前NVIDIA推出的GTX 10系独显,电脑产品硬件迎来又一次全面更新。从我们的测试以及网络上普通用户相继发出的个人测试结果来看,英特尔第七代酷睿处理器相对于第六代处理器而言,在跑分性能上提升幅度并不大。不过这并不是说第七代酷睿就是彻头彻尾的“挤牙膏”一代。 其实相对于纸面跑分性能的表现,英特尔在第七代酷睿平台底层上做了较大幅度的优化,包括架构、指令集等方面。因此我们其实可以这样认为:虽然Kabylake与Skylake同样都使用了14nm工艺制程,跑分差异也并不大,但Kabylake是更为先进的14nm工艺制程,整体的能效比更为出色。 不过,相对于处理器性能而言,笔者对于与七代酷睿同行而来的“Optane内存”更感兴趣。同时,笔者个人认为第七代酷睿与200系芯片组最大的惊喜,也来自于对Optane的支持。 在2017年1月4日的发布会上,英特尔正式公布了Optane的中文名称——闪腾。那么Optane到底是什么?它的基本技术原理是怎样的?相对于以往的存储介质来说有哪些优势呢?接下来,笔者将用最容易被大家理解的语言,来揭开Optane的秘密。 打破NAND瓶颈 存储进入3D时代 其实早在2015年8月份的旧金山IDF 15上,英特尔就公布了Optane。但当时并未强调Optane,而是以Optane的核心技术3D Xpoint为主要切入点来向媒体以及用户做出展示的,因此要想搞懂Optane是什么,首先要明白Optane核心的3D Xpoint技术是什么? 我们都知道,以往PC体验主要受制于处理器性能,尤其在奔腾、赛扬时代最为明显。而到了酷睿时代,随着处理器性能不断飞跃,影响PC整体体验的瓶颈从处理器逐渐转向内存、硬盘这样的存储介质。这就是为什么老处理器平台机器加个内存条、换块SSD/" target="_blank" class="relatedlink">固态硬盘就能再战五年的主要原因。 因此,如今电脑性能的提升,已经从以往的“升级处理器”转向了“升级内存与硬盘”。不过,即便是同等规格下的内存与硬盘也存在性能上的高低差异,想要进一步突破瓶颈,就需要推出更加先进的存储技术。Optane所使用的3D Xpoint技术,就是为此而生。 时下,内存与固态硬盘所使用的都是NAND闪存,想要在此基础上去不断提升性能变得越来越困难,所以需要全新的闪存技术来实现性能的突破,3D Xpoint就是针对NAND闪存瓶颈而打造的全新技术。总结为一句话就是:NAND闪存性能提升难以突破之后,3D Xpoint的出现为性能再次飞跃带来了可能。 那么3D Xpoint技术的原理是什么呢?为什么能够完成NAND闪存所不能完成的任务呢?首先要明白的是,3D Xpoint是一种改变传统闪存架构的技术,本质上并不是一种单纯通过提升闪存存取速度来达到性能提升的技术。这就像处理器性能提升过程中,除了暴力拉升主频之外,对底层架构优化也能够达到性能提升一样,3D Xpoint技术就是一种全新的闪存架构技术。 那么有朋友就要问了,3D Xpoint架构与传统的NAND闪存架构有何不同呢?这里我们不妨以比喻的方式来进行说明,这样会更好理解。首先我们假设有一个占地20000平米土地的小镇,镇子里起先有2000个人。在3D Xpoint出现之前,镇子里的人都住在平房里,那么这时候每个人所摊的面积只有20000÷2000=10平米。大家可以想像一下10平米的空间得是有多挤。 面对这种状况,小镇领导班子经过研究请来了一位设计师和一个施工队,力求解决小镇居民们现在这种拥挤的状况。于是设计师设计出了一幢足够容纳2000人的大楼,而施工队则将原本的平房都推到,迅速盖起了设计师设计出的大楼。这幢大楼的占地面积必然要比原本的大片平房占地面积小很多,但却容纳了原有的2000人。 说到这里相信大家已经明白了吧?没错!3D Xpoint就像它的名字“3D”一样,是一种立体化的闪存架构。3D Xpoint技术其实就是将原本平面化的NAND闪存结构变成了立体结构,在这样的立体结构里,存储容量不再单纯受芯片平面面积大小的影响,因此同样的芯片面积上可以容纳更大的数据吞吐量。 此外,领导班子请来的这位设计师和施工队,就是这项技术的设计者和开发者——英特尔与镁光。所以我们也就明白了,英特尔推出的基于3D Xpoint技术的Optane内存与Optane固态硬盘,实质上就是全新的3D存储介质。 引入新架构 数据吞吐更高效 3D Xpoint是一种立体化的存储技术,它看起来与同为3D设计的TLC NAND技术相似,但其实本质却不同,3D Xpoint并不单纯是NAND,而是一种新的存储介质,并且是一种新的非易失性存储技术。从架构设计上看,它与FlashTec NVRAM加速卡有些近似,用RAM作为缓存,提高访问速度,同时用NAND作为存储介质。因此,3D Xpoint在速度上有优势,同时又具有非易失性存储的优点。 然而看到这里可能懂行的朋友就会说了,“这不就是之前各家都推过的3D内存吗?有啥可吹的?”虽说3D Xpoint同样是一种3D闪存,但此3D并非彼3D,二者之间还是有较大差异的。我们还是以比喻的方式来说明。 普通3D闪存是一层地建一层平房,之后通过多层地面堆叠构成3D闪存,但本质上房子还是平房。而3D Xpoint是在一层地上就建了很多幢大楼,并且盖完大楼还能堆很多层地,然后再建大楼,与平房比起来,自然是楼房单位面积内的容量更大,孰优孰劣显而易见。那么英特尔的3D Xpoint技术在架构方面有怎样的特性呢?为什么能够被称为革命性的架构转变呢? 其一,高效的交叉阵列结构。3D Xpoint让存储变得立体化,那么在立体化的空间里排布存储单元就与在平面里排布有所不同。基于3D Xpoint技术的存储介质中,通过垂直导线连接着多达1280亿个密集排列存储单元,每个存储单元存储一位数据,立体化让结构变得更加紧凑,而借助这种紧凑的结构就可以获得高性能和高密度位。 这么说可能大家不太明白,我们还是以比喻的方式对上面一段文字做个解释:设计师英特尔先生在设计好小镇大楼之后,觉得如果还是按照传统的走廊式设计,那么住在这幢大楼里的2000人串门会很不方便。于是英特尔先生瞬间被哆啦A梦附体,给每个房间都装了无数个任意门,而这些任意门可以让大楼里的居民们直通楼里的任何一个房间,这样的话有人想串门时就会方便、高效的多了。 这就是3D Xpoint技术的交叉阵列结构。它可以让大楼里(存储介质)的每一个居民(存储单元里的一位数据)之间的联系变得更加紧密高效,数据的吞吐变得迅捷自由,交叉阵列结构的高效性就在这里。 其二,存储单元可堆叠。交叉阵列结构让数据的吞吐变得迅捷、高效,然而如果数据容量无法得到保证的话,这种高效吞吐又会失去意义。在单个文件容量越来越大的今天,存储介质在提升速度之外,当然还要重视容量的提升。因此,3D Xpoint技术还允许存储单元被堆叠到多个层中,这样就可以有效提升存储介质的容量。 目前,现有的技术可以使集成两个存储层的单个芯片存储128Gb数据,而未来,通过改进光刻技术、增加存储层的数量,其系统容量可以获得进一步的提升。那么“存储单元堆叠”是啥意思呢?接下来我们再以比喻的方式为大家进行解读:允许存储单元堆叠,就可以在有限的面积内增大存储容量。所以我们回到英特尔先生设计的大楼所在的这个小镇子中来。 在当初英特尔先生设计大楼时,小镇常住居民只有2000人,于是设计一幢大楼就可以容纳下这些人,但小镇的实际面积有20000平米,一幢大楼占地面积显然不可能有20000平米这么多,这样如果只盖一幢大楼的话,那么其它“土地”就完全浪费了。因此英特尔先生开始考虑是不是要把剩余的土地利用起来,以求利益的最大化。 于是,英特尔先生与镁光施工队一合计!就又在这20000平米的土地上盖了更多的房子,然而土地都被用来盖房子了,小镇里的道路问题怎么解决呢?颇富想象力的英特尔先生并未采用传统的地面道路建设方案,而是把每一幢大楼通过任意门相互打通,使新加入的居民和老居民之间能够任意进出每一幢大楼的每一个房间。 这就是存储单元堆叠与交叉阵列结构同时存在于3D Xpoint技术里的原由,不仅每一幢楼里的住户们之间能够自由“串门”,楼与楼之间的住户们同样可以自由“串门”。技术呈现出来的效果就是:既能够扩大存储容量,又能够通过交叉阵列结构提升数据吞吐速度。 加入新模块 高效又长寿 其实明眼人都能看得出来,之前我们所说的交叉阵列结构与存储单元堆叠都是为了小镇“住户”来考虑的,小镇住户的身份其实就是数据存储。但内存与硬盘不只是涉及到“存储”这个概念,访问与读取也是很重要的。存储快了,但是访问、读取慢了的话,内存、硬盘性能还是上不去,盖那么多大楼、开那么多任意门岂不是白白浪费了? 引入选择器提升效率 延长寿命 所以英特尔在3D Xpoint技术中又引入了选择器。我们知道,在NAND闪存中,数据是以位(bit)的方式保存在Memory Cell中,一个Cell存储一个bit,这些Cell或8个或16个为单位,连成bit line,而这些line组合起来会构成Page,NAND闪存就是以页为单位读写数据,以块为单位擦除数据,同时按照这样的组织方式形成三类地址:Block Address、Page Address以及Column Address。对于NAND闪存来讲,地址和命令只能在I/O上传递,数据宽度只有8位。 3D Xpoint中的选择器就是为了解决这些瓶颈而被“请”来的。我们先看看其原理:存储单元通过改变发送至每个选择器的电压,来实现数据的访问、写入或读取,相对于NADN闪存通过寻址方式来实现数据访问、写入、读取或擦除的方式,3D Xpoint效率更高。此外这样做的好处不仅消除了对晶体管的需求,同时也在提高存储容量时能够降低成本。因此3D Xpoint是一项既能够提高存储介质速度、性能的技术,同时又是一项能够降低存储介质成本的技术。 不明白?没关系,我们还是以比喻的方式对此进行说明:设计师英特尔先生与镁光施工队在小镇上的开发,让原本只有20000平米的小镇拥有了一个高楼连着高楼的超大规模住宅区,目测一下似乎住个200000人也不成问题了。但尴尬的是,这个小镇原本的常住居民只有2000人,那另外那些空着的房子怎么办呢? 于是英特尔先生与镁光施工队狼狈为……呃,再次合作,合伙拓展旅游事业。他们将空置的房间改成旅馆,租给来来往往路过这个镇子的游客。但是游客们都想住在采光好、视野好的房子里,所以时间久了这些房间就会因过度使用而出现问题。 面对这样的尴尬,英特尔先生和镁光施工队又想出一个游客管理办法:让游客们轮流使用所有房间。这样就不会出现一个采光好、视野好的房子经常被光顾,却因过度使用而损坏甚至垮塌的悲剧。 说到这里可能大家明白了,选择器的主要作用就在于,它可以合理有效的调控数据存储位置,并且让数据不单单只呆在一个地方,通过这种动态、随机的分配机制,可以让存储单元有更高的有效利用率,同时也能够让访问、写入、读取、擦除变得更高效,此外整个存储介质的寿命也会变得更长。 如果说交叉阵列结构是为数据盖了一栋大房子,而存储单元堆叠让这栋大房子更具规模,那么选择器在其中所起的作用,就是合理有效的调动这片大规模房屋中的数据,让它们变得更易访问、更快速的读写。 引入快速切换单元 提升效率 然而,面对超大量的数据吞吐,如果仅凭借选择器的话,效率还是有所掣肘,毕竟“一个人”的力量是有限的,一个选择器也无法解决所有问题。因此3D Xpoint中还引入了“快速切换单元”。通过快速切换单元,选择器就像开了挂一样,其高效性就会被彻底激发出来。 我们还是先来了解一下基本的原理:基于3D Xpoint技术所打造的存储介质,会凭借更为小尺寸的存储单元,快速切换选择器、低延迟交叉点阵列以及快速写入算法,让每一个成员始终处于高效的工作状态中,而避免有的忙有的闲这样的情况发生。在这种情况下,存储单元能够以高于目前所有非易失性存储技术的速度切换其状态。这是3D Xpoint技术提升存储性能的秘诀所在。 还是没看懂?别急,来来来,让我们再回到小镇中来。其实很多人从来没有见过英特尔先生和镁光施工队这样的盖房子方法,于是慕名而来参观的游客越来越多,同时也想体验一下小镇的生活。这虽然是好事,但人一多,就造成了接待处经常排长队的现象,不仅给小镇的形象带来了影响,同时也让游客们抱怨不已。 针对这种情况,设计师英特尔先生决定培养一批专业管理员,让他们了解小镇大楼里每一个房间的位置以及情况。经过培训的管理员们被安排在了每一栋大楼的门口,当有游客到了之后,这些管理员会一对一轻车熟路的将他们领到相应位置的空房间里住下,这样就缓解了接待处的压力,让效率得到提升。 而这些管理员,其实就是快速切换单元,它们能够将数据合理、快速的分配到没有人住的房间,省略了中间一一排查寻址的过程,自然而然也就能够提升数据吞吐的速度了。 其它说明与官方性能数据分享 从之前的解读中我们可以看出,基于3D Xpoint技术的Optane内存与Optane固态硬盘,实质上就是近年来所出现的3D闪存技术。然而英特尔的高明之处在于,3D Xpoint技术是以“3D+3D”的方式来最大限度提升效率与性能,普通的3D存储技术则是“2D+3D”的方式,二者孰优孰劣,差异在哪儿,显而易见了吧? 那么英特尔的Optane内存与Optane硬盘实际表现到底怎样呢?我们什么时候才能使用到Optane呢?怎样的硬件配置才支持Optane呢? 首先,Optane在最初公布之时,主要是要推广Optane固态硬盘。而随着第七代酷睿平台的公布,英特尔也增加了Optane内存。其次,Optane内存将在2017年第二季度正式出货,而Optane固态硬盘的出货时间尚未公布。Optane内存型号为Intel Optane Memory 8000P系列,拥有16GB与32GB两种容量规格。Optane中文名为“闪腾”,搭载Optane的电脑会有专属的“Optane贴标”。 第三,Optane内存与硬盘都是通过M.2接口来进行数据传输。第四,只有英特尔200系芯片组主板以及英特尔第七代酷睿处理器才支持Optane内存,非200系主板或者200系主板却并未搭载第七代酷睿这些情况,是不支持Optane内存的。所以想要体验Optane内存,就必须要同时升级200系主板与第七代酷睿。 最后,Optane内存目前的实际用途其实就是沟通系统内存与SSD或HDD之间的缓存,也可以理解为用内存的速度干硬盘的事。接下来我们再看看英特尔官方公布的一些数据:首先,我们之前也说了,Optane是由英特尔与镁光联合开发的全新闪存标准,是一种非易失性存储技术,结合了DRAM内存的高速度与NAND闪存的数据保持性,寿命更长。 其次,Optane内存可以与系统内存、HDD、SSD共存,它的主要作用是提升HDD/SSD速度,以及系统响应速度,包括系统启动速度、应用载入速度等,可以看作是内存、硬盘之外的一种高速辅助存储介质。 第三,在性能方面,官方公布的数据为:理论速度是目前NAND闪存的1000倍,耐用性也达到1000倍,支持NVMe,有M.2 2241与M.2 2280两种规格。读写性能方面,32GB版本最高读取速度为1600MB/s,写入速度500MB/s;4K随机读取部分为300K IOPS,4K随机写入是120K IOPS。16GB版本读取为1400MB/s,写入最高为300MB/s;4K随机读取为285K IOPS,4K随机写入是70K IOPS。 不过究竟实际性能如何,我们也要等到2017年第二季度出货之后才能看到了。此外,Optane初代产品性能可能会有所保留,但未来潜力巨大,4K随机读取性能峰值或可达到464300 IOPS,是其现有企业级SSD P3700的五倍还多,对电脑体验提升相当可观,值得期待。 |