微信扫一扫 分享朋友圈

已有 9395 人浏览分享

开启左侧
9395 16
 编者按:对于很多普通用户来说,小小内存的显得非常的不起眼。PC100规格的推广期间,首先引起了用户对于内存的普遍关注。随后的一系列产品,对于有一定硬件知识的用户来说还都算比较容易区分(这里指的上它们的主要特征,实际上内存技术是相当难于理解的技术之一)。比如SDR和DDR,读取数据的触发点增加了一倍,数据输出带宽也就相应的增加一倍;DDR和DDR II,主要是预取数据宽度不同,所以数据输出带宽也不同。不过,随着用于显卡的GDDR、GDDR2和GDDR3的概念相继出炉,很多用户就想当然的以为GDDR2就是DDR2、GDDR3就是DDR3,很多厂商在宣传的时候似乎也含糊其辞。本文将会给较为详细的揭示各种内存规格和GDDR/GDDR2/GDDR3之间的联系,帮助大家明确的辨析这些概念,做到明明白白消费。  DRAM内存循序渐进的发展历史  内存的发展总是循序渐进的,而且是一步一个脚印,后来的技术总是建立在原有技术的基础上。每个人接触到的第一款内存类型都不一样,我是从快页内存(FP DRAM)开始接触电脑的,随后使用了EDO DRAM,这两种内存都无法和系统时钟同步工作。之后就是造成内存发展革命性变化的SDRAM,当然了SDRAM也不是凭空产生的,它也是EDO的改进产品。SDRAM可以和系统时钟同步,SDRAM中的PC66/PC100和PC133都被大家所熟知。由于Intel的不支持使DDR差点胎死腹中,我想DDR和RDRAM的战争以及其中的曲折想必大家都有所耳闻,幸好有VIA为DDR推波助澜,才使的DDR成为主流的内存。DDR2技术基于DDR,它的出现是为了解决DDR内存发展遇到的瓶颈。此外这篇文章还要向大家介绍GDDR,GDDR2和GDDR3,它为是针对显卡设计的高性能DRAM,对于它们想必还有很多读者存在疑问,在这篇文章中会一一阐述清楚。  DRAM内存的本质特点  实际上,DRAM是一个晶体管和一个电容的结合体,很简单但也很高效。换句话说,基本的DRAM架构仍然是现代内存类型的基础,因此,所有的现代内存类型都继承了DRAM的优点和缺点:它需要刷新(预充电,不然随着漏电,DRAM中的数据会消失),以及有操作频率的上限(这也是用电容充电来存储数据的弊病)。DRAM频率不能无限提升,只有在I/O上做文章。SDRAM采用管线架构,内部存储单元的频率和输出频率是一样的。DDR则采用数据预取的架构,同时预取2bit数据,因此输出数据传输率可以做到内部数据传输率的2倍,DDR2则是同时预取4bit数据,在内部存储单元频率不变的情况下,把数据传输率提高4倍,下面会更详细的说明数据预取概念。DRAM的发展历史  最早的DDR标准是DDR200,这个标准被遵循了很久。DDR200的核心工作频率是100MHz,这和PC100 SDRAM的工作频率是一样的,DDR内存可以在每个时钟信号的上升延和下降延传输信号,因此获得工作频率两倍的数据传输率。我们把工作在100MHz的DDR内存称为DDR200,它的速度传输率为1.6GB/s,也叫PC1600。就象PC100到PC133一样,频率的提高总是以33MHz为单位,133MHz频率的DDR SDRAM被称为DDR266,它的数据传输率为2.1GB/s。随后是DDR-333,数据传输率达到了2.7GB/s。DDR400的出现是为了和前端总线同步,获得更高的性能,目前双通道DDR400内存使用很普遍。不过到了DDR400,其内部存储单元的工作频率已经高达200MHz,进一步提升频率遇到了困难,这时候需要引入新的内存类型来解决。

评论 16

jack20030531  V3+  发表于 2008-10-1 15:38 | 显示全部楼层
引入DDR2是DRAM发展的必须选择


  通过上面对DDR SDRAM的讲解,DDR2的特性就很容易理解了,和DDR一样,DDR2的外部总线仍然使用双倍传输数据的策略,不然就不能称之为DDR(双倍数据传输率)内存了。在内部总线数据预取上,DDR2采用了新的4bit prefetch方式来解决DDR内存发展遇到的瓶颈,在不提高核心频率的前提下,提升数据传输率。
  解决内存发展瓶颈4bit prefetch架构


  SDRAM的管线突发结构和DDR的2bit Prefetch结构,以及DDR2的4bit Prefetch结构之间的区别。我们注意到这三种内存类型的内部存储单元,也就是Cell队列的工作频率都是100MHz,数据传输率之所以有差别,是通过不同的内部I/O位宽来实现的。DDR2用的4bit prefetch相当于同时预取四位,输出一位,也就是说输出数据传输率是内部Cell队列数据传输率的4倍。

DDR2内存架构示意图

  目前DRAM内部采用4 bank的结构(1Gb DRAM采用8 bank结构),每个bank由存储单元(cell)队列构成,存储单元队列通过行(row)和列(column)地址定位。它们的工作流程是:首先是命令和地址信息输入,经过地址解码器分解成bank(段)和Word(字)选择,Word选择就是行(Row)选择,然后要对存储单元进行再存储(Restore)和预充电(Precharge)过程。我们知道DRAM是通过电容来存储数据的,而电容会放电,通过预充电来防止DRAM信息丢失。然后是Column(列)选择,到此为止存储单元(cell)已经被定位。存储单元的数据被放大然后输出到内部数据总线(Internal Data Bus)。内部总线通过4-bit prefetch结构处理传输到输出缓存。如上图所示的DRAM内部数据总线是128位,通过4bit-prefetch转换成32bit总线,通过提高频率和在时钟上升延及下降延传输数据,虽然输出总线位宽变窄,但是数据传输率是一样的。
  通过4bit-prefetch结构可以在相同的Cell工作频率上把数据传输率倍增,有效的解决了内存发展所遇到的瓶颈。由于DRAM结构的限制,我们知道提升DRAM内部存储单元的频率是比较困难的,而且成本较高。DDR400的核心频率已经达到了200MHz,而DDR2 400的核心频率仅为100MHz,DDR2 533的核心频率为133MHz,可以看到引入DDR2把核心频率提升的空间又让出来了,让内存速度能够保证持续的发展,DDR2为今后几年内存发展奠定了基础。
3think  V3+  发表于 2008-10-1 15:39 | 显示全部楼层
支持一下
··········
jack20030531  V3+  发表于 2008-10-1 15:40 | 显示全部楼层
DDR2的新特性
  除了速度上的优势和更低功耗外,DDR2还有几个相对于DDR I增加的新特性
  一、ODT(On Die Termination):核心内建的终结电阻器,可以为DRAM的DQ(数据线)提供终结电阻。我们知道数据信号的终点需要终结电阻器,不然信号到了电路的终点会反射回来引起严重的干扰。终结电阻的大小决定了数据线的信号比和反射率,终结电阻小则数据线信号反射低但是信噪比也较低;终结电阻高,则数据线的信噪比高,但是信号反射也会增加。DDR II可以根据自已的特点内建合适的终结电阻,这样可以保证最佳的信号波形,这是DDR I不能比拟的。DDR I内存的终结电阻器做在了主板上,一块支持DDR内存的主板上需要几百颗终结电阻,这增加主板的成本和设计难度。DDR II把电路的终结功能做在了核心中,这样主板上就无需终结电路,减化了主板设计,提高了高靠性。我们在支持DDR2的主板上较找不到终结电阻器,主板设计更加的简洁,一方面可以降低成本,另一方面也能提高主板的电气性能,为将来更高的内存速度做准备。


  在DDR内存平台中,终结电阻位于主板上,这不但增加了主板制造成本,而且由于内存模组的特性不一样,终结电阻不可能调节到最佳值,而且颗粒之间也会存在信号反射。DDR2的终结电阻集成在核心中,DRAM颗粒激活时关闭终结电阻,DRAM颗粒在待命状态则打开终结电阻,解决了DRAM颗粒之间的信号反射。
  二、OCD(Off Chip Driver):也就是所谓的离线(Off Chip)驱动校准,通过OCD来维持内存的最佳驱动性能。OCD允许通过芯片组(chips)实时发送命令来调整DRAM芯片的驱动方式。DDR II具有弹性的数据调整方式是通过离线驱动来实现的,分为dc和ac两种。dc可以调整系统环境的阻抗,ac可以调整延迟锁相环(DLL)的补偿。


  DDR2 SDRAM通过OCD校准来提高信号完整性,在OCD校准中,设置I/O驱动阻抗来调节电压,使上拉和下接阻抗相等。它可以提高信号完整性,减少DQ-DQS歪斜(skew),第二,OCD可以提高信号品质。
  三、posted CAS:在一个posted CAS操作中,CAS信号(读/写命令)能够紧接着RAS信号(激活命令)的输入,这需要CAS命令增加几个附加的延迟(0,1,2或4个时钟周期)来实现。通过使用posted CAS可以更容易的设计控制器,解决总线“冒泡”问题。提升了命令和数据部线的效率,由于没有了“冒泡”冲突,提升了实际的总线带宽。而DDR2的写延迟为读延迟周期减一个时钟周期。DDR2通过增加地址和命令的FIFO(先入先出)寄存器来实现posted CAS,通过寄存器保存CAS命令和地址直到附加延迟结束,在DDR2段交错操作(bank-interleaving operation)时使用4bit突发模式来提高总线利用率。
  显然,DDR2已经来到我们身边,象Samsung,Hynix,Micron,Elpida都推出了DDR2 533和DDR2 667的颗粒,主要的内存模组厂商也推出了相应的DDR2内存模组,目前可以和925X以前部分915P主板配合的DDR2内存模组是PC-4300 Unbuffered DIMM。
  内存带宽和延迟参数
内存
主要延迟参数 Q3 2004
延迟, ns
带宽, GB/sec
DDR400*
2.5 – 3 – 3
12.5
3.2
DDR500**
3 – 3 – 3
12.0
4.0
DDRII-400
4 – 4 – 4
20
3.2
DDRII-400***
3 – 3 – 3
15
3.2
DDRII-533
5 – 5 – 5
~19
4.3
DDRII-533
4 – 4 – 4
~15
4.3
DDRII-533***
3 – 3 – 3
~11.3
4.3
DDRII-667
5 – 5 – 5
15
5.3
DDRII-667
4 – 4 – 4
12
5.3
  上表中的内存如DDR2 400根本就没有机会在市场上生存,由于结构的因素,它的延迟比DDR400还要高,因此桌面PC用的DDR2内存就直接从DDR2 533起步了,相当于PC4300。需要说明的是,DDR500并没有成为JEDEC的标准。具有3-3-3时序的DDR2 533需要到2005年下半年才会出现,目前主流的DDR2 533都是4-4-4时序。

DDR2 SDRAM的延迟参数

 
  最后我们把DDR与DDR2的主要规格对比表方上来:
特征
DDRDDR2
数据传输率266,333,400MHz400,533,667,800MHz
封装TSOP或FBGAFBGA
操作电压2.5V1.8V
I/O电压2.5V1.8V
I/O类型SSTL_2SSTL_18
密度64Mb-1Gb256Mb-4Gb
内部段4 bank4 bank或8 bank
数据预取
24
CAS延迟(CL)2、2.5、3时钟周期3、4、5时钟周期
附加延迟 (AL)0,1,2,3,4 时钟周期
读延迟CLAL+CL
写延迟固定读延迟减一个时钟周期
I/O宽度x4/x6/x18x4/x6/x18
输出校准OCD
ODT
突发长度2,4,84,8
jack20030531  V3+  发表于 2008-10-1 15:40 | 显示全部楼层
GDDR,针对显卡的DDR解决方案
  GDDR也就是Graphics Double Data Rate DRAM的缩写,针对显卡设计的高性能DRAM有两个主要特点,一是高密度寻址能力,也就是颗粒的容量要高,以满足显卡对内存容量的要求和显卡设计的要求。高密度图形内存寻址只是设计要面对的一半问题,另一半就是性能,显存必须能提供高速传输,现在的GDDR显存可以提供超过1GT/s的数据传输率。下面这张图表代表了GDDR的发展趋势和主要特征。


  我们看到显存的发展趋势,从DDR->GDDR2->GDDR3->GDDR4,其中GDDR4还没有正式发布,GDDR2和GDDR3已经大量应用在高性能显卡中。先来看看它们的最高工作频率(由于是DDR,因此数据传输率要乘于2),GDDR2也是500MHz,而且GDDR2工作电压同DDR1一样是2.5V,因此功耗过高,不过GDDR2的接口界面是SSTL-18(1.8V工作电压)。GDDR3和GDDR2相比最大的区别在于降低了工作,GDDR3的最高工作频率是700MHz,目前三星已经推出550MHz的GDDR3,hynix将会推出700MHz的GDDR3。我们看到GDDR2和GDDR3内部都采用4bank结构,4bit prefetch数据存取,可见它们的架构同样是基于DDR2 SDRAM。GDDR3的接口是POD-18(pseudo open drain),这也是不同于GDDR2的地方。既然是基于DDR2架构,GDDR2和GDDR3的延迟要比DDR1高一些。从封装来看,它们用的都是144Ball FBGA,而且GDDR3都采用8M×32的配置方式,也就是说都是256兆位的大容量颗粒,前面说到GDDR要解决的问题之一就是高密度寻址能力。
  如果把眼光放远一点,我们可以看到GDDR4,但是我们注意到nVidia的标准和JEDEC及ATi的不一样,nVidia支持的GDDR4仍然是基于4bit prefetch的DDR2核心架构,它的最高频率达到1.2GHz,它内部cell单元的频率已经达到400MHz,这是相当惊人的程度。JEDEC(ATi)则采用8bit Prefetch架构,也就是DDR3的核心,不过DDR3的标准还没有最后确立,因此JEDEC标准的GDDR4什么时候能推出还很难说,GDDR4的最高频率达到了1.4GHz,此外它配置成16M×32的方式,相当于512兆位的容量。下面来看看nVidia和JEDEC(ATi)的GDDR4的相同点,它们都采用136Ball FBGA封装,工作电压1.8V,接口界面为POD-15(1.5V),它们内部都是8 bank结构,GDDR4的cas延迟目前还是未知数。

GDDR3改进了ODT(终结电阻)电路,在静态模式下的功耗比GDDR2低了很多

  下面的章节通过三颗实际的DRAM来介绍几种GDDR的特征
jack20030531  V3+  发表于 2008-10-1 15:41 | 显示全部楼层
  GDDR
  通过上面的描述,我们可以知道GDDR是基于DDR,如三星的K4D551638D,它只是适合显卡使用的高性能DDR SDRAM,最高工作频率300MHz,最大数据传输率600Mbps/pin。K4D551638D的位宽是16bit,可以达到1.2GB/s/chip的性能。可编程的突发长度与可编程的延迟允许它应用于高性能的领域。它的主要特征如下:
  • 2.6V ± 0.1V 工作电压
  • 2.6V ± 0.1V I/O端口电压
  • SSTL_2 兼容输入/输出接口
  • 内部采用4 banks操作
  • 可编程的MRS
    - 读延迟 3, 4 (clock)
    - 突发长度 (2, 4 和 8)
    - 突发类型 (连续和交错)
  • 差分时钟信号输入
  • 自动和自刷新
  • 32ms 刷新周期 (4K 循环) 针对 -TC33/36/40
  • 64ms 刷新周期 (8K 循环) 针对 -TC50/60
  • 66pin TSOP-II封装,可见GDDR不一定要用FBGA封装形式
  • 最高时钟频率 300MHz
  • 最大数据传输率 600Mbps/pin
  GDDR2
  以三星的4Mx32 GDDR2——K4N26323AE为例,还说明一下GDDR2的主要特点,首先要清楚的是GDDR2和GDDR3都是基于DDR2核心架构,采用4bit数据预取模式,具有ODT等优势。它具有32bit的位宽,适合GDDR高密度的要求,最高工作频率是500MHz,最大数据传输率为1Gbps/pin,它的性能很高,可以达到4GB/s/chip。它的主要特征如下:
  • 2.5V ± 0.1V 工作电压
  • 1.8V ± 0.1V I/O端口电压
  • 核心集成终结电阻(ODT)
  • 通过EMRS调节输出驱动强度
  • SSTL_18 兼容输入/输出接口
  • 内部采用4 banks操作
  • 可编程的MRS
    - CAS 延迟: 5, 6, 7 (clock)
    - 突发长度 : 4
    - 突发类型 : 连续
  • 附加延迟 (AL): 0,1(clock)
  • 读延迟(RL) : CL+AL
  • 写延迟(WL) : AL+1
  • 自动和自刷新
  • 32ms 刷新周期 (4K 循环)
  • 144 Ball FBGA封装
  • 最高工作频率 500MHz
  • 最大数据传输率 1Gbps/pin
   GDDR2的缺点就是工作电压过高,达到了2.5V,它虽然是DDR2的核心,但为了达到更高的工作频率选择了提升电压的方式,这样势必会带来高功耗,使显卡的供电与散热都成问题。另外我们注意到GDDR2的突发长度固定为4,突发类型固定为连续。而且GDDR2只能采用FBGA封装形式,这点和DDR2要求是一样的。
  GDDR3
  以三星的2M x 32Bit x 4 Bank GDDR3 SDRAM——K4J55323QF为例,这是采用三星高性能CMOS工艺的内存,它具有32bit位宽。这颗GDDR3能实现超高的性能,可以达到6.4GB/s/chip。它最高工作频率是800MHz,最大数据传输率为1.6Gbps/pin。它的主要特征如下:
  • 1.9V ± 0.1V 工作电压
  • 1.9V ± 0.1V I/O端口电压
  • 核心集成终结电阻(ODT)
  • 通过EMRS调节输出驱动强度
  • 校准输出驱动
  • POD兼容的输入输出
  • 4个内部banks并行操作
  • 差分时钟信号 (CK 和 /CK)
  • CAS 延迟 : 5, 6, 7, 8 和 9 (clock)
  • 附加延迟 (AL): 0 和 1 (clock)
  • 可编程突发长度 : 4
  • 可编程写延迟 : 1, 2, 3, 4, 5 and 6 (clock)
  • 自动和自刷新模式
  • 自动预充电选项32ms 刷新周期 (4K 循环)
  • 144 Ball FBGA封装
  • 32ms 刷新周期 (4K 循环) 800MHz
  • 最大数据传输率 1.6Gbps/pin
  • 输出DLL电平
  显然GDDR3的优势很大,首先是工作电压降低了,可以有效减少功耗,这也是GDDR2升级到GDDR3最大的优势。GDDR3采用了POD输入/输出接口允许更短的DQS前导,GDDR3的可编程性能更强。从三星的Roadmap来看,GDDR3能够达到800MHz的工作频率,相当于1.6Gbps/pin的数据传输率,为高性能的显卡提供了有力保障。未来我们还有GDDR4,技术发展的脚步是不会停止的,DRAM技术仍然能在显卡中发挥应有的作用。
  小结
  这篇文章说明了DDR2的技术,以及与之相关的派生品GDDR2和GDDR3。我们可以了解到DDR2的出现不是偶然的,它是DRAM发展到一定阶段必须的产物,是解决DRAM本质缺陷,保持DRAM能够持续发展的解决方案。当DDR2发展到一定阶段,达到DRAM工作频率的瓶颈,DDR3就会应孕而生,它的基本要点是采用了8bit Prefetch架构,我们可以看到DDR3将会采用8 bank结构,同时预取8bit数据,这可以使DRAM仍然保持青春。而GDDR是针对显卡的DRAM解决方案,它提高了寻址密度,增加了工作频率,以满足显卡对内存带宽的渴求。希望通过此文能帮助大家更好的认识DRAM技术,以及它未来的发展趋势。


[ 本帖最后由 jack20030531 于 2008-10-1 15:43 编辑 ]
wo_shishuo  V3+  发表于 2008-10-1 16:49 | 显示全部楼层
能让用户明显感觉到性能提升了么?
handsome911_199  V3+  发表于 2008-10-1 17:49 | 显示全部楼层
绝顶好文!!!!!!!!!!!!!
小不点  V3+  发表于 2008-10-1 20:52 | 显示全部楼层
技术帖得顶一下
死老妖  V3+  发表于 2008-10-1 20:57 | 显示全部楼层
好复杂,看不懂,不过我用不着这东西
您需要登录后才可以回帖 登录 | 注册

本版积分规则

V3+

0

关注

21

粉丝

1

主题
精彩推荐
热门资讯
网友晒图
图文推荐
  • 微信公众平台

  • 扫描访问手机版

Archiver|手机版|小黑屋|水窝ibm

GMT+8, 2024-9-30 16:20 , Processed in 0.078744 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2022 Comsenz Inc.