- Thinkpad P系列交流区 - 水窝ibm

jack20030531 · 发表于 2008-10-1 15:37

　编者按：对于很多普通用户来说，小小内存的显得非常的不起眼。PC100规格的推广期间，首先引起了用户对于内存的普遍关注。随后的一系列产品，对于有一定硬件知识的用户来说还都算比较容易区分（这里指的上它们的主要特征，实际上内存技术是相当难于理解的技术之一）。比如SDR和DDR，读取数据的触发点增加了一倍，数据输出带宽也就相应的增加一倍；DDR和DDR II，主要是预取数据宽度不同，所以数据输出带宽也不同。不过，随着用于显卡的GDDR、GDDR2和GDDR3的概念相继出炉，很多用户就想当然的以为GDDR2就是DDR2、GDDR3就是DDR3，很多厂商在宣传的时候似乎也含糊其辞。本文将会给较为详细的揭示各种内存规格和GDDR/GDDR2/GDDR3之间的联系，帮助大家明确的辨析这些概念，做到明明白白消费。　　DRAM内存循序渐进的发展历史　　内存的发展总是循序渐进的，而且是一步一个脚印，后来的技术总是建立在原有技术的基础上。每个人接触到的第一款内存类型都不一样，我是从快页内存（FP DRAM）开始接触电脑的，随后使用了EDO DRAM，这两种内存都无法和系统时钟同步工作。之后就是造成内存发展革命性变化的SDRAM，当然了SDRAM也不是凭空产生的，它也是EDO的改进产品。SDRAM可以和系统时钟同步，SDRAM中的PC66/PC100和PC133都被大家所熟知。由于Intel的不支持使DDR差点胎死腹中，我想DDR和RDRAM的战争以及其中的曲折想必大家都有所耳闻，幸好有VIA为DDR推波助澜，才使的DDR成为主流的内存。DDR2技术基于DDR，它的出现是为了解决DDR内存发展遇到的瓶颈。此外这篇文章还要向大家介绍GDDR，GDDR2和GDDR3，它为是针对显卡设计的高性能DRAM，对于它们想必还有很多读者存在疑问，在这篇文章中会一一阐述清楚。　　DRAM内存的本质特点　　实际上，DRAM是一个晶体管和一个电容的结合体，很简单但也很高效。换句话说，基本的DRAM架构仍然是现代内存类型的基础，因此，所有的现代内存类型都继承了DRAM的优点和缺点：它需要刷新（预充电，不然随着漏电，DRAM中的数据会消失），以及有操作频率的上限（这也是用电容充电来存储数据的弊病）。DRAM频率不能无限提升，只有在I/O上做文章。SDRAM采用管线架构，内部存储单元的频率和输出频率是一样的。DDR则采用数据预取的架构，同时预取2bit数据，因此输出数据传输率可以做到内部数据传输率的2倍，DDR2则是同时预取4bit数据，在内部存储单元频率不变的情况下，把数据传输率提高4倍，下面会更详细的说明数据预取概念。DRAM的发展历史　　最早的DDR标准是DDR200，这个标准被遵循了很久。DDR200的核心工作频率是100MHz，这和PC100 SDRAM的工作频率是一样的，DDR内存可以在每个时钟信号的上升延和下降延传输信号，因此获得工作频率两倍的数据传输率。我们把工作在100MHz的DDR内存称为DDR200，它的速度传输率为1.6GB/s，也叫PC1600。就象PC100到PC133一样，频率的提高总是以33MHz为单位，133MHz频率的DDR SDRAM被称为DDR266，它的数据传输率为2.1GB/s。随后是DDR-333，数据传输率达到了2.7GB/s。DDR400的出现是为了和前端总线同步，获得更高的性能，目前双通道DDR400内存使用很普遍。不过到了DDR400，其内部存储单元的工作频率已经高达200MHz，进一步提升频率遇到了困难，这时候需要引入新的内存类型来解决。

jack20030531 · 发表于 2008-10-1 15:38

引入DDR2是DRAM发展的必须选择

　　通过上面对DDR SDRAM的讲解，DDR2的特性就很容易理解了，和DDR一样，DDR2的外部总线仍然使用双倍传输数据的策略，不然就不能称之为DDR（双倍数据传输率）内存了。在内部总线数据预取上，DDR2采用了新的4bit prefetch方式来解决DDR内存发展遇到的瓶颈，在不提高核心频率的前提下，提升数据传输率。
　　解决内存发展瓶颈4bit prefetch架构

　　SDRAM的管线突发结构和DDR的2bit Prefetch结构，以及DDR2的4bit Prefetch结构之间的区别。我们注意到这三种内存类型的内部存储单元，也就是Cell队列的工作频率都是100MHz，数据传输率之所以有差别，是通过不同的内部I/O位宽来实现的。DDR2用的4bit prefetch相当于同时预取四位，输出一位，也就是说输出数据传输率是内部Cell队列数据传输率的4倍。

DDR2内存架构示意图

　　目前DRAM内部采用4 bank的结构（1Gb DRAM采用8 bank结构），每个bank由存储单元（cell）队列构成，存储单元队列通过行（row）和列（column）地址定位。它们的工作流程是：首先是命令和地址信息输入，经过地址解码器分解成bank（段）和Word（字）选择，Word选择就是行（Row）选择，然后要对存储单元进行再存储（Restore）和预充电（Precharge）过程。我们知道DRAM是通过电容来存储数据的，而电容会放电，通过预充电来防止DRAM信息丢失。然后是Column（列）选择，到此为止存储单元（cell）已经被定位。存储单元的数据被放大然后输出到内部数据总线（Internal Data Bus）。内部总线通过4-bit prefetch结构处理传输到输出缓存。如上图所示的DRAM内部数据总线是128位，通过4bit-prefetch转换成32bit总线，通过提高频率和在时钟上升延及下降延传输数据，虽然输出总线位宽变窄，但是数据传输率是一样的。
　　通过4bit-prefetch结构可以在相同的Cell工作频率上把数据传输率倍增，有效的解决了内存发展所遇到的瓶颈。由于DRAM结构的限制，我们知道提升DRAM内部存储单元的频率是比较困难的，而且成本较高。DDR400的核心频率已经达到了200MHz，而DDR2 400的核心频率仅为100MHz，DDR2 533的核心频率为133MHz，可以看到引入DDR2把核心频率提升的空间又让出来了，让内存速度能够保证持续的发展，DDR2为今后几年内存发展奠定了基础。

3think · 发表于 2008-10-1 15:39

支持一下
··········

jack20030531 · 发表于 2008-10-1 15:40

DDR2的新特性
　　除了速度上的优势和更低功耗外，DDR2还有几个相对于DDR I增加的新特性
　　一、ODT（On Die Termination）：核心内建的终结电阻器，可以为DRAM的DQ（数据线）提供终结电阻。我们知道数据信号的终点需要终结电阻器，不然信号到了电路的终点会反射回来引起严重的干扰。终结电阻的大小决定了数据线的信号比和反射率，终结电阻小则数据线信号反射低但是信噪比也较低；终结电阻高，则数据线的信噪比高，但是信号反射也会增加。DDR II可以根据自已的特点内建合适的终结电阻，这样可以保证最佳的信号波形，这是DDR I不能比拟的。DDR I内存的终结电阻器做在了主板上，一块支持DDR内存的主板上需要几百颗终结电阻，这增加主板的成本和设计难度。DDR II把电路的终结功能做在了核心中，这样主板上就无需终结电路，减化了主板设计，提高了高靠性。我们在支持DDR2的主板上较找不到终结电阻器，主板设计更加的简洁，一方面可以降低成本，另一方面也能提高主板的电气性能，为将来更高的内存速度做准备。

　　在DDR内存平台中，终结电阻位于主板上，这不但增加了主板制造成本，而且由于内存模组的特性不一样，终结电阻不可能调节到最佳值，而且颗粒之间也会存在信号反射。DDR2的终结电阻集成在核心中，DRAM颗粒激活时关闭终结电阻，DRAM颗粒在待命状态则打开终结电阻，解决了DRAM颗粒之间的信号反射。
　　二、OCD（Off Chip Driver）：也就是所谓的离线（Off Chip）驱动校准，通过OCD来维持内存的最佳驱动性能。OCD允许通过芯片组（chips）实时发送命令来调整DRAM芯片的驱动方式。DDR II具有弹性的数据调整方式是通过离线驱动来实现的，分为dc和ac两种。dc可以调整系统环境的阻抗，ac可以调整延迟锁相环（DLL）的补偿。

　　DDR2 SDRAM通过OCD校准来提高信号完整性，在OCD校准中，设置I/O驱动阻抗来调节电压，使上拉和下接阻抗相等。它可以提高信号完整性，减少DQ-DQS歪斜（skew），第二，OCD可以提高信号品质。
　　三、posted CAS：在一个posted CAS操作中，CAS信号（读/写命令）能够紧接着RAS信号（激活命令）的输入，这需要CAS命令增加几个附加的延迟（0,1,2或4个时钟周期）来实现。通过使用posted CAS可以更容易的设计控制器，解决总线“冒泡”问题。提升了命令和数据部线的效率，由于没有了“冒泡”冲突，提升了实际的总线带宽。而DDR2的写延迟为读延迟周期减一个时钟周期。DDR2通过增加地址和命令的FIFO（先入先出）寄存器来实现posted CAS，通过寄存器保存CAS命令和地址直到附加延迟结束，在DDR2段交错操作（bank-interleaving operation）时使用4bit突发模式来提高总线利用率。
　　显然，DDR2已经来到我们身边，象Samsung，Hynix，Micron，Elpida都推出了DDR2 533和DDR2 667的颗粒，主要的内存模组厂商也推出了相应的DDR2内存模组，目前可以和925X以前部分915P主板配合的DDR2内存模组是PC-4300 Unbuffered DIMM。
　　内存带宽和延迟参数

内存	*主要延迟参数 Q3 2004*	*延迟, ns*	*带宽, GB/sec*
DDR400*	2.5 – 3 – 3	12.5	3.2
DDR500**	3 – 3 – 3	12.0	4.0
DDRII-400	4 – 4 – 4	20	3.2
DDRII-400***	3 – 3 – 3	15	3.2
DDRII-533	5 – 5 – 5	~19	4.3
DDRII-533	4 – 4 – 4	~15	4.3
DDRII-533***	3 – 3 – 3	~11.3	4.3
DDRII-667	5 – 5 – 5	15	5.3
DDRII-667	4 – 4 – 4	12	5.3

　　上表中的内存如DDR2 400根本就没有机会在市场上生存，由于结构的因素，它的延迟比DDR400还要高，因此桌面PC用的DDR2内存就直接从DDR2 533起步了，相当于PC4300。需要说明的是，DDR500并没有成为JEDEC的标准。具有3-3-3时序的DDR2 533需要到2005年下半年才会出现，目前主流的DDR2 533都是4-4-4时序。

DDR2 SDRAM的延迟参数

　　最后我们把DDR与DDR2的主要规格对比表方上来：

特征	DDR	DDR2
数据传输率	266，333，400MHz	400，533，667，800MHz
封装	TSOP或FBGA	FBGA
操作电压	2.5V	1.8V
I/O电压	2.5V	1.8V
I/O类型	SSTL_2	SSTL_18
密度	64Mb-1Gb	256Mb-4Gb
内部段	4 bank	4 bank或8 bank
数据预取	2	4
CAS延迟（CL）	2、2.5、3时钟周期	3、4、5时钟周期
附加延迟（AL）	无	0,1,2,3,4 时钟周期
读延迟	CL	AL+CL
写延迟	固定	读延迟减一个时钟周期
I/O宽度	x4/x6/x18	x4/x6/x18
输出校准	无	OCD
ODT	无	有
突发长度	2,4,8	4,8

jack20030531 · 发表于 2008-10-1 15:40

GDDR，针对显卡的DDR解决方案
　　GDDR也就是Graphics Double Data Rate DRAM的缩写，针对显卡设计的高性能DRAM有两个主要特点，一是高密度寻址能力，也就是颗粒的容量要高，以满足显卡对内存容量的要求和显卡设计的要求。高密度图形内存寻址只是设计要面对的一半问题，另一半就是性能，显存必须能提供高速传输，现在的GDDR显存可以提供超过1GT/s的数据传输率。下面这张图表代表了GDDR的发展趋势和主要特征。

　　我们看到显存的发展趋势，从DDR->GDDR2->GDDR3->GDDR4，其中GDDR4还没有正式发布，GDDR2和GDDR3已经大量应用在高性能显卡中。先来看看它们的最高工作频率（由于是DDR，因此数据传输率要乘于2），GDDR2也是500MHz，而且GDDR2工作电压同DDR1一样是2.5V，因此功耗过高，不过GDDR2的接口界面是SSTL-18（1.8V工作电压）。GDDR3和GDDR2相比最大的区别在于降低了工作，GDDR3的最高工作频率是700MHz，目前三星已经推出550MHz的GDDR3，hynix将会推出700MHz的GDDR3。我们看到GDDR2和GDDR3内部都采用4bank结构，4bit prefetch数据存取，可见它们的架构同样是基于DDR2 SDRAM。GDDR3的接口是POD-18（pseudo open drain），这也是不同于GDDR2的地方。既然是基于DDR2架构，GDDR2和GDDR3的延迟要比DDR1高一些。从封装来看，它们用的都是144Ball FBGA，而且GDDR3都采用8M×32的配置方式，也就是说都是256兆位的大容量颗粒，前面说到GDDR要解决的问题之一就是高密度寻址能力。
　　如果把眼光放远一点，我们可以看到GDDR4，但是我们注意到nVidia的标准和JEDEC及ATi的不一样，nVidia支持的GDDR4仍然是基于4bit prefetch的DDR2核心架构，它的最高频率达到1.2GHz，它内部cell单元的频率已经达到400MHz，这是相当惊人的程度。JEDEC（ATi）则采用8bit Prefetch架构，也就是DDR3的核心，不过DDR3的标准还没有最后确立，因此JEDEC标准的GDDR4什么时候能推出还很难说，GDDR4的最高频率达到了1.4GHz，此外它配置成16M×32的方式，相当于512兆位的容量。下面来看看nVidia和JEDEC（ATi）的GDDR4的相同点，它们都采用136Ball FBGA封装，工作电压1.8V，接口界面为POD-15（1.5V），它们内部都是8 bank结构，GDDR4的cas延迟目前还是未知数。

GDDR3改进了ODT（终结电阻）电路，在静态模式下的功耗比GDDR2低了很多

　　下面的章节通过三颗实际的DRAM来介绍几种GDDR的特征

jack20030531 · 发表于 2008-10-1 15:41

　　GDDR
　　通过上面的描述，我们可以知道GDDR是基于DDR，如三星的K4D551638D，它只是适合显卡使用的高性能DDR SDRAM，最高工作频率300MHz，最大数据传输率600Mbps/pin。K4D551638D的位宽是16bit，可以达到1.2GB/s/chip的性能。可编程的突发长度与可编程的延迟允许它应用于高性能的领域。它的主要特征如下：

2.6V ± 0.1V 工作电压
2.6V ± 0.1V I/O端口电压
SSTL_2 兼容输入/输出接口
内部采用4 banks操作
可编程的MRS
- 读延迟 3, 4 (clock)
- 突发长度 (2, 4 和 8)
- 突发类型 (连续和交错)
差分时钟信号输入
自动和自刷新
32ms 刷新周期 (4K 循环) 针对 -TC33/36/40
64ms 刷新周期 (8K 循环) 针对 -TC50/60
66pin TSOP-II封装，可见GDDR不一定要用FBGA封装形式
最高时钟频率 300MHz
最大数据传输率 600Mbps/pin

　　GDDR2
　　以三星的4Mx32 GDDR2——K4N26323AE为例，还说明一下GDDR2的主要特点，首先要清楚的是GDDR2和GDDR3都是基于DDR2核心架构，采用4bit数据预取模式，具有ODT等优势。它具有32bit的位宽，适合GDDR高密度的要求，最高工作频率是500MHz，最大数据传输率为1Gbps/pin，它的性能很高，可以达到4GB/s/chip。它的主要特征如下：

2.5V ± 0.1V 工作电压
1.8V ± 0.1V I/O端口电压
核心集成终结电阻（ODT）
通过EMRS调节输出驱动强度
SSTL_18 兼容输入/输出接口
内部采用4 banks操作
可编程的MRS
- CAS 延迟: 5, 6, 7 (clock)
- 突发长度 : 4
- 突发类型 : 连续
附加延迟 (AL): 0,1(clock)
读延迟(RL) : CL+AL
写延迟(WL) : AL+1
自动和自刷新
32ms 刷新周期 (4K 循环)
144 Ball FBGA封装
最高工作频率 500MHz
最大数据传输率 1Gbps/pin

　　 GDDR2的缺点就是工作电压过高，达到了2.5V，它虽然是DDR2的核心，但为了达到更高的工作频率选择了提升电压的方式，这样势必会带来高功耗，使显卡的供电与散热都成问题。另外我们注意到GDDR2的突发长度固定为4，突发类型固定为连续。而且GDDR2只能采用FBGA封装形式，这点和DDR2要求是一样的。
　　GDDR3
　　以三星的2M x 32Bit x 4 Bank GDDR3 SDRAM——K4J55323QF为例，这是采用三星高性能CMOS工艺的内存，它具有32bit位宽。这颗GDDR3能实现超高的性能，可以达到6.4GB/s/chip。它最高工作频率是800MHz，最大数据传输率为1.6Gbps/pin。它的主要特征如下：

1.9V ± 0.1V 工作电压
1.9V ± 0.1V I/O端口电压
核心集成终结电阻（ODT）
通过EMRS调节输出驱动强度
校准输出驱动
POD兼容的输入输出
4个内部banks并行操作
差分时钟信号 (CK 和 /CK)
CAS 延迟 : 5, 6, 7, 8 和 9 (clock)
附加延迟 (AL): 0 和 1 (clock)
可编程突发长度 : 4
可编程写延迟 : 1, 2, 3, 4, 5 and 6 (clock)
自动和自刷新模式
自动预充电选项32ms 刷新周期 (4K 循环)
144 Ball FBGA封装
32ms 刷新周期 (4K 循环) 800MHz
最大数据传输率 1.6Gbps/pin
输出DLL电平

　　显然GDDR3的优势很大，首先是工作电压降低了，可以有效减少功耗，这也是GDDR2升级到GDDR3最大的优势。GDDR3采用了POD输入/输出接口允许更短的DQS前导，GDDR3的可编程性能更强。从三星的Roadmap来看，GDDR3能够达到800MHz的工作频率，相当于1.6Gbps/pin的数据传输率，为高性能的显卡提供了有力保障。未来我们还有GDDR4，技术发展的脚步是不会停止的，DRAM技术仍然能在显卡中发挥应有的作用。
　　小结
　　这篇文章说明了DDR2的技术，以及与之相关的派生品GDDR2和GDDR3。我们可以了解到DDR2的出现不是偶然的，它是DRAM发展到一定阶段必须的产物，是解决DRAM本质缺陷，保持DRAM能够持续发展的解决方案。当DDR2发展到一定阶段，达到DRAM工作频率的瓶颈，DDR3就会应孕而生，它的基本要点是采用了8bit Prefetch架构，我们可以看到DDR3将会采用8 bank结构，同时预取8bit数据，这可以使DRAM仍然保持青春。而GDDR是针对显卡的DRAM解决方案，它提高了寻址密度，增加了工作频率，以满足显卡对内存带宽的渴求。希望通过此文能帮助大家更好的认识DRAM技术，以及它未来的发展趋势。

[ 本帖最后由 jack20030531 于 2008-10-1 15:43 编辑 ]