单击这里注册您的帐户
登录
BT发布页
帮助
晓风下载论坛
»
『 综合技术交流区 』
» [学习]SLI技术全接触
‹‹ 上一主题
|
下一主题 ››
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
[学习]SLI技术全接触
本帖已经被作者加入个人空间
佐罗
做人要厚道
管理员
千万年炎凉世态,心透,神悟
UID
27660
精华
64
积分
-956370
威望
-999
阅读权限
255
在线时间
14326 小时
发短消息
加为好友
当前离线
1楼
大
中
小
发表于 2005-2-5 09:06
只看该作者
[学习]SLI技术全接触
转载自PCHOME.NET
编者按:
在行将结束的2004年,在PC图形领域出现了影响深远得两个技术:SLI和PCI-EXPRESS。这两个技术,在某种意义上来说,与其说是革命性得技术创新,不如说是对未来PC图形领域以及其他相关领域发展得探索性尝试。究竟这两个技术有什么鲜明得技术特点?是对过去老技术得继承,还是未来新技术得出露端倪?这两个技术得市场前景怎样?本文,将分九个部分为大家进行分析
。
第一部分,继往开来的图形技术SLI
这里我们谈到的NVIDIA的SLI(ScalableLinkInterface)和以前得3DFX的VooDoo2时代的SLI(ScanLineInterleave)是有不同的。
首先,3DFX的SLI是构建在当时的PCI总线的基础上的。PCI总线的带宽为:33MHz(额定工作频率)x 32bit(总线位宽)=1056M bit/s,1056M bit/s÷8=133M Byte/s。PCI总线的133MB/s是主板上所有设备共享的。 在3D显卡出现后,所传送的的数据量呈几何式的增长,PCI总线已经远不能满足带宽的需求。而NVIDIA的SLI是构建在PCI-EXPRESS架构上的,这种新的总线规范,相对于以前总线的共享并行架构来说,PCI Express采用的点对点的串行连接(serial interface)技术,支持每个设备的独享带宽,理论上可以达到10GHz的带宽。3DFX和NVIDIA的SLI的构建的基础不同的,NVIDIA的SLI凭借新的PCI-EXPRESS的高带宽,实现了更高的数据吞吐能力。
其次,两类SLI的工作方式不是同的。上面我们提到NVIDIA的SLI的基于PCI Express技术,这是一种完全数字化的帧组合方式。数字化信号传输,理论上信号损失为零,所以能确保图像质量的100%无损失。同时在NVIDIA的SLI系统中的每颗GPU 中都配置了专用于实现SLI的逻辑电路,借助GPU 之间的数字接口实现灵活伸缩性。然后依据软件套件,可实现动态负载平衡和先进的渲染算法,从而提供最为出色的图像质量。而且SLI技术是应用开放的,依靠图形驱动程序得以实现,这样所有的DirectX和OpenGL应用均可利用SLI的优势。
而3DFX的SLI采用的隔行扫描,是模拟信号的范畴。由于存在数模转换差异以及其他因素的影响,造成图像质量欠佳。3DFX的Voodoo技术仅执行三角形设置,需要由CPU完成几何运算,因此3dfx SLI只能提高简单纹理填充率的性能,该技术只能是在帧间实现灵活伸缩性,即由多个设备协同完成帧渲染工作。我们可以从下面的一幅简图来看其中的差异。
这是Tom’s Hardware展示一个示意图,我们可以很直观看到,左图中的3DFX的SLI的工作方式是按照画面帧线进行渲染。3DFX的SLI将所渲染的画面按一条一条的扫描帧线(scanline)进行分类,其中SLI系统中两个图形卡,一个负责渲染画面的奇数帧线部分;另一个负责渲染偶数帧线。同时渲染完毕后的帧线合并后,写入帧缓存。这样,便可以显示一个完整的画面了。这样渲染工作可以被平均分配到两块以SLI方式工作的显卡中同时进行,理论上性能可以提高1倍。这在当时,可是3D图形领域的一次突破性的飞跃。
右图中的NVIDIA的SLI的工作方式是将一帧的图像分为上下两部分各自独立渲染,同时在驱动中采用了特殊的动态负载平衡算法,将任务分配给两块显卡。这样的分配并不是工作量的平均分配,而是保证两块显卡完成渲染任务的时间一致。这样,由于主卡可以更多的调用系统的资源,动态负载平衡算法就让主卡多负担一点渲染任务,副卡只是分担较少的一部分渲染任务,同时完成渲染任务以后,交由主卡完成最后的显示。
第二部分,SLI的平台的搭建 上
搭建SLI平台,首先需要的是支持SLI的显卡,目前NVIDIA已经推出了几种定位于高档游戏PC和图形工作站的SLI方案。基础于NV45核心的GeForce 6800以及Quadro FX4000系列支持SLI功能。
下面为支持SLI的GeForce 6800
搭建SLI后的GeForce 6800
支持SLI的Quadro FX4000
搭建SLI之后的Quadro FX4000
其次则是主板。我们知道 NVIDIA SLI方案采用PCI Express介面,所以,主板需要具备两组PCI Express x16绘插槽,之前NVIDIA在其演示中,使用的是Intel E7525(代号为Tumwater)。下图为采用Intel E7525的supermicro的X6DA8-G2,在NVIDIA的SLI演示中,采用了该主板。
Intel E7525只能提供20个PCI-EXPRESS通道,即只有一块显卡可以实现PCI Express x16。另外一个显卡,只可以实现PCI Express x4,相应的带宽也下降到了双向2GB/s,经过8b/10b编码后,带宽只为1.6GB/s。这样只能实现x16+x4的SLI模式,性能也打了一个折扣。
第二部分,SLI的平台的搭建 中
与此类似的是VIA即将推出的基于P4的PT894 Pro,北桥芯片也提供了20个PCI-EXPRESS通道,同时是让一个显卡工作在PCI Express x16模式下,另外一个显卡实现PCI Express x4模式下,从而实现x16+x4的SLI模式。下图是HKEPC网站发的一张PT894pro的datasheet中的图片。
图中,我们可以看到两条PEI-EXPRESS通道,即为PT890Pro所支持的x16+x4的SLI模式。
此外在AMD方面,即将发布的K8平台的芯片组K8T890Pro 也将拥有双PCI-Express x16,我们可以从VIA官方网站上的K8T890的规格上进行推断。
从这张图上,我们看到,在K8T890芯片组上,北桥芯片支持20个PCI-EXPRESS通道,一个为PCI-Express x16给PCE-EXPRESS图形卡用。其余的四个通道为四个PCI-Express x1,提供给其他设备。所以我们可以肯定,在将要推出的K8T890的改进版本K8T890Pro,所谓宣传采用的双PCI-Express x16通道,就是一个PCI-Express x16加上一个由四个PCI-Express x1组成的PCI-Express x4。也是支持两个PCI-EXPRESS显卡的x16+x4的SLI模式,并不是两个真正的PCI-Express x16的SLI模式。
在NVIDIA最近推出的NF4芯片组,采用了新的PCI-Express方案
如上图,NF4内各电路都进行分离设计,各电路都由自己独立的时钟。这样对于HyperTransport总线的超频更容易,而不需同时提高PCI Express,SATA或PCI的时钟速度。NVIDIA官方一共推出了三个版本的nForce4芯片组:nForce4、nForce4 Ultra和nForce4 SLI,我们来看高端的SLI版本。在NF4的SLI版本中的SLI设计上,依然采用了20个PCI-EXPRESS通道(20 lanes)。即使一个PCI-Express x16和四个PCI-Express x1。一个PCI-Express x16可以作为一个PCI-Express x16供PCI-EXPRESS显卡用,或者分为两个PCI-Express x8+ PCI-Express x8,作为SLI模式。另外的四个PCI-Express x1供其他设备使用(实际设计中,根本PCI设备的使用数量,可能只设计2个或3个PCI-Express x1插槽)。
之所以采用一个x16或者是x8+x8 SLI模式的PCI-EXPRESS设计,是因为在NF4设计之初,并没有考虑对SLI的支持,在后来的改进版本nForce4 SLI中,采用了拆分PCI-Express x16的方法,来实现的双PCI-Express x8的SLI模式。
第二部分,SLI的平台的搭建 下
这样的设计思路,性能如何呢,我们来作一个分析:
理论上来说,PCI-Express x16的设计带宽为上行下行各4GB/s。实际上由于PCI-Express采用串行连接(serial interface)技术,管线在进行数据处理时候采用8b/10b编码,同时要负责数据、地址、连接控制和纠错信号等,实际带宽只能达到上下行各3GB/s。而目前的显卡,注意是用来作CPU到GPU的速据下传,这样可以完全利用3GB/s的带宽。但GPU到CPU的数据上传,只能利用到1GB/s的带宽,实际的3GB/s的带宽有很大的空闲。所以,ATI和NVIDIA目前采用的PCI-Express x16显卡的带宽都是4GB/s,单从总带宽的角度来说,双PCI-Express x8构成的SLI模式,也是基本可以满足目前的PCI-EXPRESS显卡要求。
这样,在使用时,可以通过一个切换功能,来决定是工作在普通的单PCI-Express x16模式下,还是工作在双PCI-Express x8的SLI模式下。下图是NVIDIA的NF4的工程样板,为一个PCI-Express x16插槽加两个PCI-Express x1插槽。
MSI的基于NF4的SLI主板,两个PCI-Express x16插槽中间为切换装置。决定是单PCI-Express x16模式,还是双PCI-Express x8的SLI模式。
ASUS的支持SLI的NF4芯片的主板
同样在两条PCI-Express x16加了一个切换子卡。下图为安装SLI显卡后的NF4主板。
此外,Iwill还推出了基于NF4的支持AMD Opteron PGA940的SLI主板DK8ES
根据该图显示,如果Iwill是采用了两块NF4芯片实现了支持双Opteron PGA940的话,那么两块NF4芯片,一块芯片提供20个PCI-EXPRESS通道的话,两块提供了40个PCI-EXPRESS通道。这样足可以提供两个真正的PCI-Express x16通道。不知道Iwill在SLI这方面有无进行发掘,我们只是凭图片猜测。
第三部分,SLI的原理和效能
NVIDIA PCI-EXPRESS显卡为了实现SLI模式,在芯片内部,植入了SLI逻辑电路
。
上图中,标出的橙色的模块,即为SLI电路部分,用于多个PCI-EXPRESS显卡的SLI模式连接。NVIDIA 的SLI技术理论上最高支持8个PCIE显卡并行工作。从多方面综合考虑,实际上最多支持4块PCI-E显卡SLI,目前,我们见到的就是两块显卡的SLI模式。GPU的DIE中的SLI电路,引导在PCB上突出的金手指部分。
[img]http://article.pchome.net/2004/11/26/image017.jpg[/img
再通过MIO Poit Bridge进行连接。
之所以采用PCB而作SLI的连接器而不是采用排线,一是基于PCB可以传递更高品质的信号,二是PCB可以对作SLI的两个显卡起到支撑作用,对采用大型散热器的NV45系列显卡来说,对于防止PCB变形有一定作用。但是这样也带来了主板设计上难度,即主板上两条PCI-EXPRESS x16插槽的距离要和NVIDIA提供的SLI连接器的距离相等,这就限制了主板布局的灵活性。基于这一点考虑,目前SLI连接器是由主板厂商和主板一起提供。而不是之前的由NVIDIA统一提供。
上面便是NVIDIA SLI的简单硬件实现。下面我们来看SLI系统的效能
如上图,在NVIDIA官方文件中,两个显卡的SLI模式的实际效能是单个显卡的1.87倍,这是在Intel E7525的supermicro的X6DA8-G2的x16+x4模式下测的数据,如果在NF4平台的x8+x8模式下测量,效能应该略有提升。
第四部分,SLI,并行处理在图形领域的尝试
这里我们说的SLI技术,其实只是并行处理中的很简单的一个类别。并行处理,是一个很广泛的概念,归根到底就是一个种分而治之的策略。即把一个任务分成彼此相对独立的部分,几个部分能够同时执行,从而减少总的执行时间。
并行处理分类的标准很多,这里我们分为时间重叠的时间并行和资源重复的空间并行。
时间并行指多个任务可以共享一套资源上的不同部分,执行的时间是重叠的,这样可以充分利用资源。比如我们熟悉的处理器中的流水线设计就是典型的时间并行,所谓流水线技术,是指讲一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效的在其专用的功能段上与其他子过程同时执行。
时间并行是一种时间并行的处理方法,与之对应的是资源重复的空间并行。即在硬件上设置多个处理部件,多个处理部件同时处理多个操作。随着IC制程工艺的不断提高,芯片的集成度越来越高,所以资源重复的空间并行技术可以更加充分地利用芯片的晶体管资源,发挥硬件的潜力。
现在多用的空间并行处理技术有:设置多个功能部件,通过指令调度机制,开发指令级并行处理能力,比如现在处理器中都有多个执行单元,同时处理指令,可以成倍的缩短执行时间;增加处理器字长,提高位级的并行能力。比如目前的AMD的K8,由32bit增加到64bit,可以大大提高执行效率;设置多个硬件部分甚至多个核心,提高线程或任务级的并行能力,开发更粗粒度的并行。比如开发并行的多线程处理器(SMP),以及INTEL的超线程技术等。开发单芯片多处理器(SCMP),比如IBM的BLUEGENE,单芯片已经达到32个处理器。
对于显卡上使用的处理器,比如NVIDIA的GPU以及ATI的VPU等,如何能更大限度的提高并行处理能力,也是芯片设计中长期追求的目标。在3DFX的SLI以后,图形领域的并行处理的尝试,就一直没有停过。在Voodoo4到Voodoo6,3DFX又推出了SLI技术。到了双芯片的Voodoo 5 5500和四芯片的Voodoo 5 6000,SLI技术演变为单显卡多图形芯片的形式,只占用一个插槽,但内部的工作机制并没有发生多大的变化。依然是通过划分渲染帧的方式各自执行,然后在帧缓冲中统一合成。
在2001年初,NVIDIA收购了3DFX,自然SLI技术也归NVIDIA所有。但是当时的市场情形,NVIDIA从TNT2时代一直延续到GeForce 4时代在图形市场,都是所向披靡的。并不需要SLI也能占尽先机,所以SLI一度被搁置。
目前在人们几乎遗忘的时候,NVIDIA又推出了SLI技术,其象征意义更多与实际意义。搭建SLI系统,需要的双GeForce 6800甚至更加昂贵的Quadro FX4000,以及支持双PCI-EXPRESS x16的插槽的主板,甚至双XEON或者双Opteron PGA940等。还有必须的专用的大功率的电源。这些设备加在一起的价格,绝对是一个让人很难承受的价格。市场份额可向而知。
在ATI强势崛起的图形领域的今天,两家的产品已经很说谁有绝对的性能优势了。在这种情况下,引入SLI,意图就很明显了,NVIDIA想要重新夺回图形霸主的位置。
而且采用这样一个有弹性,而且有很大技术延展性的SLI方案。是在现在的芯片制造工艺下,最简单的在性能上超越对手的方法了。而且NVIDIA的SLI是一个很巧妙的做法:你可以不用SLI,那么单个显卡处理速度也不逊色与对手。你可以选择SLI,那么性能优势绝对很明显,1+1>1这个道理很简单。SLI在技术实现上并不困难,并不会导致成本的提高。而且支持SLI模式的显卡,既有它的独立性,又有它的并行性。可单独使用,也可以搭配使用。方案弹性很大,而且性能之王的宝座也轻易的夺回。
SLI,这个并行处理模式在图形领域的新的尝试,是一个很巧妙的方案。
第五部分,和SLI的类似的并行处理技术
图形领域的并行处理技术,并不只有一家,首先,我们来看ATI的Rage Fury MAXX。Rage Fury MAXX是当年ATi为抗衡nVIADIA Geforce 256,效仿3Dfx 的Voodoo5而采用的第一款双芯片显卡。当年的3DFX的Voodoo2,90M Pixels/s像素填充率、具备Z-Buffering、Anti-Aliasing、单周期双纹理等当时的最新的技术和指标,已经可以让当时所有的对手黯然失色,而它的性能翻倍SLI技术,更让对手瞠目结舌。在NVIDIA发布了Geforce 256以后,ATI不得不发布了类似Voodoo5得双芯片显卡,该方案归根结底还是由SLI演化而来。(图20)
这款名为“曙光女神”得作品,并没有为当时得ATI带来黎明的的曙光。在NVIDIA Geforce 256璀璨的光芒下,只能黯然失色甚至被人遗忘。Rage Fury MAXX,采用AFR(Alternate Frame Rendering)技术,双Rage 128Pro芯片,64MB显存,象素填充率500M/s,致命的是不支持硬件T&L,很快便被自家的Radeon取代
在人们已经遗忘MAXX的时候,ATI又为大家展示了基于R350核心MAXX
。
这款让人惊奇的产品,也只是在展会了惊鸿一现,此后便杳无踪迹。这款集成了两颗R350芯片的产
[
Last edited by 佐罗 on 2005-3-13 at 08:31
]
The World Of Zorro,Welcome!
UID
27660
帖子
34186
精华
64
积分
-956370
财富
641 晓风币
威望
-999
阅读权限
255
性别
男
来自
天津
在线时间
14326 小时
注册时间
2003-3-2
最后登录
2008-11-22
查看个人网站
查看详细资料
TOP
紫龙王
内阁学士
UID
64886
精华
2
积分
6038
威望
3
阅读权限
19
在线时间
450 小时
发短消息
加为好友
当前离线
2楼
大
中
小
发表于 2005-2-5 15:34
只看该作者
学习~~
UID
64886
帖子
440
精华
2
积分
6038
财富
11046 晓风币
威望
3
阅读权限
19
性别
男
在线时间
450 小时
注册时间
2004-7-4
最后登录
2008-11-18
查看详细资料
TOP
闪云
通政司参议
UID
109567
精华
5
积分
504
威望
0
阅读权限
10
在线时间
32 小时
发短消息
加为好友
当前离线
3楼
大
中
小
发表于 2005-2-5 20:21
只看该作者
支持一下啊
[img]http://www.4321down.com/attachments/forumid_49/22_5EoB5F1WWMzX.gif[/img]
云亦乘风 ,云亦载雨 ,云亦避日 ,云亦飘雪 ,云虽如梦般飘渺
云飘在空空的空中 只有偶尔随风而来的气息才能使他忘掉寂寞
UID
109567
帖子
31
精华
5
积分
504
财富
1985 晓风币
威望
0
阅读权限
10
性别
男
来自
云的天堂
在线时间
32 小时
注册时间
2003-7-26
最后登录
2007-8-13
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››
控制面板首页
编辑个人资料
积分交易
积分记录
公众用户组