術業(yè)有專攻 Quadro FX380/FX1800評測
NVIDIA與AMD之間在桌面的競爭愈發(fā)激烈,轉(zhuǎn)眼之間,Geforce系列顯卡已經(jīng)進入第十代陣營。與之相比,專業(yè)繪圖領域的Quadro則是顯得有些不溫不火,AMD旗下FireGL系列顯卡雖然也有不小的市場份額,但兩家廠商的產(chǎn)品更顯得涇渭分明,主攻平面與主攻3D設計各不沖突,簡單來說,就是自己玩自己的。在這種情況下,NVIDIA在2009年上半年終于更新Quadro的產(chǎn)品線,Quadro產(chǎn)品線終于也進入第十代產(chǎn)品。NVIDIA Quadro更新的產(chǎn)品主要是針對臺式機和圖形工作站的FX系列,包括FX3800、FX1800、FX580和FX380。
實話實說,如果只是這種規(guī)格提升并沒啥太大的驚喜,畢竟顯卡架構(gòu)升級都會帶來性能提升,單純提高多邊形生成數(shù)量和速度意義不大,還沒用等到顯卡全部能力都得以發(fā)揮就可能從市場淘汰。真正值得欣慰的是NVIDIA將CUDA帶入專業(yè)繪圖領域,特別是FX380和FX580這種面向中低端領域的產(chǎn)品也保留通用計算能力,是一件值得高興的事情。利用CUDA,顯卡的性能能夠發(fā)揮得更出色,而且在傳統(tǒng)3D制圖領域之外,向視頻編輯領域進軍。不過保留CUDA可能讓FX系列產(chǎn)品對CX系列產(chǎn)品造成沖擊,如何避免這種情況,是NVIDIA需要面對的話題。不過對消費者來說,CUDA出現(xiàn)絕對是利好的消息,不僅提升了顯卡的附加性能,也延長了顯卡的壽命。全部采用C語言作為編程語言的CUDA能夠提供大量的高性能計算指令開發(fā)能力,使開發(fā)者能夠在GPU的強大計算能力的基礎上建立起一種效率更高的密集數(shù)據(jù)計算解決方案。#p#page_title#e#
關于顯卡的做工,我們無需太過挑剔。與消費級的Geforce系列顯卡不同的是,Quadro系列產(chǎn)品頗有些“山寨”的味道——沒有夸張的散熱器也沒用鮮艷的PCB顏色,電感電容數(shù)量也不能壓倒同級別的Geforce顯卡。實際上由于顯卡絕對屬于NVIDIA的“原廠品質(zhì)”,所以顯卡做工論在專業(yè)級顯卡身上并不適用,因為我們沒有更多的同類型產(chǎn)品可供選擇,想要玩專業(yè),做的簡陋也要忍受。
名稱 |
FX1800 |
FX1700 |
FX380 |
FX370 |
CUDA并行處理器數(shù)量 |
64 |
32 |
16 |
16 |
顯存容量 |
786MB |
512MB |
256MB |
256MB |
顯存帶寬 |
192bit |
128bit |
128bit |
64bit |
顯存吞吐量 |
38.4GB/s |
12.8GB/s |
22.4GB/s |
6.4GB/s |
PCI-Express規(guī)范 |
2.0 |
2.0 |
2.0 |
2.0 |
精確度 |
FP32 |
FP32 |
FP32 |
FP32 |
輸出接口 |
DUAL-LINK DVI+Dispalyport |
DUAL-LINK DVI |
DUAL-LINK DVIX 2 |
DVI X 2 |
TDP |
59 |
42 |
34W |
-- |
SLI/SDI |
NO/NO |
NO/NO |
NO/NO |
NO/NO |
除了架構(gòu)改良之外,全新的380和1800支持更多特效,具體體現(xiàn)在: 30位色彩精度 30位色彩保真度(每種色彩10位)可實現(xiàn)數(shù)以十億計的色彩變化,而非百萬種色彩變化。在最大動態(tài)范圍內(nèi)呈現(xiàn)出豐富、絢麗的圖像質(zhì)量。 先進的色彩壓縮、無失真Z坐標壓縮(Early Z-Cull)技術 全景抗鋸齒(FSAA) 最高32倍速全景抗鋸齒大大減少了視覺混疊假象或鋸齒摂現(xiàn)象,呈現(xiàn)出極其逼真的場景。 硬件3D窗口剪輯 硬件加速的剪輯區(qū)(窗口與幀緩存之間的數(shù)據(jù)傳輸機制)通過提高色彩緩存與幀緩存之間的傳輸速度,提升了整體圖形性能。 支持HDMI 可將視頻與音頻傳輸?shù)礁咔咫娨曇约捌渌С諬DMI的設備上(通過HDMI轉(zhuǎn)接器)。 最高工作站級應用程序性能 下一代架構(gòu)在幾何學以及填充率方面的提升高達兩倍以上,能夠為專業(yè)級CAD(計算機輔助設計)、DCC(數(shù)字內(nèi)容制作)以及科學應用程序提供行業(yè)最高性能。 下一代頂點以及像素可編程性 NVIDIA PureVideo HD技術 通過在支持HDCP的平臺以及HDCP電路上將高清電影解碼加速與后期處理融為一體并整合到高清電影播放器中,為用戶帶來PC上的頂級高清電影體驗。 本技術能夠為所有視頻格式以及精美的HD DVD與藍光(Blu-ray)電影實現(xiàn)絕佳畫質(zhì),同時保持極低的CPU占用率和功耗。 NVIDIA 統(tǒng)一GPU架構(gòu) 業(yè)界首款統(tǒng)一架構(gòu)能夠動態(tài)地分配計算、幾何、著色以及像素處理能力,從而實現(xiàn)優(yōu)化的GPU(圖形處理器)性能。 nView多顯示器技術 NVIDIA nView 先進的顯示器軟件可實現(xiàn)最大靈活度,讓用戶能夠選用單臺超大顯示器或多臺顯示器。該軟件為最終用戶帶來了前所未有的桌面控制體驗,提升了生產(chǎn)率。 符合PCI Express 2.0標準 數(shù)據(jù)傳輸速率提升一倍,最高可達每巷道5 GT/秒,雙向總帶寬高達16 GB/秒(每個方向8 GB/秒)。 支持OpenGL四方體緩沖立體 OpenGL 四方體緩沖立體為專業(yè)應用帶來流暢和逼真的 3D立體體驗。 兩個DisplayPort數(shù)字顯示器接口 兩個DisplayPort接口支持超高分辨率平板顯示器(最高2560 x 1600),可呈現(xiàn)出細膩逼真的驚人的圖像質(zhì)量。 一個雙鏈路數(shù)字顯示器接口 雙鏈路TMDS發(fā)送器支持超高分辨率平板顯示器(最高可達3840 x 2400 @ 24Hz),可呈現(xiàn)出細膩逼真的驚人的圖像質(zhì)量。 超靜音設計 帶來強勁性能的同時最大程度減少噪音,為用戶營造安靜的桌面環(huán)境。 統(tǒng)一的驅(qū)動程序架構(gòu)(UDA) NVIDIA統(tǒng)一驅(qū)動程序架構(gòu)確保了軟件驅(qū)動程序向前和向后的兼容性。 由于所有NVIDIA產(chǎn)品均在相同的驅(qū)動程序軟件下工作,因此簡化了升級為NVIDIA新產(chǎn)品的過程。#p#page_title#e# 測試平臺 名稱 CPU Intel Core2 Duo 6750 主板 冠盟P45 內(nèi)存 威剛DDR2 1066MHz 硬盤 希捷7200.12 1TB 顯示器 DELL 2405 顯示卡驅(qū)動 Quadro Driver Release 186 MAXTreme 名稱 X380 X1800 9800GT Graphics 3.88 2.25 14.26 Hardware Shaders 6.23 4.37 9.98 CPU Render 4.14 4.12 4.73 沒有安裝MAXTreme驅(qū)動,FX系列顯卡的運算能力就明顯好于Geforce系列顯卡,在安裝之后,兩者差距非常明顯。憑借較高的核心運算能力和更高的貸款,X1800領先X380性能接近0.5以上,硬件頂點渲染能力差別比較明顯,CPU之間的差距比較小。對比X1800和9800GT,可以看到專業(yè)卡與游戲卡之間的性能差別。 SPECapc for Maya 6.5 這個測試項目隊線框、著色、紋理、高亮度紋理和紋理模塊進行測試,測試過程中還會測試大紋理和多視點性能測試。SPECapc for Maya 6.5由30項單獨的測試組成,其中的27項運行3遍。最終得分基于圖形占70%,CPU性能占20%,I/O占10%。 Overall Scores X380 X1800 9800GT GFX 7.47 8.26 3.72 I/O 5.65 5.69 5.03 CPU 8.43 8.33 8.35 Overall 7.44 7.97 5.98 嚴格來說Maya2009的測試成績更能放映X1800與X380之間的性能差距,但測試過程中,9800GT顯卡頻繁報錯,導致測試成績不具備對比性,所以只好繼續(xù)使用MAYA 6.5的測試成績。測試成績可以看到X1800在顯卡測試項目領先幅度接近10%左右。如果使用此款軟件進行復雜的建模設計,X380也可以輕松完成項目。相比之下,Geforce 9800GT的性能差距相當明顯,接近50%左右,整體性能差距也在20%左右。 SPECapc for SolidWorks 2007 SolidWorks 2007的測試項目中使用了大量形狀不同的CAD和CAM solid模型,其中最大的模型由313萬個頂點組成的發(fā)動機引擎,測試項目不僅可以考慮顯卡帶寬的吞吐量,也可以考驗顯卡頂點引擎的運算能力。測試項目包括8個測試項目: 考驗IO吞吐量的密集型操作,考驗整機性能的處理器密集運算,以及6個不同的圖形測試。一個單一的數(shù)字得自全部8項測試標準化得分的幾何平均數(shù)加權(quán)。當然,這些測試不是SolidWorks2007的全部,體驗專業(yè)卡的特性就在于此,只有3D專業(yè)顯卡才能夠支持SolidWorks中的ReadView功能,通過硬件加速顯示模型,這是其顯卡不具備的功能。 X380 X1800 GTS250 Complete 157.30 168.89 159.23 Graphics 52.47 61.69 51.45 Processon 45.41 46.36 43.36 I/O 29.42 61.14 35.50 測試成績讓人感覺驚訝,專業(yè)卡不敵游戲卡。其實沒什么好奇怪,GTS250本身就是面向中高端的產(chǎn)品,3D運算能力不俗,成績落后X1800不足10%也屬于正常。X380與GTS250以及X1800的差距并不明顯,也就是說GTS250也可以使用在Solidworks2007的工作環(huán)境中。 SPECapc for Lightwave 9.6 LightWave 9.6的測試項目相當復雜,測試需要使用11個模型模型,模型大小從6.4萬個模型到175萬個多邊形構(gòu)成,通過構(gòu)建多邊形、移動多邊形、縮放以及快速旋轉(zhuǎn)測試3D顯卡的整體運算能力。 X380 X1800 GTS250 Lnteractive 1.98 2.15 1.37 Render 3.56 3.56 3.57 Multiask 2.83 2.86 2.89 測試結(jié)果證明GTS250與X380和X1800之間略有差距,而且差距比較明顯,特別是在Lnteractive的得分中,差距接近50%以上。在1900X1200的高分辨率下,專業(yè)繪圖卡的性能優(yōu)勢比較明顯。 SPECapc for UGS NX 4 由一個在發(fā)動機工業(yè), UGS, 和SPECapc之間的合作努力完成。密集化的SUV(車身模型包含了超過30000個顯示線條,變速箱模型包含了84000個顯示線條。測試項目包括旋轉(zhuǎn)、縮放)全景、前端、后端透視、預覽等操作。測試項目記錄圖形、CPU、磁盤盒I/O操作結(jié)果,屬于整個系統(tǒng)性能的復雜測試。
X380 X1800 GTS250 Total I/O 2.22 2.29 2.02 Total CPU 3.62 3.66 3.81 Total Graphics 6.12 8.34 4.27 Total 5.01 6.03 4.98
FX380的散熱器,看起來很單薄#p#page_title#e#
128位精度圖形管線
每個色彩分量(RGBA)都具備完整的IEEE 32位浮點精度,可在最大動態(tài)范圍內(nèi)實現(xiàn)上百萬種色彩變化。 在著色、濾波、紋理以及合成方面樹立了圖像清晰度和畫質(zhì)的全新標準。 在視覺特效處理方面可實現(xiàn)前所未有的渲染圖像質(zhì)量。
改善了管線色彩壓縮以及無失真Z坐標壓縮(Early Z-Cull)技術,提升了有效帶寬、渲染效率和性能。
兼容行業(yè)標準架構(gòu)
兼容Intel/AMD的x86 32位以及64位微處理器架構(gòu)以及Microsoft/Linux操作系統(tǒng)。
Cg高級圖形著色器語言
Cg — 圖形專用“C”語言 — 是一種開放標準的高級編程語言,這種語言能夠利用可編程GPU的強大動力。 NVIDIA Quadro FX可編程圖形管線利用高級著色語言來創(chuàng)造實時的逼真效果并將這些效果整合到3D模型、場景以及設計中。 想要在CAD(計算機輔助設計)、DCC(數(shù)字內(nèi)容制作)以及科學應用程序中創(chuàng)造出實時、逼真的視覺效果,該語言是一種主要的途徑。
高性能顯示器輸出
400MHz RAMDAC(隨機存取存儲器數(shù)模轉(zhuǎn)換器)以及最多兩個DisplayPort數(shù)字接口能夠驅(qū)動市面上最高分辨率的數(shù)字顯示器。
8K紋理以及渲染處理
能夠從8K x 8K的表面采集紋理以及對這些表面進行渲染。 本特性有利于這些需要最高分辨率和最高圖像質(zhì)量的處理任務。
下一代頂點以及像素可編程性Shader Model 4.0
面向OpenGL以及下一代DirectX 10業(yè)界領先的專業(yè)應用程序,shader model 4.0參考標準可實現(xiàn)更高級別的性能與逼真效果。
Quadro FX GPU引入了無限長度頂點程序以及動態(tài)流量控制技術,消除了之前對著色器程序復雜度與結(jié)構(gòu)的限制。 Quadro FX GPU能夠?qū)崿F(xiàn)實時圖形系統(tǒng)從前不敢想象的復雜特效。
CUDA架構(gòu)
NVIDIA CUDA 是 Quadro專業(yè)級GPU(圖形處理器)的一種革命性并行計算架構(gòu),該架構(gòu)在視頻編碼、圖像處理以及精確物理效果等方面可實現(xiàn)巨大性能突破。
NVIDIA圖形應用程序接口(API)擴展
NVIDIA為Linux以及Windows提供了一套標準圖形API的擴展,讓應用程序能夠最大限度地利用最前沿的GPU功能。
NVIDIA高精度高動態(tài)范圍(HDR)技術
在著色、濾波、紋理填充以及合成方面的超高浮點性能樹立了圖像清晰度與畫質(zhì)的全新標準。 在視覺特效處理方面可實現(xiàn)前所未有的渲染圖像質(zhì)量。
由于測試平臺相同,I/O與CPU和匯總的成績幾乎相同,差距不大,只有顯卡得分選項略有差別,X1800幾乎領先GTS250接近一倍以上,在大量多線條的考核下,吞吐量與多邊形生成能力有優(yōu)勢的GTS250甚至敵X380,可以充分專業(yè)繪圖卡的優(yōu)勢所在。
SPECviewperf 10
Viewperf 10.0 是 SPECopc發(fā)布的大型 3D 圖形測試工具,對大量圖形設計軟件進行綜合性測試,其中包括 3dsmax-04、catia-02、ensight-03、maya-02、proe-04、sw-01、tvis-01、ugnx-01,分別對應 3dsmax、CATIA、EnSight、Maya、Pro/Engineer、Solidworks、UGS Teamcenter Visualization Mockup、UGS NX 等多個應用軟件的對應測試項目。SPECviewperf 10與apc出品的測試軟件不同,后者注重實戰(zhàn)效果,必須安裝終端軟件才能運行Benchmark,而且測試得分評價系統(tǒng)相當復雜,SPECviewperf 10的測試比較簡單,而且考察的是顯卡的綜合性能。簡單理解如果SPECviewperf 10的得分領先比較明顯,在設計方面的性能表現(xiàn)也就會越出眾。
X380 |
X1800 |
GTS250 |
|
3DSMAX |
39.26 |
44.35 |
12.88 |
Catia |
47.25 |
52.55 |
8.81 |
Ensight |
30.54 |
47.44 |
18.27 |
Maya |
123.04 |
147.07 |
26.51 |
Proe |
40.90 |
45.11 |
9.70 |
SolidWorks |
61.62 |
100.02 |
17.30 |
Tcvis |
17.08 |
26.85 |
4.32 |
UGNX |
13.80 |
31.15 |
9.56 |
綜合測試可以清楚顯示游戲顯卡與專業(yè)繪圖卡在OpenGL模式下的差距。在常規(guī)的驅(qū)動下,X380的領先幅度非常明顯,特別是在MAYA、ProE和SolidWorks領先接近3倍以上,特別是MYA的測試項目圖形與此前進行Spec for MAYA 6.5的測試項目幾乎相同,但性能差距在6倍左右。Tcvis與3DSMAX的項目性能差距接近4倍左右。
由此可見,在D3D渲染引擎下,如果不考慮超大型模型的渲染穩(wěn)定性的情況下,游戲顯卡也勉強應付較為復雜的渲染,但在OpenGL模式下,專業(yè)顯卡的渲染性能絕非游戲顯卡可以對比,即使不是一個級別的顯卡,恐怕也難以匹敵。#p#page_title#e#
測試總結(jié)
由于我們沒有找到FX370和FX1700進行對比測試,所以FX380和FX1800的測試成績也沒用直接的競爭對手,GTS250雖然規(guī)格高于FX380和FX1800,但在OpenGL的渲染模式中全面敗陣。對大多數(shù)入門級消費者來說,或許一片價格低廉的游戲顯卡或許也可以專業(yè)設計,但在超大型的模型面前,游戲顯卡無法滿足穩(wěn)定性的需求,這是致命的死穴。舉例說明,如果想要在3DS中渲染一個超過2GB的模型文件,Geforce系列顯卡往往以死機告終,這不是顯卡快與慢的問題,而是設計理念不同,正所謂術業(yè)有專攻。
對專業(yè)繪圖卡的用戶來說,并沒有更多的選擇空間,與FX370和FX1700相比,由于核心與架構(gòu)進步帶來的改良肯定是明顯的,CUDA與全新的DX10渲染就是最大的吸引力,對入門級工作站來說FX380就是一個不錯的選擇。FX1800的售價性能更好,但售價也略高一些,對經(jīng)常渲染更高規(guī)格的用戶來說,X1800可以節(jié)省下更多的時間。此外還有一般游戲卡上暫時還很罕見的 DisplayPort 支持,對于需要這些特性的行業(yè)用戶來說,Quadro FX 1800 是更理想的選擇