2023年12月28日 英偉達宣布正式發布GeForce RTX 4090D,對比于一年前上市的4090芯片,兩者的區別與差異在哪?而在當前比較火熱的大模型推理、AI繪畫場景方面 兩者各自的表現又如何呢?
規格與參數信息對比
現在先來看看GeForce RTX 4090D到底與之前的GeForce RTX 4090顯卡有何區別。(左為4090 右為4090D)
從簡單的規格來看,GeForce RTX 4090D同樣是采用了NVIDIA桌布端最強的Ampere架構,核心型號同為AD102但后綴會有些許的不一樣;CUDA數量這是目前最為明顯感知到的削減,4090D比4090少了約11%,從原本的16384個調整到14592個;基準頻率小有提升,從2235MHz提高至2280MHz,但兩者加速頻率同樣為2520MHz。而GeForce RTX 4090即便并非完整的AD102核心 但CUDA數量也達到了16,384 CUDA核心,512 Tensor 核心,以及128RT核心。
GeForce RTX 4090擁有的512 Tensor 核心能提供5283 TPP (Total Processing Performance),而GeForce RTX 4090D擁有的456 Tensor核心提供4700 TPP ,剛好卡在4800 TPP之下,意味著GeForce RTX 4090D與GeForce RTX 4090相差的就是8組TPCs,數量差距還是比較大的。功耗方面,4090和4090D的待機功耗均為19W,但4090D的平均游戲功耗稍有降低。從315W降低到302W,TGP也從450W下調到425W。但在英偉達的表格之外,我們也發現了一些新的改動:滿血版的4090有512個Tensor Core,但4090D只有456個;4090的TPP為5285TOPS,而4090D TPP為47.6.8TOPS。
實操影響區別
在性能方面,CUDA核心的數量對使用的影響主要體現在圖形渲染和物理模擬方面,圖形質量和復雜度往往需要大量的計算資源。CUDA核心專門用于處理這些計算任務,包括渲染高質量的圖形、實時物理效果、環境光影計算等。當CUDA核心的數量減少時,GPU處理這些任務的能力會相應降低。這意味著在同等條件下,具有較少CUDA核心的GPU可能無法以高分辨率或高幀率運行圖形密集型的模型。此外,物理模擬也會受到影響。設計中的爆炸效果、動態破壞、流體動力學等需要大量計算的物理效果可能在CUDA核心較少的情況下無法精確表現。
在AI推理方面:
RTX 4090D 的單/雙精度浮點運算性能與 RTX 4090 存在約 5% 的性能差距;在整數性能上,RTX 4090D則落后RTX 4090 2.6%的性能差距。
在AI繪畫的相關測試中:
使用Batch Size 1, Batch Count 10, CFG Scale 7, Sampling Steps 50的預設,在512*512分辨率下,RTX 4090D落后約10%;如果繼續提升分辨率,效率反倒有所提升,近乎打平。
數據圖表來自:https://www.expreview.com/91862.html
關于價格
以下是市面上一家算力共享平臺的4090以及4090D云服務器的價格,其中我們可以看到,在內存更小,總存儲小地多且性能低10%的情況下,4090D的價格竟然是比性能更強且規格更大的4090貴出不少。因此,大家在后續采購4090云服務器的過程中一定要仔細分辨購買的4090還是4090D,千萬不要以4090的價格買到了4090D 謹防買錯!
在這小編向大家推薦一款來自UCloud優刻得的一款4090云服務器,相比較于市面上的一些GPU共享算力平臺的資源,不僅價格實惠,性價比高,性能強勁的同時還擁有獨立IP、預裝主流大模型及環境鏡像,支持7X24的小時的售后服務。同時,UCloud還推出了9.9元/天的4090特惠,方便大家體驗使用 價格非常香,可以放心上車!
推薦使用NVIDIA RTX 40 顯卡做模型推理,購買地址如下:
http://specialneedsforspecialkids.com/site/active/gpu.html?ytag=seo
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/131113.html
自2022年年末英偉達發布4090芯片以來,這款產品憑借著其優異的性能迅速在科技界占據了一席之地?,F如今,不論是在游戲體驗、內容創作能力方面還是模型精度提升方面,4090都是一個繞不過去的名字。而A100作為早些發布的產品,其優異的能力和適配性已經為它打下了良好的口碑。RTX 4090芯片和A100芯片雖然都是高性能的GPU,但它們在設計理念、目標市場和性能特點上有著明顯的區別,而本篇文章將簡單概...
摘要:二是精度查全率和得分,用來衡量判別式模型的質量。精度查全率和團隊還用他們的三角形數據集,測試了樣本量為時,大范圍搜索超參數來進行計算的精度和查全率。 從2014年誕生至今,生成對抗網絡(GAN)熱度只增不減,各種各樣的變體層出不窮。有位名叫Avinash Hindupur的國際友人建立了一個GAN Zoo,他的動物園里目前已經收集了多達214種有名有姓的GAN。DeepMind研究員們甚至將...
大模型的訓練用4090是不合適的,但推理(inference/serving)用4090不能說合適,而是非常香!直接上圖!通過Tensor FP32(TF32)的數據來看,H100性能是全方面碾壓4090,但是頂不住H100價格太貴,推理上使用性價比極低。但在和A100的PK中,4090與A100除了在顯存和通信上有差異,算力差異與顯存相比并不大,而4090是A100價格的1/10,因此如果用在模...
摘要:阿里云服務器到底是什么呢與傳統的服務器虛擬主機主機有什么區別呢專門為用戶提供阿里云代金券免費領取及云產品折優惠的網站平臺尊托云數,將詳細介紹阿里云服務器與傳統服務器之間的區別。如果使用阿里云的彈性計算方案,則可避免這個問題。阿里云服務器ECS到底是什么呢?與傳統的服務器虛擬主機、VPS主機有什么區別呢?專門為用戶提供阿里云代金券免費領取及云產品1折優惠的網站平臺:尊托云數,將詳細介紹阿里云服...
摘要:阿里云年金秋上云季活動正在火熱進行中,除了爆品秒殺中的爆款云服務器之外,本次金秋上云季活動還上架了一批超強算例的云服務器產品,有實例下的通用型內存型計算型通用型和云服務器安全增強通用型等阿里云以往活動中從來沒有推出的云服務器,本次金秋上云季阿里云2021年金秋上云季活動正在火熱進行中,除了爆品秒殺中的爆款云服務器之外,本次金秋上云季活動還上架了一批超強算例的云服務器產品,有AMD實例下的通用...
閱讀 157·2024-12-10 11:51
閱讀 303·2024-11-07 17:59
閱讀 329·2024-09-27 16:59
閱讀 466·2024-09-23 10:37
閱讀 540·2024-09-14 16:58
閱讀 335·2024-09-14 16:58
閱讀 531·2024-08-29 18:47
閱讀 812·2024-08-16 14:40