在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    英偉達最強芯片曝光:18176個內(nèi)核、48 GB內(nèi)存、24 Gbps速度和800W TBP

    英偉達最強芯片曝光:18176個內(nèi)核、48 GB內(nèi)存、24 Gbps速度和800W TBP

    來源:內(nèi)容由半導(dǎo)體行業(yè)觀察(ID:icbank)編譯自wccftech,謝謝。

    最近,博主Kopite7kimi報告了有關(guān)英偉達旗艦芯片 NVIDIA Ada Lovelace GPU SKU 的詳細信息,這使它看起來像是有史以來最強大的終極圖形芯片。傳聞指出,NVIDIA Ada Lovelace 旗艦 GPU 采用 AD102-450 GPU,具有 18176 個內(nèi)核、48 GB“24 Gbps”GDDR6X 顯存和 800W TBP.

    這不是第一次談?wù)撊绱烁叨说?Ada Lovelace GPU SKU。之前的傳言也來自同一個泄密者,它報道了 Ada Lovelace GPU 陣容中的 Titan-Class 顯卡,該顯卡具有一些瘋狂的規(guī)格。再一次,這不是完全啟用的 AD102 GPU,而之前的變體被提及為具有完整 18432 CUDA 內(nèi)核的 900W TBP SKU。

    根據(jù)傳聞的規(guī)格,該顯卡將采用 Ada Lovelace 架構(gòu)并具有略微縮減的配置“AD102-450-A1”,在 18,432 個 CUDA 內(nèi)核(18432 個 CUDA 中)上搖擺 142 個 SM(144 個 SM)核心)。基于大約 3 GHz 的時鐘速度,這款顯卡將輕松突破 100 TFLOPs 計算障礙。據(jù)說該顯卡配備 48 GB GDDR6X 內(nèi)存,運行在 384 位總線接口上。

    有趣的是,NVIDIA 不會拘泥于 VRAM 規(guī)格,而是采用最新的 24 Gbps 內(nèi)存模塊,為 GPU 提供高達 1.152 TB/s 的 VRAM 帶寬。與具有 21 Gbps 內(nèi)存芯片的現(xiàn)有 RTX 3090 Ti 旗艦產(chǎn)品相比,內(nèi)存帶寬增加了 14%。即將推出的 RTX 4090 也有望使用相同的 21 Gbps 內(nèi)存芯片,只有旗艦“Ti”型號獲得 24 Gbps 芯片。

    功耗方面,新的NVIDIA旗艦AD102 GPU驅(qū)動的顯卡將是瘋狂的,其TDP幾乎是RTX 3090 Ti的兩倍,額定功率高達800W??紤]到單個 16 針連接器只能提供 600 瓦的功率,如果它成為現(xiàn)實,就必須為這種卡的怪物使用雙 16 針連接器配置。圖形卡可以使用 PG137-SKU0。

    基于 Ampere 陣容,我們看到 NVIDIA 不僅沒有發(fā)布 Titan 顯卡,而且實質(zhì)上用其 BFGPU 級 GeForce RTX 陣容取代了 Titan 系列。更高容量的卡仍然作為工作站 RTX Axxx系列推出,它也得到了完整的 GA102 處理,但除了RTX 3090 Ti和RTX A6000之外,沒有 Titan 級。那么 Titan 級 GPU 對 Ada Lovelace 是否有意義,或者這個特定的 SKU 最終會成為下一代游戲 BFGPU 和工作站的旗艦產(chǎn)品嗎?好吧,我們不能肯定地說,但有一件事是絕對正確的,這樣的 GPU 配置在規(guī)格、功耗和價格方面確實是瘋狂的。該卡如果涉及零售,肯定會在RTX 4090之后推出預(yù)計將于今年秋季晚些時候亮相。

    Nvidia Ada Lovelace 和 GeForce RTX 40 系列:我們所知道的一切

    Nvidia 的 Ada 架構(gòu)和 GeForce RTX 40 系列顯卡預(yù)計將于今年年底上市,并且可能在 9 月至 10 月的時間范圍內(nèi)——發(fā)生在Nvidia Ampere 架構(gòu)之后的兩年,考慮到摩爾“定律”的放緩(或者如果你愿意,死亡),英偉達這個發(fā)布步驟基本上是按計劃進行的。隨著今年早些時候的Nvidia 遭受黑客攻擊,我們獲得了關(guān)于預(yù)期結(jié)果的大量信息。我們已將所有內(nèi)容收集到這里,詳細介紹了我們對 Nvidia 的 Ada 架構(gòu)和 RTX 40 系列家族的了解和期望。

    現(xiàn)在有很多謠言在流傳,但英偉達幾乎沒有透露其對 Ada 的計劃,有些人將其稱為 Lovelace。我們所知道的是,Nvidia 已經(jīng)詳細介紹了其數(shù)據(jù)中心Hopper H100 GPU,我們懷疑,就像Volta V100和Ampere A100一樣,消費產(chǎn)品將在不久的將來跟進。

    最后一個可能是預(yù)期的最佳樣本。A100 于 2020 年 5 月正式發(fā)布,消費級 Ampere GPU 以RTX 3080和RTX 3090的形式推出大約四個月后。如果 Nvidia Ada Lovelace GPU 遵循類似的發(fā)布時間表,我們可以預(yù)期 RTX 40 系列將在 8 月或 9 月的某個時候到貨。讓我們從 Ada 系列 GPU 的傳聞規(guī)格的高級版本預(yù)覽開始。

    首先,根據(jù)預(yù)計,GPU 提供了介乎 1.6 到 2.0 GHz 的暫定時鐘速度估計值,這與 Nvidia 之前的 Ampere、Turing 甚至 Pascal 架構(gòu)一致。Nvidia 完全有可能超過這些時鐘,因此我們認為這是一個保守的估計。

    我們假設(shè) Nvidia 將在所有 Ada GPU 上使用 TSMC 的 4N 工藝——“4nm Nvidia”,這在技術(shù)上可能又是不正確的。我們知道 Hopper H100 使用臺積電的 4N 節(jié)點,這似乎主要是對臺積電 N5 節(jié)點的調(diào)整變體,該節(jié)點已廣泛用于蘋果的智能手機和筆記本電腦芯片,并且據(jù)傳聞,Nvidia 會將該節(jié)點用于 Ada。值得一提的是, AMD也有可能將其用于Zen 4 和RDNA 3。

    坦率地說,節(jié)點名稱并不像實際的 GPU 規(guī)格和性能那么重要。換句話說,“任何其他名字的玫瑰都會聞起來很香”。我們早就過了工藝節(jié)點名稱與芯片上的物理特性有任何實際聯(lián)系的年代。在 250nm(或 0.25 微米)芯片實際上具有可以指向并以 0.25um 寬度進行測量的元素時,芯片的物理縮放在過去的幾個工藝節(jié)點上已經(jīng)放緩,它們現(xiàn)在只是營銷名稱。

    晶體管數(shù)量是目前最好的猜測。我們確實知道 Hopper H100 將擁有 800 億個晶體管(這實際上只是一個近似值,但我們會繼續(xù)使用它)。A100 GPU 有 560 億個晶體管,是 GA102 消費級 halo芯片數(shù)量的兩倍,但有跡象表明 Nvidia 將在 AD102 GPU 上“做大”,而且它的尺寸可能更接近 H100,而不是 GA102 . 如果有可靠的信息可用,我們將更新這些表格,但目前,任何關(guān)于晶體管數(shù)量的說法都只是與我們不同的猜測。

    理論上,根據(jù)我們目前看到的“泄露”信息,Ada看起來是個怪物。與當(dāng)前的 Ampere GPU 相比,它將包含更多的 SM 和相關(guān)內(nèi)核,這將大大提高性能。即使 Ada 最終比泄漏所聲稱的要少,可以肯定的是,我們會看到頂級 GPU 的性能——也許是 RTX 4090,盡管 Nvidia 可能會再次改變命名法——不過毫無疑問,新產(chǎn)品將是領(lǐng)先RTX 3090 Ti 的一大進步.

    例如,RTX 3080 在發(fā)布時比 RTX 2080 Ti 快了大約 30%,而 RTX 3090 又增加了 15%,至少如果你以 4K 超分辨率將 GPU 推到極限的話。這也是需要牢記的。如果您當(dāng)前運行的是更適中的處理器,而不是絕對最好的游戲 CPU 之一(Core i9-12900K或Ryzen 7 5800X3D),這意味著即使在 1440p 超分辨率下,你也很可能會限制 CPU。為了充分利用最快的 Ada GPU,可能需要進行更大的系統(tǒng)升級。

    在高級版本簡介完畢之后,讓我們進入細節(jié)。

    一 ADA 將大幅提升計算性能

    與當(dāng)前 Ampere 代相比,Ada GPU 最顯著的變化將是 SM 的數(shù)量。據(jù)猜測,AD102 包含的 SM 可能比 GA102 多 71%。即使架構(gòu)沒有其他任何重大變化,我們也預(yù)計性能會大幅提高。

    這不僅適用于圖形,也適用于其他元素。我們在 Tensor 核心性能上使用安培計算(Ampere calculations),運行頻率接近 2GHz 的完全啟用的 AD102 芯片將在 FP16 中具有高達 590 TFLOPS 的深度學(xué)習(xí)/AI 計算。相比之下,RTX 3090 Ti 中的 GA102 最高約為 321 TFLOPS FP16(使用 Nvidia 的稀疏特性)。根據(jù)核心數(shù)量和時鐘速度,新產(chǎn)品理論上增加了 84%。理論上 84% 的性能提升同樣適用于光線追蹤硬件。

    除非 Nvidia 為各自的第三代和第四代實現(xiàn)重新設(shè)計 RT 內(nèi)核和 Tensor 內(nèi)核。我們懷疑不需要對 Tensor 內(nèi)核進行大規(guī)模更改——Hopper H100 的深度學(xué)習(xí)硬件的重大改進將比 Ada AD102 更多。同時,RT 內(nèi)核可以很容易地看到每核 RT 性能比 Ampere 再提高 25-50% 的改進,就像 Ampere 每個 RT 內(nèi)核比 Turing 快 75% 左右一樣。

    最壞的情況,只是將 Ampere 架構(gòu)從三星 Foundry 的 8N 工藝移植到 TSMC 的 4N(或 5N 或其他),并沒有真正改變架構(gòu)的任何其他內(nèi)容,添加更多內(nèi)核并保持類似的時鐘應(yīng)該提供足夠的一代性能提升. Nvidia 的表現(xiàn)可能遠遠超過最低要求,但即使是位于底部的AD107 芯片也比當(dāng)前的 RTX 3050快30% 或更多的改進。

    請記住,列出的 SM 數(shù)量是完整的芯片,而且很可能 Nvidia 將使用部分禁用的芯片來提高良率。以 Hopper H100 為例,它有 144 個潛在的 SM,但在 SXM5 變體上僅啟用了 132 個 SM,而 PCIe 5.0 卡將啟用 114 個 SM。我們可能會看到 Nvidia 推出高端 AD102 解決方案(即 RTX 4090),其中啟用了 132 到 140 個 SM,較低層型號使用更少的 SM。在良率提高后,這當(dāng)然為未來帶有完全啟用 AD102 的卡(即 RTX 4090 Ti)打開了大門。

    二 猜測 ADA 的 ROP

    我們在所有 Ada GPU 上的 ROP 計數(shù)(渲染輸出)之后加上了問號,因為我們還不知道它們是如何配置的。通過 Ampere,Nvidia 將 ROP 與 GPC(圖形處理集群)聯(lián)系起來。每個 GPC 包含一定數(shù)量的 SM(流式多處理器),可以成對禁用。然而,即使我們知道 SM 的數(shù)量,我們也不知道它們是如何分成 GPC 的。

    以帶有 144 個 SM 的 AD102 為例。這可能是 12 個 GPC,每個 12 個 SM,8 個 GPC,每個 18 個 SM,或 9 個 GPC,每個 16 個 SM。其他可能性也存在,但這是我們認為最有可能的三種。Nvidia 對 GPU 游戲并不陌生,因此無論安排如何,最終我們都應(yīng)該期望它能夠滿足 GPU 的需求。

    我們已經(jīng)看到一些猜測表明 GA102 將有 12 個 GPC,每個 GPC 有 12 個 SM,這將產(chǎn)生 192 個 ROP 作為最大值。這不是不可能的,但請注意,Hopper H100 有 8 個 GPC 集群,每個集群有 18 個 SM,因此這對于 AD102 來說似乎也是一個合理的配置——只是沒有 HBM3 并且較少關(guān)注深度學(xué)習(xí)硬件。

    三 可疑的泄密和謠言

    此外,AD102 的 144 個 SM 是令人懷疑的。巧合的是,Hopper H100 芯片共有 144 個 SM,其中 132 個在目前的頂級產(chǎn)品中啟用。對于 Ada 和 Hopper 都擁有相同的 144 個 SM 來說,這將是非常令人驚訝的。GA100 最多有 120 個 SM,因此,對于 H100,Nvidia 僅將 SM 數(shù)量增加了 20%。相比之下,假設(shè)泄密信息是真的,那就意味著AD102 的 SM 比 GA102 多 71%。

    我們現(xiàn)在沒有更好的事情要做,所以我們報道了傳聞中的 144 SM 數(shù)字,但如果這完全是假的,請不要感到驚訝。僅僅因為 Nvidia 被黑客入侵并且數(shù)據(jù)被泄露,并不意味著泄露的所有內(nèi)容都是準確的。Nvidia 可能會更好地調(diào)整架構(gòu)以獲得更高的時鐘并使用更少的 SM,類似于 AMD 對 RDNA 2 所做的,但這可能需要對底層架構(gòu)進行更重大的改革。

    另一方面,AD102 成為巨大芯片至少有一個充分的理由——專業(yè) GPU。Nvidia 并未為消費者和專業(yè)市場制造完全獨立的芯片,RTX A6000 等 A 系列芯片就是明證。它使用與 RTX 3080 到 3090 Ti 相同的 GA102 芯片,只是在驅(qū)動程序中打開了一些額外的功能。光線追蹤并沒有真正讓游戲世界著火,但它對專業(yè)市場來說是一件大事,并且封裝更多的 RT 核心將是 3D 渲染用戶的福音。另請注意,Hopper H100 不包含任何光線追蹤硬件,就像它所取代的 GA100 一樣。

    各種 Ada GPU 也將用于運行 AI 和 ML 算法的推理平臺,這再次意味著可以使用更多的 Tensor 內(nèi)核和計算。因此,最重要的是,假設(shè)的最大 144 個 SM 并不是完全不可能的,但它肯定值得懷疑。也許英偉達黑客發(fā)現(xiàn)了過時的信息,或者人們錯誤地解釋了它。在接下來的幾個月里,我們會知道更多。

    四 內(nèi)存子系統(tǒng):GDDR6X 再上新臺階

    早前,美光宣布它擁有運行速度高達 24Gbps 的 GDDR6X 內(nèi)存的路線圖。最新的 RTX 3090 Ti 僅使用 21Gbps 內(nèi)存,而 Nvidia 是目前唯一一家使用 GDDR6X 的公司。這立即引發(fā)了將使用 24Gbps GDDR6X 的問題,唯一合理的答案似乎是 Nvidia Ada。較低層的 GPU 更有可能堅持使用標準 GDDR6 而不是 GDDR6X,其最高速度為 18Gbps。

    這代表了一個問題,因為 GPU 通常需要計算和帶寬來按比例擴展以實現(xiàn)承諾的性能量。例如,RTX 3090 Ti 的計算量比 3090 多 12%,更高的時鐘內(nèi)存提供了 8% 的帶寬。如果我們上面的計算估計證明甚至接近準確,那么就會出現(xiàn)巨大的脫節(jié)。假設(shè)的 RTX 4090 的計算量可能比 RTX 3090 Ti 多 80%,但帶寬僅多 14%。

    假設(shè)可以控制 GDDR6X 功耗,那么在較低級別的GPU 上帶寬增長的空間要大得多。當(dāng)前的 RTX 3050 到 RTX 3070 都使用標準 GDDR6 內(nèi)存,主頻為 14-15Gbps。我們已經(jīng)知道運行在 18Gbps 的 GDDR6 將及時為 Ada 提供,因此具有 18Gbps GDDR6 的假設(shè) RTX 4050 應(yīng)該可以輕松跟上 GPU 計算能力的增長。如果 Nvidia 仍然需要更多帶寬,它也可以將 GDDR6X 用于較低層的 GPU。

    更高級別的 Ada GPU 最終與 GDDR7 或三星的“GDDR6+”配對的可能性也很小,據(jù)報道,這將達到高達 27Gbps 的速度。然而,我們還沒有聽到關(guān)于其中任何一個的具體細節(jié),在這個階段,Nvidia 將需要其合作伙伴來提高內(nèi)存產(chǎn)量。更多的生產(chǎn)將不可避免地導(dǎo)致更多的泄漏,由于我們還沒有看到 GDDR7 或 GDDR6+ 生產(chǎn)的泄漏,我們假設(shè)它不會及時出現(xiàn)。

    更有可能的是,Nvidia不需要大幅增加純內(nèi)存帶寬,因為它會重新設(shè)計架構(gòu),類似于我們看到 AMD 對 RDNA 2 所做的與原始 RDNA 架構(gòu)相比。

    五 ADA 希望利用 L2 緩存獲利

    一種減少對更多原始內(nèi)存帶寬需求的好方法是幾十年來已知和使用的方法——在芯片上增加更多緩存,您會獲得更多cache hits,每次cache hits意味著 GPU 不需要從 GDDR6/GDDR6X 內(nèi)存中提取數(shù)據(jù)。AMD 的 Infinity Cache 讓 RDNA 2 芯片基本上可以用更少的原始帶寬做更多的事情,泄露的Nvidia Ada L2 緩存信息表明 Nvidia 將采取類似的方法。

    AMD 在 Navi 21 GPU 上使用了高達 128MB 的大型 L3 緩存,Navi 22 為 96MB,Navi 23 為 32MB,Navi 24 僅為 16MB。令人驚訝的是,即使是較小的 16MB 緩存也能為內(nèi)存子系統(tǒng)帶來奇跡。我們沒想到Radeon RX 6500 XT總的來說是一張很棒的卡,但它基本上可以跟上內(nèi)存帶寬幾乎是兩倍的卡。

    Ada 架構(gòu)似乎將一個 8MB L2 緩存與每個 32 位內(nèi)存控制器配對。這意味著具有 128 位內(nèi)存接口的卡將獲得 32MB 的總二級緩存,而堆棧頂部的 384 位接口卡將擁有 96MB 的二級緩存。雖然在某些情況下這比 AMD 的 Infinity Cache 要小,但我們還不知道延遲或設(shè)計的其他方面。L2 緩存的延遲往往低于 L3 緩存,因此稍小的 L2 肯定可以跟上更大但速度較慢的 L3 緩存。

    如果我們以 AMD 的 RX 6700 XT 為例,它的計算能力比上一代 RX 5700 XT 高出約 35%。我們的GPU 基準測試層次結(jié)構(gòu)中的性能同時在 1440p 超分辨率下高出約 32%,因此整體性能與計算幾乎一致。除此之外,6700 XT 擁有 192 位接口,帶寬僅為 384 GB/s,比 RX 5700 XT 的 448 GB/s 低 14%。這意味著大型 Infinity Cache 使 AMD 的有效帶寬提高了 50%。

    假設(shè) Nvidia 可以通過 Ada 獲得類似的結(jié)果,那么通過 24Gbps 內(nèi)存將帶寬增加 14%,然后將其與有效帶寬增加 50% 配對。這將使 AD102 的有效帶寬增加大約 71%,這與 GPU 計算的增加非常接近,因此一切都應(yīng)該很好地發(fā)揮作用。

    然而,關(guān)于緩存謠言的更多都是猜測。Nvidia 已經(jīng)發(fā)布了有關(guān) Hopper H100 的大量細節(jié)。它確實比上一代 GA100 具有更大的 L2 緩存大小,但它不是每個內(nèi)存控制器 8MB。事實上,H100 上的總二級緩存為 50MB,而 A100 的二級緩存為 40MB。但 Hopper 也使用 HBM3 顯存,將用于海量數(shù)據(jù)集,這也是它擁有 80GB 顯存的原因。任何不能放入 40MB 的東西也不太可能放入 50MB 甚至 150MB。消費者工作負載,尤其是游戲,更有可能從更大的緩存中受益。Nvidia 可能會在這里追隨 AMD 的腳步,或者謠言最終可能完全錯誤。

    六 ADA的功耗

    Ada 架構(gòu)的一個元素肯定會引起一兩個人的注意,那就是功耗。Igor’s Lab 的 Igor 是第一個將 Ada 的 600W TBP(典型電路板功率)傳聞記錄在案的人,我們第一次聽到就笑了。“不可能,”我們想。多年來,Nvidia 顯卡的最高功率接近 250W,而 Ampere 在 RTX 3090(以及后來的 RTX 3080 Ti)上躍升至 350W 已經(jīng)感覺有些過分了。隨后英偉達公布了 Hopper H100 規(guī)格并發(fā)布了 RTX 3090 Ti,突然覺得 600W 的可能性不大。

    這一切都可以追溯到 Dennard scaling的終結(jié),以及摩爾定律的死亡。簡而言之,Dennard scaling(也稱為 MOSFET scaling)觀察到,每一代,尺寸都可以縮小約 30%。這將總面積減少了 50%(長度和寬度都按比例縮放),電壓下降了類似的 30%,電路延遲也將減少 30%。此外,頻率將增加約 40%,總功耗將減少 50%。

    如果這一切聽起來好得令人難以置信,那是因為 Dennard scaling實際上在 2007 年左右停止發(fā)生。就像摩爾定律一樣,它并沒有完全失效,但收益變得不那么明顯了。集成電路中的時鐘速度僅從 2004 年 Pentium 4 Extreme Edition 的最高約 3.7GHz 增加到如今 Core i9-12900KS 的最高 5.5GHz。這仍然幾乎增加了 50% 的頻率,但它已經(jīng)超過了六代(或更多,取決于您要如何計算)的流程節(jié)點改進。換句話說,如果 Dennard scaling沒有死,現(xiàn)代 CPU 的時鐘頻率將高達 28GHz。

    死亡的不僅僅是頻率縮放,還有功率和電壓縮放。如今,新的工藝節(jié)點還可以提高晶體管密度,不過需要平衡電壓和頻率。如果您想要一個速度快兩倍的芯片,您可能需要使用幾乎兩倍的功率?;蛘?,您可以構(gòu)建更高效的芯片,但不會更快。Nvidia 似乎正在尋求 Ada 的第一個選項。

    使用像 GA102 這樣的 350W Ampere GPU,將性能提升 70-80%。因此,這樣做意味著要多使用 70-80% 的功率。350W 然后變成 595–630W。Nvidia 可能會比線性擴展稍微好一點,并且 600W 很可能是參考卡上的最大功率使用,但我們已經(jīng)聽說一些下一代第三方超頻卡可能包括雙 16 針電源連接器。

    七 ADA會最終成為RTX 40-SERIES嗎?

    下一代Nvidia GPU將被稱為什么仍然存在問題。我們建議 RTX 40 系列,堅持過去幾代人建立的模式,但 Nvidia 總能改變一些事情。改變的一個潛在原因是:中國人不喜歡“四”,這在粵語和普通話中也意味著死亡。

    這是一個足夠好的理由來改變事情嗎?也許不是。當(dāng)然,這些年來我們已經(jīng)看到很多顯卡和其他型號為“4”的 PC 產(chǎn)品。英偉達在其 RTX 品牌上投入了大量資金,雖然如果每個人都準確地猜出下一系列 GPU 的名稱可能不會那么令人興奮,但銷量才是最重要的。

    無論最終調(diào)用 Ada 顯卡,都不會改變它們的性能或功能。我們中的大多數(shù)人有理由相信 Nvidia 將使用 RTX 40 系列名稱,但如果 Nvidia 做出改變,這并不是世界末日。

    簡短的答案,也是真正的答案是,它們的成本將與 Nvidia 可以擺脫的收費一樣多。Nvidia 推出 Ampere 時采用了一套財務(wù)模型,但事實證明,這些模型在 Covid-19 大流行時代是完全錯誤的。現(xiàn)實世界的價格飆升,黃牛從中牟取暴利,而那是在加密貨幣礦工開始支付官方推薦價格的兩到三倍之前。即使是現(xiàn)在,我們?nèi)匀豢吹?30% 或更多的加價。好消息是GPU 價格正在下降。

    Ada 和 RTX 40 系列的 GPU 價格很可能會上漲。然而,假設(shè)的大型 L2 緩存和內(nèi)存帶寬的相對有限增加應(yīng)該導(dǎo)致 Ada 僅在 Ampere 的采礦性能方面提供適度的提升,就像 AMD 的 RDNA 2 卡僅比 RDNA 模型快一點一樣。這意味著,即使在 Ada 到來之前采礦盈利能力“恢復(fù)”,單靠采礦幾乎肯定無法維持我們從 2020 年底到 2022 年初看到的大幅上漲的價格。

    正如我們將在下一節(jié)中討論的那樣,Nvidia 也沒有理由立即將其所有 GPU 生產(chǎn)從 Ampere 轉(zhuǎn)移到 Ada。我們可能會看到 RTX 30 系列 GPU 仍在生產(chǎn)相當(dāng)長一段時間,特別是因為沒有其他 GPU 或 CPU 競爭三星 Foundry 的 8N 制造。Nvidia 首先推出高端 Ada 卡,利用其可以從臺積電獲得的所有可用容量,并在必要時降低現(xiàn)有 RTX 30 卡的價格以填補任何漏洞,從而獲得更多收益。

    我們多次提到了 9 月推出 Ada 和 RTX 40 系列 GPU 的時間表,但重要的是要記住,第一批 Ada 卡只是冰山一角。英偉達于 2020 年 9 月推出了 RTX 3080 和 RTX 3090,一個月后 RTX 3070 到貨,再過一個月后 RTX 3060 Ti 到貨。RTX 3060 直到 2021 年 2 月下旬才問世,然后 Nvidia 在 2021 年 6 月用 RTX 3080 Ti 和 RTX 3070 Ti 更新了該系列。預(yù)算友好的 RTX 3050 直到 2022 年 1 月才到貨,最后是 RTX 3090 Ti 剛剛于 2022 年 3 月下旬推出。

    我們預(yù)計 Ada 卡也將分階段推出,從最快的型號開始逐步進入高端和主流產(chǎn)品,以預(yù)算為導(dǎo)向的 AD106 和 AD107 最早可能要到 2023 年才會推出。正如我們剛剛提到的,RTX 3050 僅在 1 月下旬推出,因此至少再過一年甚至更長的時間都不會更換。再說一次,我們?nèi)匀恍枰嬲念A(yù)算產(chǎn)品來接管 GTX 1660 和 GTX 1650 系列。我們能否以低于 200 美元的價格獲得新的 GTX 系列或真正的預(yù)算 RTX 卡?這是可能的,但不要指望它,因為 Nvidia 似乎滿足于讓 AMD 和英特爾在 200 美元以下的范圍內(nèi)與之抗衡。

    在首次發(fā)布大約一年后,不可避免地會更新 Ada 產(chǎn)品。在這個階段,任何人都猜測這些最終是“Ti”模型還是“Super”模型或其他什么,但你幾乎可以在你的日歷上標記它。

    八 GPU世界的更多競爭

    幾十年來,英偉達一直是顯卡領(lǐng)域的主導(dǎo)者。它控制著整個 GPU 市場的大約 80% 到 90%,并且在很大程度上能夠決定光線追蹤和 DLSS 等新技術(shù)的創(chuàng)建和采用。然而,隨著人工智能和計算對科學(xué)研究和其他計算工作負載的重要性不斷增加,以及它們對類似 GPU 的處理器的依賴,許多其他公司都在尋求進入該行業(yè),其中最主要的是英特爾。

    自 90 年代后期以來,英特爾就沒有在專用顯卡上做出過適當(dāng)?shù)膰L試,除非你算上流產(chǎn)的 Larrabee。這一次,Intel Arc 似乎是玩真的——或者至少是進了門??雌饋碛⑻貭柛嗟仃P(guān)注媒體功能,而在 Arc 的游戲或一般計算性能方面,陪審團仍然沒有定論。據(jù)我們所知,頂級消費模型最多只能在 18 TFLOPS 范圍內(nèi)??纯次覀冊陧敳康淖雷樱雌饋硭粫c AD106 競爭。

    但 Arc Alchemist 只是英特爾計劃的常規(guī) GPU 架構(gòu)中的第一個。Battlemage 可以輕松地將 Alchemist 的能力翻倍,如果英特爾能夠早日實現(xiàn)這一目標,它可能會開始蠶食 Nvidia 的市場份額,尤其是在游戲筆記本電腦領(lǐng)域。

    AMD 也不會停滯不前,它已經(jīng)多次表示它“有望”在今年年底之前推出其 RDNA 3 架構(gòu)。我們預(yù)計 AMD 將轉(zhuǎn)向臺積電的 N5 節(jié)點,這意味著它可能會直接與 Nvidia 競爭晶圓,并且兩者都必須做出類似的設(shè)計決策。到目前為止,AMD 一直避免將任何形式的深度學(xué)習(xí)硬件放入其消費級 GPU(與其 MI200 系列不同),但由于 Arc 還包括 Xe Matrix 內(nèi)核,它可能需要重新考慮這種方法。

    毫無疑問,Nvidia 目前提供的光線追蹤性能遠遠優(yōu)于 AMD 的 RX 6000 系列卡,但 AMD 對光線追蹤硬件或游戲中對 RT 效果的需求幾乎沒有直言不諱。就英特爾而言,它的 RT 性能似乎比 AMD 還要低。但只要大多數(shù)游戲在沒有 RT 效果的情況下繼續(xù)運行得更快并且看起來不錯,那么說服人們升級顯卡就是一場艱苦的戰(zhàn)斗。

    長達兩年的 GPU 干旱和價格過高的顯卡已經(jīng)過去了。2022 年將成為自 2020 年以來 GPU 領(lǐng)域的第一次真正激動人心的時刻。希望這一輪能夠看到更好的可用性和定價。它幾乎不會比我們過去 18 個月看到的情況更糟。

    參考鏈接:

    https://wccftech.com/nvidia-flagship-ada-lovelace-gpu-18176-cores-48-gb-memory-24-gbps-speeds-800w-tbp-rumor/

    https://www.tomshardware.com/features/nvidia-ada-lovelace-and-geforce-rtx-40-series-everything-we-know

    *免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

    今天是《半導(dǎo)體行業(yè)觀察》為您分享的第3112內(nèi)容,歡迎關(guān)注。

    晶圓 集成電路 設(shè)備 汽車芯片 存儲 臺積電 AI 封裝

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2022年7月27日 15:14
    下一篇 2022年7月27日 15:14

    相關(guān)推薦

    • 筆記本最好配置(目前筆記本最好的配置)

      本文主要講的是筆記本最好配置,以及和目前筆記本最好的配置相關(guān)的知識,如果覺得本文對您有所幫助,不要忘了將本文分享給朋友。 筆記本電腦什么配置好? 01 CPU:這個主要取決于頻率和…

      2022年11月26日
    • 寶可夢朱紫野怪對應(yīng)努力值表 野怪對應(yīng)努力值查詢一覽圖

      寶可夢朱紫野怪對應(yīng)努力值是多少?不同的野怪對應(yīng)的努力值不一樣,因此不少玩家對于野怪對應(yīng)努力值的詳情不太了解,今天我們就來看一看野怪對應(yīng)努力值表的具體內(nèi)容,小編已經(jīng)將詳情分享在下面,…

      2022年11月25日
    • OPPO Reno9 Pro+硬件規(guī)格強 搭載驍龍8+旗艦處理器

      OPPO Reno9系列正式發(fā)布,Reno9 Pro+作為三款新機中定位最高的超大杯機型,整體配置較上一代有著大幅度的升級,如果單看硬件配置的話,Reno9 Pro+甚至是目前OP…

      2022年11月24日
    • 中興Axon40 Ultra航天版將于11月29日正式發(fā)布

      據(jù)中興手機官微爆料,中興Axon40 Ultra航天版將于11月29日正式發(fā)布,新機不僅會采用驍龍?zhí)幚砥?,還將為大家?guī)硪幻丢毩踩酒?,獲得國密認證,擁有安全專利布局,不僅可以大…

      2022年11月24日
    • 鬧劇落下帷幕,曼聯(lián)官宣 C 羅離隊

      1、鬧劇落下帷幕,曼聯(lián)官宣 C 羅離隊 在經(jīng)歷過半個賽季的激烈鬧劇、C 羅私自接受采訪炮轟曼聯(lián)之后,俱樂部終于做出了相對應(yīng)的措施:正式官宣 C 羅離隊。 在曼聯(lián)俱樂部發(fā)布的聲明中寫…

      2022年11月24日
    • iqoo11什么時候上市 iqoo11發(fā)布時間最新消息

      iqoo11什么時候發(fā)布?隨著新一代旗艦芯片的發(fā)布,各家手機廠商也是公布了自己的旗艦機,那么iqoo11什么時候發(fā)布呢?下面就讓小編為大家介紹一下,一起來看看吧。 iqoo11什么…

      2022年11月24日
    • 銳龍97900x參數(shù)規(guī)格跑分評測 銳龍97900x屬于什么檔次

      銳龍9 7900X是銳龍7000系列處理器中性能頂尖的型號之一,它采用了這一代標配的zen4架構(gòu)和5nm制程工藝,那么它具體的參數(shù)跑分如何,在電腦上世紀發(fā)揮怎么樣呢,下面就來看看銳…

      2022年11月24日
    • 曝小米13系列已量產(chǎn):起步價格或定在4500元左右

      高通目前已經(jīng)發(fā)布第二代驍龍8芯片,首批機型已經(jīng)蓄勢待發(fā),小米此前也已經(jīng)宣布新旗艦要率先搭載。 據(jù)澎湃報道,小米13系列已經(jīng)正式量產(chǎn),全系均搭載4nm芯片,不出意外是標配第二代驍龍8…

      2022年11月24日
    • 王者榮耀高幀率模式支持機型列表最新 新增機型名單

      11月24日上午8:30-9:30,《王者榮耀》將進行全服不停機更新。本次更新大小安卓約33MB,iOS約44MB。 為了讓玩家們能享受更平滑,更精美的王者榮耀操作畫面體驗,在設(shè)置…

      2022年11月24日
    • 交錯核心芯片裝備槽在哪?交錯核心芯片裝備槽布置一覽

      交錯核心芯片裝備槽是很重要的,這些布置在什么地方。不少玩家不清楚該怎么布置才好,在游戲里怎么選擇裝備比較好。想要知道的小伙伴們,就一起來看看吧。 交錯核心芯片裝備槽布置一覽 可以看…

      2022年11月23日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時間:周一至周五,10:30-18:30,節(jié)假日休息