NVIDIA Blackwell GPU Mimarisi Tanıtıldı
NVIDIA, Hopper H100 GPU’lara kıyasla 5 kata kadar daha fazla yapay zeka performans artışı sağlayan yeni nesil Blackwell GPU mimarisini resmi olarak tanıttı. Yeni mimari 208 milyar transistör, 192 GB HBM3e bellek ve 8 TB/s bant genişliği ile öne çıkıyor. Blackwell, H100’den 7 ila 30 kat daha hızlı olan ve 25 kat daha az güç kullanıyor.
NVIDIA, kod adı Blackwell olan yeni nesil yapay zeka ve Tensor Core GPU mimarisinin tüm ayrıntılarıyla resmileştirdi. Beklendiği gibi Blackwell GPU’lar, NVIDIA’nın aynı kalıpta iki GPU içeren ilk MCM tasarımına sahip ilk GPU’lar olarak karşımıza çıkıyor.
Blackwell’in özellikleri şöyle sıralanıyor:
- TMSC 4NP İşlem Düğümü
- Çok Yongalı Paket GPU
- 1-GPU 104 Milyar Transistör
- 2-GPU 208 Milyar Transistör
- 160 SM (20.480 Çekirdek)
- 8 HBM Paketleri
- 192 GB HBM3e Bellek
- 8 TB/s Bellek Bant Genişliği
- 8192-bit Bellek Veri Yolu Arayüzü
- 8-Hi Stack HBM3e
- PCIe 6.0 Desteği
- 700W TDP (Üst Nokta)
- Dünyanın En Güçlü Çipi – 208 milyar transistörle dolu Blackwell mimarili GPU’lar, 10 TB/saniye çipten çipe bağlantıyla tek ve birleşik bir GPU’ya bağlanan iki retikül limitli GPU kalıplarına sahip özel yapım 4NP TSMC süreci kullanılarak üretilmiştir.
- İkinci Nesil Transformer Motoru – Yeni mikro-tensör ölçeklendirme desteği ve NVIDIA’nın NVIDIA TensorRT-LLM ve NeMo Megatron çerçevelerine entegre edilmiş gelişmiş dinamik aralık yönetimi algoritmalarıyla desteklenen Blackwell, yeni 4 bit kayan nokta yapay zeka çıkarım yetenekleriyle iki kat daha fazla hesaplama ve model boyutunu destekleyecek.
- Beşinci Nesil NVLink – Multitrilyon parametreli ve uzmanlar karışımı yapay zeka modellerinin performansını hızlandırmak için NVIDIA NVLink’in en son yinelemesi, GPU başına çığır açan 1,8 TB/s çift yönlü verim sunarak en karmaşık LLM’ler için 576 adede kadar GPU arasında kesintisiz yüksek hızlı iletişim sağlar.
- RAS Motoru – Blackwell destekli GPU’lar güvenilirlik, kullanılabilirlik ve servis kolaylığı için özel bir motor içerir. Buna ek olarak Blackwell mimarisi, tanılamayı çalıştırmak ve güvenilirlik sorunlarını tahmin etmek için yapay zeka tabanlı önleyici bakımı kullanmak üzere çip düzeyinde yetenekler ekler. Bu, sistemin çalışma süresini en üst düzeye çıkarır ve büyük ölçekli yapay zeka dağıtımlarının bir seferde haftalarca hatta aylarca kesintisiz çalışması ve işletme maliyetlerini düşürmesi için esnekliği artırır.
- Güvenli Yapay Zeka – Gelişmiş gizli bilgi işlem özellikleri, sağlık hizmetleri ve finansal hizmetler gibi gizliliğe duyarlı sektörler için kritik öneme sahip yeni yerel arayüz şifreleme protokollerini destekleyerek yapay zeka modellerini ve müşteri verilerini performanstan ödün vermeden korur.
- Dekompresyon Motoru – Özel bir dekompresyon motoru, veri analitiği ve veri biliminde en yüksek performansı sunmak için veritabanı sorgularını hızlandırarak en yeni formatları destekler. Önümüzdeki yıllarda, şirketlerin her yıl on milyarlarca dolar harcadığı veri işleme, giderek daha fazla GPU ile hızlandırılacak.
NVIDIA, Blackwell yongalarının ne kadara mal olacağını açıklamadı. Öte yandan, H100 yongaları şu anda yonga başına 25.000 ila 40.000 dolar arasında fiyata sahip ve bu yongalarla desteklenen tüm sistemlerin maliyeti 200.000 dolara kadar çıkabiliyor. Yüksek maliyetlerine rağmen NVIDIA çiplerinin yoğun talep gördüğünü hatırlatalım.