Jim Keller liderliğindeki çip şirketi Tenstorrent, yapay zeka iş yükleri için yeni nesil Wormhole işlemcisini piyasaya sürdü ve bu işlemcinin uygun fiyata iyi performans sunmasını bekliyor.Şirket şu anda bir veya iki Wormhole işlemciyi destekleyebilen iki ek PCIe kartının yanı sıra yazılım geliştiriciler için TT-LoudBox ve TT-QuietBox iş istasyonları sunmaktadır. Bugünkü duyuruların tamamı, Wormhole kartlarını ticari iş yükleri için kullananlar değil, geliştiriciler hedeflenmektedir.
Tenstorrent CEO'su Jim Keller, "Ürünlerimizin daha fazlasını geliştiricilerin eline ulaştırmak her zaman memnuniyet verici. Wormhole™ kartlarımızı kullanan sürüm geliştirme sistemleri, geliştiricilerin ölçeklendirme yapmasına ve çok çipli yapay zeka yazılımları geliştirmesine yardımcı olabilir" dedi.Bu lansmanın yanı sıra, ikinci nesil ürünümüz Blackhole'un üretim aşamasında ve devreye alınmasında kaydettiğimiz ilerlemeyi görmekten de heyecan duyuyoruz."
Her bir Wormhole işlemcisi, 72 adet Tensix çekirdeği (bunlardan beşi çeşitli veri formatlarında RISC-V çekirdeklerini destekler) ve 108 MB SRAM içerir ve 1 GHz'de 262 FP8 TFLOPS performans sunar; termal tasarım gücü ise 160W'tır. Tek çipli Wormhole n150 kartı, 12 GB GDDR6 video belleği ile donatılmıştır ve 288 GB/s bant genişliğine sahiptir.
Wormhole işlemcileri, iş yüklerinin çeşitli ihtiyaçlarını karşılamak için esnek ölçeklenebilirlik sağlar. Dört Wormhole n300 kartına sahip standart bir iş istasyonu kurulumunda, işlemciler yazılımda birleşik, geniş bir Tensix çekirdek ağı olarak görünen tek bir ünite halinde birleştirilebilir. Bu yapılandırma, hızlandırıcının aynı iş yükünü dört geliştirici arasında bölüştürmesine veya aynı anda sekiz farklı yapay zeka modelini çalıştırmasına olanak tanır. Bu ölçeklenebilirliğin önemli bir özelliği, sanallaştırmaya gerek kalmadan yerel olarak çalışabilmesidir. Bir veri merkezi ortamında, Wormhole işlemcileri makine içinde genişleme için PCIe veya harici genişleme için Ethernet kullanacaktır.
Performans açısından, Tenstorrent'in tek çipli Wormhole n150 kartı (72 Tensix çekirdeği, 1 GHz frekans, 108 MB SRAM, 12 GB GDDR6, 288 GB/s bant genişliği) 160W'ta 262 FP8 TFLOPS'a ulaşırken, çift çipli Wormhole n300 kartı (128 Tensix çekirdeği, 1 GHz frekans, 192 MB SRAM, toplam 24 GB GDDR6, 576 GB/s bant genişliği) 300W'ta 466 FP8 TFLOPS'a kadar performans sunuyor.
300W'lık 466 FP8 TFLOPS'luk performansı daha iyi anlamak için, yapay zeka pazar lideri Nvidia'nın bu termal tasarım gücünde sunduklarıyla karşılaştıralım. Nvidia'nın A100'ü FP8'i desteklemiyor, ancak INT8'i destekliyor ve 624 TOPS'luk (seyrek bellekte 1.248 TOPS) tepe performansına ulaşıyor. Buna karşılık, Nvidia'nın H100'ü FP8'i destekliyor ve 300W'da 1.670 TFLOPS'luk (seyrek bellekte 3.341 TFLOPS) tepe performansına ulaşıyor; bu da Tenstorrent'in Wormhole n300'ünden önemli ölçüde farklı.
Ancak, büyük bir sorun var. Tenstorrent'in Wormhole n150 işlemcisi 999 dolara, n300 ise 1.399 dolara satılıyor. Karşılaştırma yapmak gerekirse, tek bir Nvidia H100 grafik kartının fiyatı, miktara bağlı olarak 30.000 dolara kadar çıkabiliyor. Elbette, dört veya sekiz Wormhole işlemcisinin tek bir H300'ün performansını gerçekten sağlayıp sağlayamayacağını bilmiyoruz, ancak TDP değerleri sırasıyla 600W ve 1200W.
Ekran kartlarına ek olarak, Tenstorrent geliştiriciler için önceden oluşturulmuş iş istasyonları da sunmaktadır. Bunlar arasında, aktif soğutmalı daha uygun fiyatlı Xeon tabanlı TT-LoudBox'ta 4 adet n300 kartı ve EPYC tabanlı Xiaolong sıvı soğutma fonksiyonlu gelişmiş TT-QuietBox bulunmaktadır.
Yayın tarihi: 29 Temmuz 2024
