Кампанія-распрацоўшчык чыпаў Tenstorrent пад кіраўніцтвам Джыма Келера выпусціла свой працэсар Wormhole наступнага пакалення для задач штучнага інтэлекту, які, як чакаецца, забяспечыць добрую прадукцыйнасць па даступнай цане.У цяперашні час кампанія прапануе дзве дадатковыя карты PCIe, якія могуць змясціць адзін ці два працэсары Wormhole, а таксама рабочыя станцыі TT-LoudBox і TT-QuietBox для распрацоўшчыкаў праграмнага забеспячэння. Усе сённяшнія аб'явы прызначаны для распрацоўшчыкаў, а не для тых, хто выкарыстоўвае платы Wormhole для камерцыйных задач.
«Заўсёды прыемна атрымліваць усё больш нашых прадуктаў у рукі распрацоўшчыкаў. Сістэмы распрацоўкі рэлізаў з выкарыстаннем нашых карт Wormhole™ могуць дапамагчы распрацоўшчыкам маштабаваць і распрацоўваць праграмнае забеспячэнне для шматчыпавага штучнага інтэлекту», — сказаў Джым Келер, генеральны дырэктар Tenstorrent.Акрамя гэтага запуску, мы рады бачыць прагрэс, якога мы дасягаем у разгортванні і запуску нашага прадукту другога пакалення пад назвай Blackhole.

Кожны працэсар Wormhole змяшчае 72 ядра Tensix (пяць з якіх падтрымліваюць ядра RISC-V у розных фарматах дадзеных) і 108 МБ аператыўнай памяці SRAM, што забяспечвае прадукцыйнасць 262 FP8 TFLOPS на частаце 1 ГГц з цеплавой магутнасцю 160 Вт. Адначыпавая карта Wormhole n150 абсталявана 12 ГБ відэапамяці GDDR6 і мае прапускную здольнасць 288 ГБ/с.
Працэсары Wormhole забяспечваюць гнуткую маштабаванасць для задавальнення разнастайных патрэб працоўных нагрузак. У стандартнай канфігурацыі працоўнай станцыі з чатырма картамі Wormhole n300 працэсары можна аб'яднаць у адзін блок, які ў праграмным забеспячэнні адлюстроўваецца як адзіная шырокая сетка ядра Tensix. Такая канфігурацыя дазваляе паскаральніку апрацоўваць тую ж нагрузку, падзяліць яе паміж чатырма распрацоўшчыкамі або адначасова запускаць да васьмі розных мадэляў штучнага інтэлекту. Ключавой асаблівасцю гэтай маштабаванасці з'яўляецца тое, што ён можа працаваць лакальна без неабходнасці віртуалізацыі. У асяроддзі цэнтра апрацоўкі дадзеных працэсары Wormhole будуць выкарыстоўваць PCIe для пашырэння ўнутры машыны або Ethernet для знешняга пашырэння.
Што тычыцца прадукцыйнасці, аднакрыштавая плата Tenstorrent Wormhole n150 (72 ядра Tensix, частата 1 ГГц, 108 МБ SRAM, 12 ГБ GDDR6, прапускная здольнасць 288 ГБ/с) дасягнула 262 FP8 TFLOPS пры спажыванні энергіі 160 Вт, у той час як двухчыпавая плата Wormhole n300 (128 ядраў Tensix, частата 1 ГГц, 192 МБ SRAM, агрэгаваная 24 ГБ GDDR6, прапускная здольнасць 576 ГБ/с) забяспечвае да 466 FP8 TFLOPS пры спажыванні энергіі 300 Вт.
Каб зразумець кантэкст 300 Вт з прадукцыйнасцю 466 FP8 TFLOPS, параўнаем яе з тым, што прапануе лідэр рынку штучнага інтэлекту Nvidia пры такой цеплавой магутнасці. Nvidia A100 не падтрымлівае FP8, але падтрымлівае INT8 з пікавай прадукцыйнасцю 624 TOPS (1248 TOPS пры разрэджаным рэжыме). Для параўнання, Nvidia H100 падтрымлівае FP8 і дасягае пікавай прадукцыйнасці 1670 TFLOPS пры 300 Вт (3341 TFLOPS пры разрэджаным рэжыме), што значна адрозніваецца ад Wormhole n300 ад Tenstorrent.
Аднак ёсць адна сур'ёзная праблема. Wormhole n150 ад Tenstorrent прадаецца за 999 долараў, а n300 — за 1399 долараў. Для параўнання, адна відэакарта Nvidia H100 каштуе 30 000 долараў у залежнасці ад колькасці. Вядома, мы не ведаем, ці могуць чатыры ці восем працэсараў Wormhole забяспечыць прадукцыйнасць аднаго H300, але іх TDP складае 600 Вт і 1200 Вт адпаведна.
Акрамя відэакарт, Tenstorrent прапануе распрацоўшчыкам гатовыя рабочыя станцыі, у тым ліку 4 відэакарты n300 у больш даступнай мадэлі TT-LoudBox на базе Xeon з актыўным астуджэннем і ўдасканаленай мадэлі TT-QuietBox з функцыяй вадкаснага астуджэння Xiaolong на базе EPYC.
Час публікацыі: 29 ліпеня 2024 г.