справа банер

Навіны галіны: Джым Келлер выпусціў новы чып RISC-V

Навіны галіны: Джым Келлер выпусціў новы чып RISC-V

Чып-кампанія Tenstorrent пад кіраўніцтвам Джыма Келера выпусціла свой працэсар Wormhole наступнага пакалення для працоўных нагрузак штучнага інтэлекту, які, як чакаецца, прапануе добрую прадукцыйнасць па даступнай цане.У цяперашні час кампанія прапануе дзве дадатковыя карты PCIe, якія могуць змясціць адзін або два працэсара Wormhole, а таксама працоўныя станцыі TT-LoudBox і TT-QuietBox для распрацоўшчыкаў праграмнага забеспячэння. Усе сённяшнія аб'явы накіраваны на распрацоўшчыкаў, а не на тых, хто выкарыстоўвае платы Wormhole для камерцыйных працоўных нагрузак.

«Заўсёды прыемна атрымліваць больш нашых прадуктаў у рукі распрацоўшчыкаў. Сістэмы распрацоўкі рэлізаў з выкарыстаннем нашых карт Wormhole™ могуць дапамагчы распрацоўшчыкам маштабаваць і распрацоўваць шматчыпавае праграмнае забеспячэнне штучнага інтэлекту», — сказаў Джым Келер, генеральны дырэктар Tenstorrent.У дадатак да гэтага запуску, мы рады бачыць прагрэс, які мы робім з запісам і ўключэннем нашага прадукту другога пакалення Blackhole».

1

Кожны працэсар Wormhole змяшчае 72 ядра Tensix (пяць з якіх падтрымліваюць ядра RISC-V у розных фарматах дадзеных) і 108 МБ SRAM, забяспечваючы 262 FP8 TFLOPS на частаце 1 ГГц з цеплавой магутнасцю 160 Вт. Адначыпавая карта Wormhole n150 абсталявана 12 ГБ відэапамяці GDDR6 і мае прапускную здольнасць 288 ГБ/с.

Працэсары Wormhole забяспечваюць гнуткую маштабаванасць для задавальнення разнастайных патрэб працоўных нагрузак. У стандартнай наладзе працоўнай станцыі з чатырма картамі Wormhole n300 працэсары могуць быць аб'яднаны ў адзіны блок, які адлюстроўваецца ў праграмным забеспячэнні як аб'яднаная шырокая базавая сетка Tensix. Гэтая канфігурацыя дазваляе паскаральніку апрацоўваць аднолькавую нагрузку, размяркоўваць яе паміж чатырма распрацоўшчыкамі або адначасова запускаць да васьмі розных мадэляў штучнага інтэлекту. Ключавой асаблівасцю гэтай маштабаванасці з'яўляецца тое, што яна можа працаваць лакальна без неабходнасці віртуалізацыі. У асяроддзі цэнтра апрацоўкі дадзеных працэсары Wormhole будуць выкарыстоўваць PCIe для пашырэння ўнутры машыны або Ethernet для вонкавага пашырэння.

Што тычыцца прадукцыйнасці, адначыпавая карта Tenstorrent Wormhole n150 (72 ядра Tensix, частата 1 ГГц, 108 МБ SRAM, 12 ГБ GDDR6, прапускная здольнасць 288 ГБ/с) дасягнула 262 FP8 TFLOPS пры 160 Вт, у той час як двухчыпавая плата Wormhole n300 (128 ядраў Tensix, частата 1 ГГц, 192 МБ SRAM, сукупная 24 ГБ GDDR6, прапускная здольнасць 576 ГБ/с) забяспечвае да 466 FP8 TFLOPS пры 300 Вт.

Каб змясціць 300 Вт з 466 FP8 TFLOPS у кантэкст, мы параўнаем гэта з тым, што прапануе лідар рынку штучнага інтэлекту Nvidia пры такой цеплавой магутнасці. A100 ад Nvidia не падтрымлівае FP8, але падтрымлівае INT8 з максімальнай прадукцыйнасцю 624 TOPS (1248 TOPS пры рэдкім разрэзе). Для параўнання, H100 ад Nvidia падтрымлівае FP8 і дасягае максімальнай прадукцыйнасці ў 1670 TFLOPS пры 300 Вт (3341 TFLOPS пры рэдкім спажыванні), што значна адрозніваецца ад Wormhole n300 ад Tenstorrent.

Аднак ёсць адна істотная праблема. Wormhole n150 ад Tenstorrent прадаецца за 999 долараў, у той час як n300 прадаецца за 1399 долараў. Для параўнання, адна відэакарта Nvidia H100 прадаецца за 30 000 долараў у залежнасці ад колькасці. Вядома, мы не ведаем, ці сапраўды чатыры ці восем працэсараў Wormhole могуць забяспечыць прадукцыйнасць аднаго H300, але іх TDP складае 600 Вт і 1200 Вт адпаведна.

У дадатак да карт Tenstorrent прапануе гатовыя працоўныя станцыі для распрацоўшчыкаў, у тым ліку 4 карты n300 у больш даступным TT-LoudBox на базе Xeon з актыўным астуджэннем і ўдасканаленым TT-QuietBox з функцыяй вадкаснага астуджэння Xiaolong на базе EPYC).


Час публікацыі: 29 ліпеня 2024 г