Складзе

Навіны галіны: Джым Келлер запусціў новы чып RISC-V

Навіны галіны: Джым Келлер запусціў новы чып RISC-V

Chip Chip Chip Chip Company Tenstorrent выпусціў свой працэсар чарвяточнага адтуліны наступнага пакалення для нагрузкі AI, што, як чакаецца, прапануе добрую прадукцыйнасць па даступнай цане.У цяперашні час кампанія прапануе дзве дадатковыя карты PCIE, якія могуць змясціць адзін-два працэсары з чарвяточных адтулін, а таксама TT-Loudbox і TT-Quietbox Workstations для распрацоўшчыкаў праграмнага забеспячэння. Усе сённяшнія анонсы накіраваны на распрацоўшчыкаў, а не на тых, хто выкарыстоўвае саветы з чарвяточных адтулін для камерцыйных нагрузак.

"Заўсёды прыемна атрымаць больш нашай прадукцыі ў рукі распрацоўшчыкаў. Выпусціце сістэмы распрацоўкі з выкарыстаннем нашых карт Wormhole ™ могуць дапамагчы распрацоўшчыкам маштабу і распрацаваць праграмнае забеспячэнне для AI Multi-Chip",-сказаў Джым Келлер, генеральны дырэктар Tenstorrent.У дадатак да гэтага запуску, мы рады бачыць прагрэс, які мы робім з дапамогай стужкі і харчавання нашага прадукту другога пакалення "Blackhole".

1

Кожны працэсар з чарвяковай свідравіны змяшчае 72 ядра Tensix (пяць з якіх падтрымліваюць ядра RISC-V у розных фарматах дадзеных) і 108 Мб SRAM, забяспечваючы 262 FP8 TFLOPS пры 1 ГГц з магутнасці цеплавой канструкцыі 160 Вт. Карта з адной чыпам Wormhole N150 абсталявана 12 ГБ відэапарыятам GDDR6 і мае прапускную здольнасць 288 ГБ/с.

Працэсары чарвякоў забяспечваюць гнуткую маштабаванасць для задавальнення розных патрэбаў нагрузкі. У стандартнай наладзе працоўнай станцыі з чатырма карткамі Wormhole N300, працэсары могуць быць аб'яднаны ў адзін блок, які з'яўляецца ў праграмным забеспячэнні як адзіная, шырокая сетка Tensix Core. Гэтая канфігурацыя дазваляе паскаральніку апрацоўваць аднолькавую нагрузку, падзяліць паміж чатырма распрацоўшчыкамі альбо адначасова праходзіць да васьмі розных мадэляў AI. Ключавая асаблівасць гэтай маштабаванасці заключаецца ў тым, што яна можа працаваць лакальна без неабходнасці віртуалізацыі. У асяроддзі цэнтраў апрацоўкі дадзеных Wormhole Processors будзе выкарыстоўваць PCIE для пашырэння ўнутры машыны або Ethernet для знешняга пашырэння.

In terms of performance, Tenstorrent's single-chip Wormhole n150 card (72 Tensix cores, 1 GHz frequency, 108 MB SRAM, 12 GB GDDR6, 288 GB/s bandwidth) achieved 262 FP8 TFLOPS at 160W, while the dual-chip Wormhole n300 board (128 Tensix cores, 1 GHz frequency, 192 MB SRAM, Агульны 24 ГБ GDDR6, 576 ГБ/с прапускная здольнасць) забяспечвае да 466 FP8 TFLOPS пры 300 Вт.

Каб паставіць 300 Вт з 466 FP8 TFLOPS у кантэкст, мы будзем параўноўваць яго з тым, што лідэр рынку AI NVIDIA прапануе пры гэтай цеплавой праектнай магутнасці. A100 NVIDIA не падтрымлівае FP8, але ён падтрымлівае INT8, з пікавай прадукцыйнасцю 624 вяршыні (1248 верхавін, калі рэдкія). Для параўнання, H100 NVIDIA падтрымлівае FP8 і дасягае пікавай прадукцыйнасці 1670 TFLOPS пры 300 Вт (3341 TFLOPS на рэдкім), што значна адрозніваецца ад чарвятовай N300 TENSTORRENT.

Аднак ёсць адна асноўная праблема. Wormhole N150 Tenstorrent прадаецца за 999 долараў, а N300 прадае за 1399 долараў. Для параўнання, адзіная відэакарта NVIDIA H100 прадаецца за 30 000 долараў, у залежнасці ад колькасці. Вядома, мы не ведаем, ці могуць чатыры ці восем працэсараў чарвяковых адтулін на самай справе забяспечыць прадукцыйнасць адзінага H300, але іх TDPS складаюць 600 Вт і 1200 Вт адпаведна.

У дадатак да карт, Tenstorrent прапануе загадзя пабудаваныя працоўныя станцыі для распрацоўшчыкаў, у тым ліку 4 N300 карт у больш даступнай функцыі TT-Loudbox на базе Xeon з актыўным астуджэннем і прасунутай функцыяй астуджэння TT-Quietbox з Epyc на аснове EPYC).


Час паведамлення: ліпень-29-2024