1. MN NEWS
  2. Технологии
  3. NVIDIA удалось вдвое повысить производительность H100 за счет применения TensorRT-LLM

MN NEWSТехнологииNVIDIA удалось вдвое повысить производительность H100 за счет применения TensorRT-LLM

NVIDIA удалось вдвое повысить производительность H100 за счет применения TensorRT-LLM

Технологии12.09.2023 в 14:42ПрослушатьОстановить

NVIDIA не собирается никому отдавать лидерство в сегменте искусственного интеллекта, постоянно предлагая как новые ускорители, или модернизированные версии существующих, так и работая над программной оболочкой, предлагающей дополнительные оптимизации и прирост производительности.

Компания заявила о разработке программного обеспечения с открытым исходным кодом TensorRT-LLM, предназначенного для повышения производительности при работе с большими языковыми моделями, такими как GPT-J. Оно работает за счет инновационной технологии пакетной обработки данных на лету, оптимизируя планирование динамических и разнообразных рабочих нагрузок, максимально задействуя возможности графического процессора.

Внутренние тесты TensorRT-LLM показали 2-кратный прирост производительности ускорителя H100, а также 8-кратный прирост по сравнению с ускорителем прошлого поколения A100. Этот прирост применим к рабочей нагрузке GPT-J с применением 6 миллиардов параметров. Помимо этого, отмечается существенное улучшение энергосбережения.

«TensorRT-LLM прост в использовании, обладает множеством функций, включая потоковую передачу токенов, пакетную обработку в реальном времени, страничное внимание, квантование и многое другое. Он обеспечивает высокую производительность для LLM с использованием графических процессоров NVIDIA и позволяет нам экономить средства для наших клиентов», – Навин Рао (Naveen Rao), вице-президент по разработкам в Databricks.

Источник: i2HARD

Поделиться

Читайте также:

Райан Шраут уходит из Intel

ТехнологииСегодня в 11:14Читать новость

Обновление CPU-Z раскрыло представителей AMD Threadripper PRO 7000WX

ТехнологииСегодня в 10:28Читать новость

Samsung анонсировала новый тип памяти LPCAMM LPDDR5X

ТехнологииВчера в 17:14Читать новость

Intel Core Ultra 7 165H вновь протестирован в Geekbench

ТехнологииВчера в 15:14Читать новость

NVIDIA прогнозирует полный нейронный рендеринг с появлением условной DLSS 10

ТехнологииВчера в 13:14Читать новость

Скотт Херкельман уходит из AMD

ТехнологииВчера в 10:14Читать новость

Мини-ПК ACEMAGIC S1 получил процессор Intel N95 и дисплей на передней панели

Технологии25.09.2023 в 20:14Читать новость

Разъем 12V-2x6 подвергся стресс-тесту: перегрев отсутствует даже при плохом контакте

Технологии25.09.2023 в 18:14Читать новость

Представитель Intel подтвердил выход настольных процессоров серии Meteor Lake-S

Технологии25.09.2023 в 16:14Читать новость

TSMC увеличит производственные мощности упаковки CoWoS еще на 30% к концу года

Технологии25.09.2023 в 14:14Читать новость

Intel показала работающий ПК с Raptor Lake Refresh

Технологии25.09.2023 в 12:14Читать новость

Meteor Lake и Arrow Lake, вероятно, имеют одинаковый нейронный процессор

Технологии24.09.2023 в 14:14Читать новость

Накопитель Seagate FireCuda 520N подойдет для установки в портативные консоли

Технологии24.09.2023 в 12:14Читать новость

iGPU Intel Meteor Lake получит конфигурации из 4 и 8 ядер Xe

Технологии24.09.2023 в 10:14Читать новость

Суд оштрафовал Intel на $400 млн за дело 20-летней давности

Технологии23.09.2023 в 19:14Читать новость

Valve не собирается обновлять портативную консоль Steam Deck еще «пару лет»

Технологии23.09.2023 в 17:42Читать новость

Intel Core i9-14900KF стал самым быстрым однопоточным процессором в PassMark

Технологии23.09.2023 в 16:14Читать новость

Модули TEAMGROUP T-CREATE MASTER DDR5 OC RDIMM способны достигать 6800 MT/s

Технологии23.09.2023 в 14:56Читать новость

Intel Xeon Platinum 8580 поколения Emerald Rapids получит 420 Мбайт кэша

Технологии23.09.2023 в 13:28Читать новость

Разработчик Unity изменил политику монетизации в лучшую для создателей сторону

Технологии23.09.2023 в 11:42Читать новость