Технологии12.09.2023 в 14:42ПрослушатьОстановить
NVIDIA не собирается никому отдавать лидерство в сегменте искусственного интеллекта, постоянно предлагая как новые ускорители, или модернизированные версии существующих, так и работая над программной оболочкой, предлагающей дополнительные оптимизации и прирост производительности.
Компания заявила о разработке программного обеспечения с открытым исходным кодом TensorRT-LLM, предназначенного для повышения производительности при работе с большими языковыми моделями, такими как GPT-J. Оно работает за счет инновационной технологии пакетной обработки данных на лету, оптимизируя планирование динамических и разнообразных рабочих нагрузок, максимально задействуя возможности графического процессора.
Внутренние тесты TensorRT-LLM показали 2-кратный прирост производительности ускорителя H100, а также 8-кратный прирост по сравнению с ускорителем прошлого поколения A100. Этот прирост применим к рабочей нагрузке GPT-J с применением 6 миллиардов параметров. Помимо этого, отмечается существенное улучшение энергосбережения.
«TensorRT-LLM прост в использовании, обладает множеством функций, включая потоковую передачу токенов, пакетную обработку в реальном времени, страничное внимание, квантование и многое другое. Он обеспечивает высокую производительность для LLM с использованием графических процессоров NVIDIA и позволяет нам экономить средства для наших клиентов», – Навин Рао (Naveen Rao), вице-президент по разработкам в Databricks.
Источник: i2HARD
ТехнологииСегодня в 11:14Читать новость
ТехнологииСегодня в 10:28Читать новость
ТехнологииВчера в 17:14Читать новость
ТехнологииВчера в 15:14Читать новость
ТехнологииВчера в 13:14Читать новость
ТехнологииВчера в 10:14Читать новость
Технологии25.09.2023 в 20:14Читать новость
Технологии25.09.2023 в 18:14Читать новость
Технологии25.09.2023 в 16:14Читать новость
Технологии25.09.2023 в 14:14Читать новость
Технологии25.09.2023 в 12:14Читать новость
Технологии24.09.2023 в 14:14Читать новость
Технологии24.09.2023 в 12:14Читать новость
Технологии24.09.2023 в 10:14Читать новость
Технологии23.09.2023 в 19:14Читать новость
Технологии23.09.2023 в 17:42Читать новость
Технологии23.09.2023 в 16:14Читать новость
Технологии23.09.2023 в 14:56Читать новость
Технологии23.09.2023 в 13:28Читать новость
Технологии23.09.2023 в 11:42Читать новость