Обновление семейств Nemotron: Новый уровень ризонинга от NVIDIA
В мир машинного обучения и ИИ вновь ворвалась новость, от которой захватывает дух — NVIDIA представила обновления для своего обширного семейства моделей Nemotron. Мы получили сразу три значимые новинки, которые поднимают планку в разработке сложных интеллектов. Давайте подробнее рассмотрим эти достижения.
Новые модели Nemotron
NVIDIA представила две новые модели и один датасет в рамках обновления:
- Модель Llama-3.3-Nemotron-Super-49B-v1
- Модель Llama-3.1-Nemotron-Nano-8B-v1
- Датасет Llama-Nemotron-Post-Training-Dataset-v1
Каждый из этих компонентов добавляет уникальную ценность и функциональность, способны решать различные задачи и подходить широкой аудитории разработчиков и исследователей.
Llama-3.3-Nemotron-Super-49B-v1: Флагман нового поколения
Модель Llama-3.3-Nemotron-Super-49B-v1 — это не просто новый выпуск, а настоящая революция в мире мультиязычных моделей. Созданная на базе Llama-3.3-70B-Instruct, она оптимизирована для ризонинга, чат-взаимодействий и RAG-систем. Контекстное окно в 128 тыс. токенов добавляет ей гибкости в обработке данных. Поистине впечатляюще, что использованы нестандартные архитектурные подходы, включая замены слоев внимания линейными преобразованиями.
Особая гордость разработчиков — это применение Neural Architecture Search (NAS), что позволяет существенно снизить вычислительные затраты без потери качества. Этот подход имеет огромное значение для использования модели в реальных продуктах.
Замечательные результаты, которые продемонстрировала эта модель, включают 96,6% pass@1 на MATH500 и 58,4% на AIME25. Эти показатели не оставляют сомнений в том, что данная модель может стать отличным инструментом для множественных приложений, от чат-ботов до более сложных систем ИИ.
Llama-3.1-Nemotron-Nano-8B-v1: Эффективность в компактном формате
Следующая модель — Llama-3.1-Nemotron-Nano-8B-v1 — это более легкое решение с восьмью миллиардами параметров. Она представляет собой компромисс между точностью и производительностью, что делает ее идеальной для работы на одном GPU RTX. Несмотря на свои размеры, Nano-8B в состоянии поддерживать длину контекста до 128 тыс. токенов и улучшает точность по сравнению с базовой Llama 3.1. Это — весомое преимущество для разработчиков, которым необходима мощная модель с минимальными затратами по ресурсам.
Llama-Nemotron-Post-Training-Dataset-v1: Новый источник знаний
Вместе с моделями NVIDIA также представила набор данных Llama-Nemotron-Post-Training-Dataset-v1. Это обширная коллекция, состоящая из 15,2 миллиона строк, которая объединяет данные SFT и RL для улучшения математических и кодовых рассуждений, а также повышения выполнения инструкций оригинальной модели Llama. Такой богатый набор данных — это то, что действительно может применяться для обучения и дальнейшего развития будущих моделей.
Лицензирование и доступность
Каждая из новых моделей и датасетов доступна под лицензией NVIDIA Open Model License, что подчеркивает стремление компании к открытости и доступности их технологий.
Обновления в семействе Nemotron усиливают позиции NVIDIA как одного из ведущих игроков в области ИИ и машинного обучения. Доступ к мощным моделям через API и веб-демо на NVIDIA Build лишь подчеркивает готовность компании делиться своим опытом и возможностями с разработчиками. Все эти изменения создают впечатляющую экосистему, позволяя исследователям и разработчикам использовать самые современные технологии.
Если вы интересуетесь машинным обучением и ИИ, сейчас самое время подключиться к этим инструментам и открывать новые горизонты в области технологий!

Обновление Nemotron: Новые модели и данными для ризонинга ver 0
Ширина: 937 px
Высота: 457 px
Соотношение сторон.: 937:457
Скачать

Обновление Nemotron: Новые модели и данными для ризонинга ver 1
Ширина: 1999 px
Высота: 1204 px
Соотношение сторон.: 1999:1204
Скачать

Обновление Nemotron: Новые модели и данными для ризонинга ver 2
Ширина: 1999 px
Высота: 1125 px
Соотношение сторон.: 1999:1125
Скачать

Обновление Nemotron: Новые модели и данными для ризонинга ver 3
Ширина: 1361 px
Высота: 857 px
Соотношение сторон.: 1361:857
Скачать
Вам также может понравиться






















