Обновление семейств Nemotron: Новый уровень ризонинга от NVIDIA

В мир машинного обучения и ИИ вновь ворвалась новость, от которой захватывает дух — NVIDIA представила обновления для своего обширного семейства моделей Nemotron. Мы получили сразу три значимые новинки, которые поднимают планку в разработке сложных интеллектов. Давайте подробнее рассмотрим эти достижения.

Новые модели Nemotron

NVIDIA представила две новые модели и один датасет в рамках обновления:

  • Модель Llama-3.3-Nemotron-Super-49B-v1
  • Модель Llama-3.1-Nemotron-Nano-8B-v1
  • Датасет Llama-Nemotron-Post-Training-Dataset-v1

Каждый из этих компонентов добавляет уникальную ценность и функциональность, способны решать различные задачи и подходить широкой аудитории разработчиков и исследователей.

Llama-3.3-Nemotron-Super-49B-v1: Флагман нового поколения

Модель Llama-3.3-Nemotron-Super-49B-v1 — это не просто новый выпуск, а настоящая революция в мире мультиязычных моделей. Созданная на базе Llama-3.3-70B-Instruct, она оптимизирована для ризонинга, чат-взаимодействий и RAG-систем. Контекстное окно в 128 тыс. токенов добавляет ей гибкости в обработке данных. Поистине впечатляюще, что использованы нестандартные архитектурные подходы, включая замены слоев внимания линейными преобразованиями.

Особая гордость разработчиков — это применение Neural Architecture Search (NAS), что позволяет существенно снизить вычислительные затраты без потери качества. Этот подход имеет огромное значение для использования модели в реальных продуктах.

Замечательные результаты, которые продемонстрировала эта модель, включают 96,6% pass@1 на MATH500 и 58,4% на AIME25. Эти показатели не оставляют сомнений в том, что данная модель может стать отличным инструментом для множественных приложений, от чат-ботов до более сложных систем ИИ.

Llama-3.1-Nemotron-Nano-8B-v1: Эффективность в компактном формате

Следующая модель — Llama-3.1-Nemotron-Nano-8B-v1 — это более легкое решение с восьмью миллиардами параметров. Она представляет собой компромисс между точностью и производительностью, что делает ее идеальной для работы на одном GPU RTX. Несмотря на свои размеры, Nano-8B в состоянии поддерживать длину контекста до 128 тыс. токенов и улучшает точность по сравнению с базовой Llama 3.1. Это — весомое преимущество для разработчиков, которым необходима мощная модель с минимальными затратами по ресурсам.

Llama-Nemotron-Post-Training-Dataset-v1: Новый источник знаний

Вместе с моделями NVIDIA также представила набор данных Llama-Nemotron-Post-Training-Dataset-v1. Это обширная коллекция, состоящая из 15,2 миллиона строк, которая объединяет данные SFT и RL для улучшения математических и кодовых рассуждений, а также повышения выполнения инструкций оригинальной модели Llama. Такой богатый набор данных — это то, что действительно может применяться для обучения и дальнейшего развития будущих моделей.

Лицензирование и доступность

Каждая из новых моделей и датасетов доступна под лицензией NVIDIA Open Model License, что подчеркивает стремление компании к открытости и доступности их технологий.

Обновления в семействе Nemotron усиливают позиции NVIDIA как одного из ведущих игроков в области ИИ и машинного обучения. Доступ к мощным моделям через API и веб-демо на NVIDIA Build лишь подчеркивает готовность компании делиться своим опытом и возможностями с разработчиками. Все эти изменения создают впечатляющую экосистему, позволяя исследователям и разработчикам использовать самые современные технологии.

Если вы интересуетесь машинным обучением и ИИ, сейчас самое время подключиться к этим инструментам и открывать новые горизонты в области технологий!

Обновление Nemotron: Новые модели и данными для ризонинга ver 0
Обновление Nemotron: Новые модели и данными для ризонинга ver 0
Ширина: 937 px
Высота: 457 px
Соотношение сторон.: 937:457

Скачать
Обновление Nemotron: Новые модели и данными для ризонинга ver 1
Обновление Nemotron: Новые модели и данными для ризонинга ver 1
Ширина: 1999 px
Высота: 1204 px
Соотношение сторон.: 1999:1204

Скачать
Обновление Nemotron: Новые модели и данными для ризонинга ver 2
Обновление Nemotron: Новые модели и данными для ризонинга ver 2
Ширина: 1999 px
Высота: 1125 px
Соотношение сторон.: 1999:1125

Скачать
Обновление Nemotron: Новые модели и данными для ризонинга ver 3
Обновление Nemotron: Новые модели и данными для ризонинга ver 3
Ширина: 1361 px
Высота: 857 px
Соотношение сторон.: 1361:857

Скачать


Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться

Интуитивная физика – это как здоровый глупец, который смотрит за игрой в шары и думает, что всё понимает. JEPA, как умный детектив, помогает искусственному интеллекту раскрывать секреты физики, анализируя миллионы видео. Исследование показывает, что через самообучение на реальных кадрах AI начинает понимать законы движения и взаимо... Читать далее