Alibaba Разработала Революционную ИИ-Модель для Анализа Эмоций

Собственно, я не шокирован тем, что Alibaba снова в игре. Их свежая ИИ-модель R1-Omni наделала шума в среде, так как теперь она способна отслеживать эмоции людей на видео. Да-да, вы не ослышались! И речь идёт не только о том, чтобы определить, весел ли человек или, наоборот, злится. Эта система может также анализировать то, как одет человек и в каком окружении он находится. Поверьте, это действительно важный шаг вперёд в области компьютерного зрения, и говорить об этом можно долго.

Эта новая модель является улучшенной версией предыдущей HumanOmni, и как минимум по словам разработчиков из лаборатории Tongyi, они не собираются останавливаться на достигнутом. Хотя пока R1-Omni ограничена базовыми эмоциональными оценками, её способность распознавать визуальные подсказки делает её очень интересным инструментом, который мог бы кардинально изменить то, как мы воспринимаем видео и эмоциональное поведение. И, о, чудо, новинка доступна на Hugging Face — как приятно видеть, когда такие технологии становятся открытыми!

CSM 1B от Sesame: Видео, Говорящее Вашим Языком!

Приветствуем CSM 1B от Sesame — этому зомби из мира моделей для генерации речи, который готов судорожно вилять текстами и аудио! Эта модель, основанная на архитектуре Llama, не просто переводит текст в речь, но ещё и делает это с помощью RVQ аудиокодов. Если вы считаете, что получили хороший уровень генерации речи, взгляните на эту новинку — она определенно захватывает внимание и создает своего рода новый стандарт в этой области. Почему? Да потому что компактный аудио-декодер, использующий Mimi аудиокоды, обеспечивает отличное качество звука. Так что метайте себе в копилку на этот вариант!

Google Открывает Двери к Новым ИИ-Мощностям

А вот и Google, снова в игре! Они выпустили обновленную версию своей ризонинг-модели Flash Thinking 2.0. Зачем? Чтобы вы,простые смертные, имели доступ к инструменту Deep Research. С учётом того, насколько быстро эта новая итерация обрабатывает данные, вы сможете загружать файлы и анализировать информацию с множества сайтов и документов всего за считанные минуты. Это как раз то, что необходимо для слепого бега в мире информации! Предлагаю всем, кто еще не попробовал это, не терять времени.

Marey: ИИ, Который Знает, Что Такое Этические Данные

У Moonvalley появился свой козырь в игре — это Marey, первая ИИ-модель для видео, созданная на основе лицензированных данных. Это звучит как самый настоящий шаг в натуральный подход к созданию контента в киноиндустрии. Представляете, как здорово будет иметь возможность работать с такой моделью, как с виртуальной съёмочной группой? Технология, о которой мы мечтали долгие годы.

Изначально, это не просто решение юридических вопросов, — это попытка сохранить права авторов и улучшить процесс производства. Как считает CEO Asteria Брин Мозер, такие инициативы помогут сохранить творческую свободу, чего, если честно, в индустрии не хватает.

Транзистор на Основе Висмута: Долой Кремний!

Пекинский университет сделал одно из тех открытий, которые могут изменить правила игры в полупроводниках. Новый транзистор на основе висмута оказался на 40% быстрее и на 10% энергоэффективнее, чем разработки Intel и TSMC. Как будто на планете недостаточно невидимых нам технологий, они смотрят в будущее и говорят: «Кремний? Серьезно?».

Open-Sora 2.0: Удобный Инструмент для Генерации Видео

Luchen Technology выпустила Open-Sora 2.0 — новую версию для создания видео, и, кажется, они сделали это не только с изяществом, но и за крошечный бюджет в $200,000. Она способна создавать видео с разрешением до 720p и с контролируемым движением объектов. Это как прилив новых возможностей для творческих людей, которые хотят использовать ИИ, не вклады

Alibaba запустила ИИ для анализа эмоций на видео ver 0
Alibaba запустила ИИ для анализа эмоций на видео ver 0
Ширина: 1024 px
Высота: 768 px
Соотношение сторон.: 4:3

Скачать


Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться

Премия CDO/CDTO Awards 2025 в Москве – это не просто событие, а настоящая магия цифр и данных! Лучшие умы в сфере Data Science собрались, чтобы отпраздновать достижения, которые помогут диву дать даже самим скептикам. Мероприятие стало ареной для обмена идеями и вдохновения, а столица России вновь подтвердила, что здесь рождаются н... Читать далее
Анна
Первый день конференции ICLR 2025 стал настоящим прорывом в области искусственного интеллекта. Делегация Яндекса с интересом следила за представленными исследованиями и инновациями. Среди ключевых достижений – улучшение алгоритмов обучения, новые подходы к обработке естественного языка и значительные шаги в области этики AI. Конфер... Читать далее
Muon — это новый оптимизатор, который становится настоящим спасением для гроккинга. Сложные научные концепции, представленные Амундом Твеитом и его командой, обещают ускорить обучение моделей до неузнаваемости. Гроккинг — это не просто очередное модное слово, это прорыв, который поднимет машинное обучение на новый уровень. Если вы... Читать далее
Анна
На международной конференции ICLR 2025 были представлены работы, которые выделяются своим вкладом в область глубокого обучения. Эти исследования не только демонстрируют передовые идеи, но и открывают новые горизонты для применения нейронных сетей. Обладатели премии за выдающиеся статьи исследуют актуальные проблемы и предлагают инн... Читать далее
Эффективность подхода Coconut в решении математических и логических задач — это как найти золотую рыбку в океане неопределенности! Представьте себе: вместо того, чтобы биться головой об стену, вы бросаете кокос и ждете, пока он вернется с правильным ответом. Этот способ позволяет моделям не только быстро генерировать решения, но и... Читать далее