Alibaba Разработала Революционную ИИ-Модель для Анализа Эмоций
Собственно, я не шокирован тем, что Alibaba снова в игре. Их свежая ИИ-модель R1-Omni наделала шума в среде, так как теперь она способна отслеживать эмоции людей на видео. Да-да, вы не ослышались! И речь идёт не только о том, чтобы определить, весел ли человек или, наоборот, злится. Эта система может также анализировать то, как одет человек и в каком окружении он находится. Поверьте, это действительно важный шаг вперёд в области компьютерного зрения, и говорить об этом можно долго.
Эта новая модель является улучшенной версией предыдущей HumanOmni, и как минимум по словам разработчиков из лаборатории Tongyi, они не собираются останавливаться на достигнутом. Хотя пока R1-Omni ограничена базовыми эмоциональными оценками, её способность распознавать визуальные подсказки делает её очень интересным инструментом, который мог бы кардинально изменить то, как мы воспринимаем видео и эмоциональное поведение. И, о, чудо, новинка доступна на Hugging Face — как приятно видеть, когда такие технологии становятся открытыми!
CSM 1B от Sesame: Видео, Говорящее Вашим Языком!
Приветствуем CSM 1B от Sesame — этому зомби из мира моделей для генерации речи, который готов судорожно вилять текстами и аудио! Эта модель, основанная на архитектуре Llama, не просто переводит текст в речь, но ещё и делает это с помощью RVQ аудиокодов. Если вы считаете, что получили хороший уровень генерации речи, взгляните на эту новинку — она определенно захватывает внимание и создает своего рода новый стандарт в этой области. Почему? Да потому что компактный аудио-декодер, использующий Mimi аудиокоды, обеспечивает отличное качество звука. Так что метайте себе в копилку на этот вариант!
Google Открывает Двери к Новым ИИ-Мощностям
А вот и Google, снова в игре! Они выпустили обновленную версию своей ризонинг-модели Flash Thinking 2.0. Зачем? Чтобы вы,простые смертные, имели доступ к инструменту Deep Research. С учётом того, насколько быстро эта новая итерация обрабатывает данные, вы сможете загружать файлы и анализировать информацию с множества сайтов и документов всего за считанные минуты. Это как раз то, что необходимо для слепого бега в мире информации! Предлагаю всем, кто еще не попробовал это, не терять времени.
Marey: ИИ, Который Знает, Что Такое Этические Данные
У Moonvalley появился свой козырь в игре — это Marey, первая ИИ-модель для видео, созданная на основе лицензированных данных. Это звучит как самый настоящий шаг в натуральный подход к созданию контента в киноиндустрии. Представляете, как здорово будет иметь возможность работать с такой моделью, как с виртуальной съёмочной группой? Технология, о которой мы мечтали долгие годы.
Изначально, это не просто решение юридических вопросов, — это попытка сохранить права авторов и улучшить процесс производства. Как считает CEO Asteria Брин Мозер, такие инициативы помогут сохранить творческую свободу, чего, если честно, в индустрии не хватает.
Транзистор на Основе Висмута: Долой Кремний!
Пекинский университет сделал одно из тех открытий, которые могут изменить правила игры в полупроводниках. Новый транзистор на основе висмута оказался на 40% быстрее и на 10% энергоэффективнее, чем разработки Intel и TSMC. Как будто на планете недостаточно невидимых нам технологий, они смотрят в будущее и говорят: «Кремний? Серьезно?».
Open-Sora 2.0: Удобный Инструмент для Генерации Видео
Luchen Technology выпустила Open-Sora 2.0 — новую версию для создания видео, и, кажется, они сделали это не только с изяществом, но и за крошечный бюджет в $200,000. Она способна создавать видео с разрешением до 720p и с контролируемым движением объектов. Это как прилив новых возможностей для творческих людей, которые хотят использовать ИИ, не вклады

Alibaba запустила ИИ для анализа эмоций на видео ver 0
Ширина: 1024 px
Высота: 768 px
Соотношение сторон.: 4:3
Скачать