Обзор последних новостей в мире искусственного интеллекта
Мир технологий стремительно развивается, и новости из мира искусственного интеллекта становятся все более захватывающими. В этом посте я поделюсь последними обновлениями, которые заслуживают вашего внимания.
OpenAI представляет GPT-Image-1
OpenAI сделала значительный шаг вперед, предоставив доступ к новой модели генерации изображений GPT-Image-1 через API. Ранее она была доступна только в рамках ChatGPT, что ограничивало ее возможности использования.
Стоимость генерации изображений в этом API основана на модели тарификации по токенам: текстовые запросы стоят $5 за миллионы токенов, ввод изображений — $10 за миллион, а вывод — $40 за миллион. В итоге, одно изображение может обойтись от $0.02 до $0.19, в зависимости от его размеров и качества. Например, изображение в разрешении 1024×1024 пикселей может «съесть» 4160 токенов. Интересно, что модель демонстрирует более высокую точность в выполнении запросов по сравнению с Midjourney-v7. Однако у нее есть определенные ограничения: она плохо распознает мелкий текст, нелатинские шрифты и медицинские данные.
Каждое изображение можно загружать через URL или в формате Base64 (PNG, JPEG до 20 МБ), и максимальное разрешение составляет 768×2000 пикселей. Но стоит помнить, что API не подходит для задач, требующих высокой точности. В целях безопасности разработчики добавили контентные фильтры и метаданные C2PA. Лучший способ протестировать новую модель — использовать Playground OpenAI, где доступны подробные руководства по работе с API.
Suna — открытый ИИ-агент от Kortix AI
Не менее интересной новостью стало появление Suna — первого в мире опенсорсного ИИ-агента общего назначения от Kortix AI. Он позволяет выполнять реальные задачи через чат-интерфейс и, в отличие от многих коммерческих моделей, Suna работает офлайн и доступен для самостоятельного хостинга, что, безусловно, привлекает разработчиков и энтузиастов ИИ.
Suna ведет речь не только о сжатии ответов на вопросы; он автоматизирует рутинные задачи — от парсинга сайтов до развертывания веб-приложений. Это достигается благодаря использованию изолированной Docker-среды и интеграции с LiteLLM, Supabase и Redis. Также предлагается подписка на подключение к сервису Kortix AI: 10 минут в месяц — бесплатно, 4 часа за $29, а 40 часов всего за $199 в месяц. Это открывает новые горизонты для тех, кто желает глубже разобраться в ИИ.
Новая функция предпросмотра ссылок в Firefox
Firefox продолжает внедрять инновации, и на этот раз речь идет о новой функции, позволяющей пользователям просматривать содержимое ссылки, не открывая ее. Это делает серфинг в интернете более удобным и быстрым. Новая функциональность, доступная через Firefox Labs 138, предоставляет карточку с заголовком, описанием, временем чтения и ключевыми пунктами, которые формируются локальной языковой моделью.
Важно отметить, что вся информация обрабатывается на устройстве пользователя благодаря модели SmolLM2-360M, избегая передачи данных в облако. Это важный аспект для защиты приватности пользователей. Функция все еще проходит тестирование, и разработчики ожидают отзывов о ее использовании, что подчеркивает стремление компании к активному взаимодействию с сообществом.
Grok от xAI становится более многофункциональным
Компания xAI не остается в стороне и расширяет возможности своего голосового ассистента Grok, добавляя сразу три новых функции. Среди них Grok Vision, который позволяет ассистенту анализировать экран смартфона в реальном времени и комментировать происходящее "здесь и сейчас". Также была добавлена поддержка многоязычного аудио и функция поиска в голосовом режиме. Эти нововведения доступны пользователям iOS, в то время как для Android-устройств они открыты только при подписке SuperGrok.
С интересом наблюдаю за тем, как голосовые технологии становятся все более интуитивными и полезными в повседневной жизни!
BMW и DeepSeek — инновации в автомобилях
BMW объявила о партнерстве с DeepSeek с целью интеграции передовых ИИ-технологий в свои автомобили для рынка Китая. Данное сотруднич

OpenAI запускает API для генерации изображений с GPT-Image-1 ver 0
Ширина: 1024 px
Высота: 768 px
Соотношение сторон.: 4:3
Скачать
Вам также может понравиться






















