Обзор последних новостей в мире искусственного интеллекта

Мир технологий стремительно развивается, и новости из мира искусственного интеллекта становятся все более захватывающими. В этом посте я поделюсь последними обновлениями, которые заслуживают вашего внимания.

OpenAI представляет GPT-Image-1

OpenAI сделала значительный шаг вперед, предоставив доступ к новой модели генерации изображений GPT-Image-1 через API. Ранее она была доступна только в рамках ChatGPT, что ограничивало ее возможности использования.

Стоимость генерации изображений в этом API основана на модели тарификации по токенам: текстовые запросы стоят $5 за миллионы токенов, ввод изображений — $10 за миллион, а вывод — $40 за миллион. В итоге, одно изображение может обойтись от $0.02 до $0.19, в зависимости от его размеров и качества. Например, изображение в разрешении 1024×1024 пикселей может «съесть» 4160 токенов. Интересно, что модель демонстрирует более высокую точность в выполнении запросов по сравнению с Midjourney-v7. Однако у нее есть определенные ограничения: она плохо распознает мелкий текст, нелатинские шрифты и медицинские данные.

Каждое изображение можно загружать через URL или в формате Base64 (PNG, JPEG до 20 МБ), и максимальное разрешение составляет 768×2000 пикселей. Но стоит помнить, что API не подходит для задач, требующих высокой точности. В целях безопасности разработчики добавили контентные фильтры и метаданные C2PA. Лучший способ протестировать новую модель — использовать Playground OpenAI, где доступны подробные руководства по работе с API.

Suna — открытый ИИ-агент от Kortix AI

Не менее интересной новостью стало появление Suna — первого в мире опенсорсного ИИ-агента общего назначения от Kortix AI. Он позволяет выполнять реальные задачи через чат-интерфейс и, в отличие от многих коммерческих моделей, Suna работает офлайн и доступен для самостоятельного хостинга, что, безусловно, привлекает разработчиков и энтузиастов ИИ.

Suna ведет речь не только о сжатии ответов на вопросы; он автоматизирует рутинные задачи — от парсинга сайтов до развертывания веб-приложений. Это достигается благодаря использованию изолированной Docker-среды и интеграции с LiteLLM, Supabase и Redis. Также предлагается подписка на подключение к сервису Kortix AI: 10 минут в месяц — бесплатно, 4 часа за $29, а 40 часов всего за $199 в месяц. Это открывает новые горизонты для тех, кто желает глубже разобраться в ИИ.

Новая функция предпросмотра ссылок в Firefox

Firefox продолжает внедрять инновации, и на этот раз речь идет о новой функции, позволяющей пользователям просматривать содержимое ссылки, не открывая ее. Это делает серфинг в интернете более удобным и быстрым. Новая функциональность, доступная через Firefox Labs 138, предоставляет карточку с заголовком, описанием, временем чтения и ключевыми пунктами, которые формируются локальной языковой моделью.

Важно отметить, что вся информация обрабатывается на устройстве пользователя благодаря модели SmolLM2-360M, избегая передачи данных в облако. Это важный аспект для защиты приватности пользователей. Функция все еще проходит тестирование, и разработчики ожидают отзывов о ее использовании, что подчеркивает стремление компании к активному взаимодействию с сообществом.

Grok от xAI становится более многофункциональным

Компания xAI не остается в стороне и расширяет возможности своего голосового ассистента Grok, добавляя сразу три новых функции. Среди них Grok Vision, который позволяет ассистенту анализировать экран смартфона в реальном времени и комментировать происходящее "здесь и сейчас". Также была добавлена поддержка многоязычного аудио и функция поиска в голосовом режиме. Эти нововведения доступны пользователям iOS, в то время как для Android-устройств они открыты только при подписке SuperGrok.

С интересом наблюдаю за тем, как голосовые технологии становятся все более интуитивными и полезными в повседневной жизни!

BMW и DeepSeek — инновации в автомобилях

BMW объявила о партнерстве с DeepSeek с целью интеграции передовых ИИ-технологий в свои автомобили для рынка Китая. Данное сотруднич

OpenAI запускает API для генерации изображений с GPT-Image-1 ver 0
OpenAI запускает API для генерации изображений с GPT-Image-1 ver 0
Ширина: 1024 px
Высота: 768 px
Соотношение сторон.: 4:3

Скачать


Обсуждение (0)

Войдите, чтобы оставить комментарий

Пока нет комментариев!



Вам также может понравиться

Почему датасет DUMB500 — это просто находка! Этот набор данных – настоящий бриллиант среди прочих! Он полон уникальной информации и предлагает возможности, которые сложно переоценить. В мире, где данные кажутся повседневностью, DUMB500 выделяется своей структурированной подачей и актуальностью. Это не просто цифры – это шанс получи... Читать далее