Запуски LLM 2025 года: мнения комьюнити и анализ новинок

ML-комьюнити о крупнейших запусках LLM начала 2025 года

В начале 2025 года мир искусственного интеллекта радуется множеству интересных новинок, каждая из которых привнесла свежие идеи и вызовы в уже и без того динамичную индустрию. Ниже собраны самые важные запуски и мнения экспертов, которые помогут разобраться, насколько они впечатляют или, возможно, переоценены.

DeepSeek — Восхождение или лишь мираж?

Запуск китайской модели DeepSeek вызвал бурные обсуждения, особенно среди экспертов. Дарио Амодей, CEO Anthropic, с недоумением отмечает, что разработка Claude 3.5 Sonnet, которая обошлась в десятки миллионов долларов, значительно опережает DeepSeek по ряду ключевых характеристик. Более того, эта модель не имеет ограничения на генерацию чувствительной информации, что ставит под сомнение этические аспекты ее использования. Несмотря на восторженные комментарии Демиса Хассабиса, CEO Google DeepMind, который назвал DeepSeek "лучшей работой китайских исследователей", он тем не менее не нашёл в ней каких-либо новых научных открытий. Очевидно, что с такой амбициозной моделью, как DeepSeek, важно учитывать не только технологические, но и моральные рамки её применения.

Grok 3 — Не тот уровень, который ожидали

xAI и Илон Маск продемонстрировали очередное пополнение в свою линейку моделей — Grok 3. Однако реакция на этот запуск была довольно сдержанной. Итан Моллик, авторитетный ИИ-исследователь из Пенсильванского университета, стал одним из тех, кто мнит, что Grok 3 не может сравниться с лучшими моделями на рынке, несмотря на её некоторые преимущества перед конкурентами OpenAI. Проблемы с безопасностью и надежностью говорят о том, что данная модель пока не подходит для серьезных бизнес-приложений. На фоне таких сильных критических замечаний, безусловно, вызывает интерес, как же Grok 3 будет адаптироваться в условиях рынка, где надежность и адаптивность имеют первостепенное значение.

GPT-4.5 — Ура или уныние?

Релиз GPT-4.5 от OpenAI снова зарядил обсуждения в профессиональных кругах, но отзывы о модели оказались довольно смешанными. Андрей Карпатый, соучредитель OpenAI, увидел в ней потенциал, однако его оптимизм был в значительной степени скромным. Он отметил улучшения, но не такие радикальные, как ожидалось. В отличие от него, критик Гэри Маркус не стеснялся в выражениях, назвав модель "пустышкой", а Клемент Деланж, генеральный директор Hugging Face, поделился аналогичными мыслями, указав на недостаток открытости исходного кода. Подобные разногласия свидетельствуют о том, что сообщество все еще в поисках того идеального баланса между инновациями и эффективностью, который мог бы стать основой для реального прогресса в области ИИ.

YandexGPT 5 — Достижения в российском контексте

Если говорить о новинках из России, то YandexGPT 5 получает свои первые отклики. Виктор Тарнавский, директор по ИИ Т-Банка, отмечает, что Яндекс уже представил Lite-версию модели в open-source, что является платформой для дальнейшего роста и экономии ресурсов. По его мнению, перенастройка на базы данных от Qwen 2.5 является стратегически верным шагом, что открывает новые возможности для внедрения YandexGPT 5 в решения для бизнеса. Важно подумать, каким образом такие модели могут интегрироваться в рынки B2B и B2C, такие как монетизация и возможность применения в реальных задачах.

Gemini 2.0 Flash — Изюминка среди общих обновлений

Google Gemini 2.0 Flash стал образцом удачного сочетания цены и качества, что не осталось незамеченным сообществом. Тим Брукс из Google DeepMind хвалит инновационные функции, позволяющие создать визуально обоснованные рассуждения, что поднимает планку для отрасли. По словам Райана Карсона, соучредителя Intel AI, модель делает акцент на быстродействии и доступности, за что уже получила множество положительных отзывов. Она не только конкурирует с Claude 3

Теги.: Искусственный интеллект машинное обучение LLM новые технологии GPT-4.5

75 2 месяца назад