27.01.2025

Генератор изображений JanusPro7B работает лучше, чем OpenAI и Stability AI

DeepSeek, компания, работающая в области искусственного интеллекта, выпустила новый набор мультимодальных моделей искусственного интеллекта, которые, по отзывам пользователей превосходят DALLE 3 от OpenAI.

Модели, доступные для загрузки с платформы Hugging Face, принадлежат к новому семейству, названному JanusPro. Они имеют размер от 1 до 7 миллиардов параметров, причём модели с большим количеством параметров, демонстрируют высокую производительность.

JanusPro распространяется по лицензии MIT, что позволяет использовать модель в коммерческих целях без ограничений. Компания описывает JanusPro как «новую авторегрессионную структуру», способную как анализировать, так и создавать новые изображения. Самая большая модель в семействе, JanusPro7B, превосходит DALLE 3, а также такие решения, как PixArtalpha, Emu3Gen и Stable Diffusion XL от Stability AI, в двух оценочных тестах — GenEval и DPGBench.

Хотя большинство моделей JanusPro могут анализировать только изображения с разрешением до 384 x 384, их производительность впечатляет, учитывая компактные размеры. Это делает JanusPro сильным кандидатом на звание одной из самых универсальных мультимодальных моделей. DeepSeek подчёркивает, что простота, высокая гибкость и эффективность новой модели соответствуют или превосходят производительность специализированных моделей.

JanusPro7B является усовершенствованной версией предыдущей модели Janus. Улучшения включают:

  • Обновлённые процессы обучения: модель обучена на 72 миллионах высококачественных синтетических изображений, сбалансированных с реальными данными.
  • Повышенное качество данных: новые подходы к обработке и увеличению объёма данных способствуют более детализированным результатам.
  • Увеличенный размер модели: это обеспечивает стабильность и высокий уровень генерации изображений.

Новое поколение моделей DeepSeek может применяться в дизайне, рекламе, медиа и сфере развлечений, а возможность создавать высококачественные изображения на основе текстовых запросов делает JanusPro незаменимым инструментом для профессионалов.

С выпуском JanusPro7B компания бросает вызов таким гигантам, как OpenAI и Stability AI, а успех DeepSeek в разработке языковых и визуальных моделей искусственного интеллекта вызывает сомнения о лидерстве США.

Около года назад Google приостанавливал работу Gemini, считая, что она выдает крайне сомнительные результаты в исторических фотографиях. Для подтверждения такой позиции было достаточно лишь взглянуть на изображения американских сенаторов позапрошлого века.

28.01.2025

Источник: it-world.ru

На нашей информационной площадке "ДайджестВизард" вы сможете найти больше новостей IT

Информируем Вас о наших курсах для IT-специалистов:

Посмотреть больше курсов