DeepSeek, компания, работающая в области искусственного интеллекта, выпустила новый набор мультимодальных моделей искусственного интеллекта, которые, по отзывам пользователей превосходят DALLE 3 от OpenAI.
Модели, доступные для загрузки с платформы Hugging Face, принадлежат к новому семейству, названному JanusPro. Они имеют размер от 1 до 7 миллиардов параметров, причём модели с большим количеством параметров, демонстрируют высокую производительность.
JanusPro распространяется по лицензии MIT, что позволяет использовать модель в коммерческих целях без ограничений. Компания описывает JanusPro как «новую авторегрессионную структуру», способную как анализировать, так и создавать новые изображения. Самая большая модель в семействе, JanusPro7B, превосходит DALLE 3, а также такие решения, как PixArtalpha, Emu3Gen и Stable Diffusion XL от Stability AI, в двух оценочных тестах — GenEval и DPGBench.
Хотя большинство моделей JanusPro могут анализировать только изображения с разрешением до 384 x 384, их производительность впечатляет, учитывая компактные размеры. Это делает JanusPro сильным кандидатом на звание одной из самых универсальных мультимодальных моделей. DeepSeek подчёркивает, что простота, высокая гибкость и эффективность новой модели соответствуют или превосходят производительность специализированных моделей.
JanusPro7B является усовершенствованной версией предыдущей модели Janus. Улучшения включают:
- Обновлённые процессы обучения: модель обучена на 72 миллионах высококачественных синтетических изображений, сбалансированных с реальными данными.
- Повышенное качество данных: новые подходы к обработке и увеличению объёма данных способствуют более детализированным результатам.
- Увеличенный размер модели: это обеспечивает стабильность и высокий уровень генерации изображений.
Новое поколение моделей DeepSeek может применяться в дизайне, рекламе, медиа и сфере развлечений, а возможность создавать высококачественные изображения на основе текстовых запросов делает JanusPro незаменимым инструментом для профессионалов.
С выпуском JanusPro7B компания бросает вызов таким гигантам, как OpenAI и Stability AI, а успех DeepSeek в разработке языковых и визуальных моделей искусственного интеллекта вызывает сомнения о лидерстве США.
Около года назад Google приостанавливал работу Gemini, считая, что она выдает крайне сомнительные результаты в исторических фотографиях. Для подтверждения такой позиции было достаточно лишь взглянуть на изображения американских сенаторов позапрошлого века.
28.01.2025
Источник: it-world.ru
На нашей информационной площадке "ДайджестВизард" вы сможете найти больше новостей IT
Информируем Вас о наших курсах для IT-специалистов:
- Искусственный интеллект с нуля
- JavaScript. Уровень 1. Основы JavaScript
- PostgreSQL: Уровень 1. Основы SQL
- Программирование на языке Python
- AL-1801. ОС Astra Linux Special Edition 1.8 для пользователей
Посмотреть больше курсов