Alibaba Group представила новые математические AI-модели Qwen2-Math, которые, по утверждению компании, опережают по производительности решения от OpenAI и Google.
Alibaba Group Holding, одна из ведущих мировых технологических компаний, представила серию больших языковых моделей (LLM) Qwen2-Math, разработанных специально для решения математических задач. Эти модели, по данным компании, показали более высокие результаты по сравнению с аналогами от OpenAI, Google и других крупных игроков на рынке AI.
Qwen2-Math включает три модели с разным количеством параметров — ключевым показателем, который определяет качество и точность вывода на основе обученных данных. Ведущая модель, Qwen2-Math-72B-Instruct, превзошла такие модели, как GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Google Gemini 1.5 Pro и Llama-3.1-405B от Meta Platforms*.
Эти результаты были получены на основе тестов, включая GSM8K — набор из 8,500 сложных математических задач, OlympiadBench — научный мультимодальный бенчмарк, и китайский экзамен gaokao, который является одним из самых сложных вступительных экзаменов в мире.
Ранее IT-World уже рассказывал о принципах работы самых популярных нейросетей и областях их применения. В своем обзоре редакция IT-World собрала основную информацию о наиболее популярных моделях ИИ, включая ChatGPT-4o, YandexGPT, GigaChat, Grok, LLaMA, Claude и Gemini.
Alibaba же уделила особое внимание логическим и математическим возможностям своих моделей, что позволяет им решать сложные задачи с высокой точностью. Тем не менее, на данный момент модели поддерживают только английский язык, но компания уже работает над двуязычными и многоязычными версиями.
* Запрещена в России
Источник: South China Morning Post
13.08.2024
Источник: it-world.ru
На нашей информационной площадке "ДайджестВизард" вы сможете найти больше новостей IT
Информируем Вас о наших курсах для IT-специалистов:
- Разработчик программного обеспечения на Python (backend разработчик)
- Разработчик программного обеспечения на Java (backend разработчик)
- Интенсивный курс: Программирование на языке Python
- Интенсивный курс: Программирование на языке Java
- Веб-разработчик на языке Python
- DevOps инженер
Посмотреть больше курсов