Китайська Alibaba оновила свою модель ШІ. Компанія стверджує: вона перевершила DeepSeek

Китайська технологічна компанія Alibaba випустила оновлену версію своєї моделі штучного інтелекту Qwen 2.5, заявивши, що вона перевершує конкурентів GPT-4o та DeepSeek-V3.

Про це пише Reuters.

Випуск Qwen 2.5-Max відбувся в перший день нового року за місячним календарем, коли більшість китайців не працюють, а натомість святкують зі своїми сім’ями. Це може вказувати на те, що в Alibaba вирішили відреагувати на підйом китайського стартапу DeepSeek, зауважує інформаційне агентство.

У своєму повідомленні Alibaba також наголосила, що Qwen 2.5-Max «майже за всіма напрямами» перевершує GPT-4o, DeepSeek-V3 та Llama-3.1-405B.

Qwen — це сімейство великих мовних моделей, презентованих Alibaba у вересні 2023 року, що базується на моделях Llama, випущених американською компанією Meta.

У червні 2024 року Alibaba випустила Qwen 2, а у вересні того самого року відкрила код для деяких своїх моделей.

Що за DeepSeek?

Китайський стартап DeepSeek нещодавно випустив власну модель штучного інтелекту DeepSeek-R1, яка, як стверджується, працює нарівні з ChatGPT, але є «економічно ефективнішою» у використанні дорогих чипів Nvidia.

Через цікавість до такої заяви DeepSeek потрапив у Google-тренди, а також став № 1 серед безплатних застосунків в Apple Store у США, Великій Британії та Китаї. Деякі оглядачі були стурбовані тим, як китайський стартап міг наздогнати американські компанії за незначну ціну.

DeepSeek викликав паніку на біржовому ринку: 27 січня фʼючерси на електронній фондовій біржі Nasdaq 100 впали майже на 2,5%, контракти на S& P 500 подешевшали на 1,4%. Акції американської технологічної компанії Nvidia впали на 17%.

За даними ЗМІ, компанію DeepSeek заснував у 2023 році Лян Веньфен у Ханчжоу. 40-річний підприємець, випускник інформаційної та електронної інженерії, також заснував хедж-фонд, який підтримував DeepSeek. Нещодавно його бачили на зустрічі між галузевими експертами та прем'єр-міністром Китаю Лі Цяном.