Китайська Alibaba оновила свою модель ШІ. Компанія стверджує: вона перевершила DeepSeek
Китайська технологічна компанія Alibaba випустила оновлену версію своєї моделі штучного інтелекту Qwen 2.5, заявивши, що вона перевершує конкурентів GPT-4o та DeepSeek-V3.
Про це пише Reuters.
Випуск Qwen 2.5-Max відбувся в перший день нового року за місячним календарем, коли більшість китайців не працюють, а натомість святкують зі своїми сім’ями. Це може вказувати на те, що в Alibaba вирішили відреагувати на підйом китайського стартапу DeepSeek, зауважує інформаційне агентство.
У своєму повідомленні Alibaba також наголосила, що Qwen 2.5-Max «майже за всіма напрямами» перевершує GPT-4o, DeepSeek-V3 та Llama-3.1-405B.
Qwen — це сімейство великих мовних моделей, презентованих Alibaba у вересні 2023 року, що базується на моделях Llama, випущених американською компанією Meta.
У червні 2024 року Alibaba випустила Qwen 2, а у вересні того самого року відкрила код для деяких своїх моделей.
Що за DeepSeek?
Китайський стартап DeepSeek нещодавно випустив власну модель штучного інтелекту DeepSeek-R1, яка, як стверджується, працює нарівні з ChatGPT, але є «економічно ефективнішою» у використанні дорогих чипів Nvidia.
Через цікавість до такої заяви DeepSeek потрапив у Google-тренди, а також став № 1 серед безплатних застосунків в Apple Store у США, Великій Британії та Китаї. Деякі оглядачі були стурбовані тим, як китайський стартап міг наздогнати американські компанії за незначну ціну.
DeepSeek викликав паніку на біржовому ринку: 27 січня фʼючерси на електронній фондовій біржі Nasdaq 100 впали майже на 2,5%, контракти на S& P 500 подешевшали на 1,4%. Акції американської технологічної компанії Nvidia впали на 17%.
За даними ЗМІ, компанію DeepSeek заснував у 2023 році Лян Веньфен у Ханчжоу. 40-річний підприємець, випускник інформаційної та електронної інженерії, також заснував хедж-фонд, який підтримував DeepSeek. Нещодавно його бачили на зустрічі між галузевими експертами та прем'єр-міністром Китаю Лі Цяном.
- Поділитися: