Alibaba Udgiver Ny Qwen AI Model og Hævder, at Den Overgår DeepSeek-V3
Den kinesiske gigant Alibaba udgav den seneste version af deres flagskibs AI-model, Qwen, denne onsdag. Virksomheden hævder, at den kan præstere bedre end den populære DeepSeek-V3.
Har du travlt? Her er de hurtige fakta!
- Alibaba lancerede sin nyeste ræsonneringsmodel Qwen 2.5-Max denne onsdag.
- Den kinesiske gigant hævder, at den overgår populære modeller som DeepSeek-V3, GPT-4o og Llama-3.1-405B.
- Selskabet lancerede også Qwen2.5-VL denne uge, en AI-model, der er i stand til at behandle billeder og fungere som en AI-agent ved hjælp af computere og mobiltelefoner til at udføre opgaver.
Ifølge Reuters, lancerede Alibaba den nye Qwen 2.5-Max, som det har navngivet den nye ræsonneringsmodel, lige midt i ferien for det kinesiske nytår, for at deltage i de massive AI-udviklinger fra de seneste dage og tilføje indenlandsk konkurrence.
På mandag, nåede DeepSeek førstepladsen på Apples App Store i USA, overgik ChatGPT, hvilket bekymrede andre virksomheder i AI-industrien og alarmerede investorer—Nvidias aktier faldt 17% på bare én dag.
Nu har Alibaba annonceret de nyeste versioner af deres Qwen model—den lancerede 100 open-source AI modeller til Qwen suiten i september sidste år—og lover bedre resultater end populære grænsemodeller.
“Qwen 2.5-Max overgår (…) næsten på alle områder GPT-4o, DeepSeek-V3 og Llama-3.1-405B,” skrev firmaet på sin officielle WeChat-konto.
Den nye ræsonnementmodel Qwen 2.5-Max’s API er tilgængelig gennem Alibabas sky og brugere kan også teste modellen på dens chat side.
“Vi udvikler Qwen2.5-Max, en storstilet MoE model, der er blevet fortrænet på over 20 billioner tokens og yderligere post-trænet med kuraterede Supervised Fine-Tuning (SFT) og Reinforcement Learning from Human Feedback (RLHF) metoder,” skrev Qwen Team i Github.
Den kinesiske gigant udgav også Qwen2.5-VL på mandag, en serie af multimodale AI modeller, der også kan behandle billeder og få adgang til mobiler og computere for at udføre opgaver. OpenAI annoncerede en lignende funktion, Operator, der tillader ChatGPT at udføre opgaver autonomt ved at tage kontrol over brugerens computer.
Ifølge Alibabas team overgår alle Qwen-modeller lignende versioner fra OpenAI, Microsoft, Google, Meta og DeepSeek.
Skriv en kommentar
Fortryd