Alibaba Udgiver Ny Qwen AI Model og Hævder, at Den Overgår DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba Udgiver Ny Qwen AI Model og Hævder, at Den Overgår DeepSeek-V3

Læsetid: 2 Minut

Den kinesiske gigant Alibaba udgav den seneste version af deres flagskibs AI-model, Qwen, denne onsdag. Virksomheden hævder, at den kan præstere bedre end den populære DeepSeek-V3.

Har du travlt? Her er de hurtige fakta!

  • Alibaba lancerede sin nyeste ræsonneringsmodel Qwen 2.5-Max denne onsdag.
  • Den kinesiske gigant hævder, at den overgår populære modeller som DeepSeek-V3, GPT-4o og Llama-3.1-405B.
  • Selskabet lancerede også Qwen2.5-VL denne uge, en AI-model, der er i stand til at behandle billeder og fungere som en AI-agent ved hjælp af computere og mobiltelefoner til at udføre opgaver.

Ifølge Reuters, lancerede Alibaba den nye Qwen 2.5-Max, som det har navngivet den nye ræsonneringsmodel, lige midt i ferien for det kinesiske nytår, for at deltage i de massive AI-udviklinger fra de seneste dage og tilføje indenlandsk konkurrence.

På mandag, nåede DeepSeek førstepladsen på Apples App Store i USA, overgik ChatGPT, hvilket bekymrede andre virksomheder i AI-industrien og alarmerede investorer—Nvidias aktier faldt 17% på bare én dag.

Nu har Alibaba annonceret de nyeste versioner af deres Qwen model—den lancerede 100 open-source AI modeller til Qwen suiten i september sidste år—og lover bedre resultater end populære grænsemodeller.

“Qwen 2.5-Max overgår (…) næsten på alle områder GPT-4o, DeepSeek-V3 og Llama-3.1-405B,” skrev firmaet på sin officielle WeChat-konto.

Den nye ræsonnementmodel Qwen 2.5-Max’s API er tilgængelig gennem Alibabas sky og brugere kan også teste modellen på dens chat side.

“Vi udvikler Qwen2.5-Max, en storstilet MoE model, der er blevet fortrænet på over 20 billioner tokens og yderligere post-trænet med kuraterede Supervised Fine-Tuning (SFT) og Reinforcement Learning from Human Feedback (RLHF) metoder,” skrev Qwen Team i Github.

Den kinesiske gigant udgav også Qwen2.5-VL på mandag, en serie af multimodale AI modeller, der også kan behandle billeder og få adgang til mobiler og computere for at udføre opgaver. OpenAI annoncerede en lignende funktion, Operator, der tillader ChatGPT at udføre opgaver autonomt ved at tage kontrol over brugerens computer.

Ifølge Alibabas team overgår alle Qwen-modeller lignende versioner fra OpenAI, Microsoft, Google, Meta og DeepSeek.

Kunne du lide denne artikel?
Så anmeld den venligst!
Jeg hadede den Jeg kan ikke rigtigt lide den Den var ok Ret god! Var vild med den!

Vi er glade for du synes om vores arbejde!

Som en værdsat læser, håber vi du har lyst til at tjekke os på Trustpilot? Det er hurtigt, og betyder alverden for os. Tak for at du er fantastisk!

Bedøm os på Trustpilot
0 Brugere som har 0 stemt
Overskrift
Kommentar
Tak for din feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Skriv en kommentar

Loader
Loader Vis mere...