
Image by Matheus Bertelli, from Pexels
DeepSeeks AI lærer at tænke for sig selv
Kinesiske startup DeepSeek, i partnerskab med Tsinghua University, siger, at de har udviklet en smartere måde at hjælpe kunstige intelligensmodeller med at tænke bedre og hurtigere, uden behov for enorme computere eller dyre ressourcer.
Har du travlt? Her er de hurtige fakta:
- DeepSeek har skabt en selvforbedrende AI ved hjælp af Self-Principled Critique Tuning (SPCT).
- SPCT lærer AI at vurdere sit eget arbejde ved hjælp af selv-genererede regler.
- Metoden øger ydelsen uden massiv databehandlingskraft.
Gennembruddet kommer fra en ny teknik kaldet Self-Principled Critique Tuning (SPCT). SPCT adskiller sig fra blot at gøre AI-modeller større for at forbedre ydeevnen – SPCT kræver ikke en masse energi og computerkraft til at lære AI at bedømme sit eget arbejde ved hjælp af et sæt selvskabte regler.
Den måde, det fungerer på, er via en indbygget “dommer”, som verificerer, at AI-svaret både overholder dets interne ræsonnementregler, og virker passende for menneskelig output. Når AI giver et solidt svar, modtager det positiv feedback, hvilket hjælper det med at forbedre sin evne til at besvare lignende spørgsmål i fremtidige situationer.
DeepSeek implementerer denne metode som en del af sit DeepSeek-GRM system, som står for Generative Reward Modeling. GRM fungerer anderledes end traditionelle metoder, fordi det udfører parallelle checks for at forbedre både nøjagtighed og konsistens.
“Vi foreslår Self-Principled Critique Tuning (SPCT) for at fremme skalérbare belønningsgenererende adfærd,” skrev forskerne i deres artikel. “SPCT giver [modellen] mulighed for at tilpasse principper og kritik baseret på input forespørgslen og svar, hvilket fører til bedre belønningsresultater.”
Med dette system hævder DeepSeek, at deres AI nu kan præstere bedre end konkurrenter som Googles Gemini, Metas Llama og OpenAI’s GPT-4o, især når det kommer til komplekse opgaver som ræsonnement eller beslutningstagning, som bemærket af Euronews.
Det er vigtigt at bemærke, at DeepSeek siger, at de planlægger at frigive disse nye værktøjer som open-source software, selvom der endnu ikke er blevet delt en udgivelsesdato.
Skriv en kommentar
Fortryd