Čínsky start-up DeepSeek, ktorý sa zaoberá umelou inteligenciou (AI), vydal aktualizáciu svojho modelu logického uvažovania R1. Zvyšuje tak konkurenčný tlak na americké firmy ako OpenAI, napísala dnes agentúra Reuters. DeepSeek spustila svoj nový model na vývojárskej platforme Hugging Face. Zatiaľ však nevydala verejné oznámenie k novému modelu, nezverejnila jeho popis ani porovnanie.
V rebríčku LiveCodeBench, ktorý slúži na porovnávanie výkonu modelov AI pri programovaní a na ktorého vývoji sa podieľali výskumníci z Kalifornskej univerzity v Berkeley, Massachusettského technologického inštitútu (MIT) a Cornellovej univerzity, sa aktualizovaný model uvažovania R1 umiestnil v generovaní kódu len mierne za modely o4 mini a o3 spoločnosti OpenAI a pred modelmi Grok 3 mini spoločnosti xAI a Qwen 3 spoločnosti Alibaba. Pre čínsky AI sektor je to významný úspech, pretože ukazuje, že čínske modely sa v náročnej disciplíne generovania programového kódu vyrovnávajú svetovej špičke.
DeepSeek na začiatku roka vyvrátil presvedčenie, že americké kontroly vývozu brzdia čínsky pokrok v oblasti AI, keď zverejnil modely, ktoré boli za zlomok ceny rovnaké alebo lepšie ako špičkové z USA. Spustenie modelu R1 spôsobilo v januári prudký prepad technologických akcií mimo Číny a spochybnilo názor, že rozširovanie AI si vyžaduje obrovský výpočtový výkon a investície.
Vo všeobecnosti sa stále očakáva, že DeepSeek vydá model R2, ktorý bude nástupcom R1. Agentúra Reuters v marci s odvolaním sa na zdroje uviedla, že vydanie R2 bolo pôvodne plánované na máj. Firma tiež v marci vydala aktualizáciu svojho veľkého jazykového modelu V3.
Pri jazykových modeloch je primárnym účelom spracovanie a generovanie textu, jeho silnou stránkou je plynulý a prirodzený jazyk a medzi schopnosti patrí konverzácia, preklad, zhrnutie a štýl. Modely logického uvažovania sa primárne zameriavajú na riešenie problémov a presnú logiku, silnou stránkou je správne a systematické uvažovanie a menej sa u nich kladie dôraz na jazyk. Nejde u nich len o to, aby odpoveď znela prirodzene, ale aby bola logicky správna, premyslená, ale aby dokázali napríklad vyriešiť matematickú úlohu alebo naprogramovať funkčný kód.


