Prejsť na hlavný obsah
Back to Insights
Open Source LLM DeepSeek Llama Mistral Kimi Transformer Súverenita AI

Open Source Zvíťazil: Ako Slobodná AI Dobyla Svet (2017-2026)

By Yoram Halberstam 35 min read

Transformer: Vynález, ktorý Zmenil Všetko

V júni 2017 publikovalo osem výskumníkov z Google dvanásťstránkový článok. Ešte to nevedeli, ale práve zapálili zápalnú šnúru revolúcie, ktorá zmení ľudstvo.

Transformer — tak sa volá — nahradil rekurentné neurónové siete mechanizmom pozornosti, ktorý umožňuje masívny paralelizmus spracovania dát. Na rozdiel od predchádzajúcich architektúr, ktoré spracovávali slová jedno po druhom, Transformer vidí celú vetu naraz. Tento jemný rozdiel zmení všetko.

Šesť rokov neskôr, v januári 2026, open source ekosystém dominuje globálnej umelej inteligencii. To, čo bolo kedysi len akademickým doplnkom proprietárnych gigantov, sa stalo motorom priemyselných inovácií. Ako sme sa sem dostali?

2017
Rok Transformeru
2023
Efekt Llama
2026
Dosiahnutá technická rovnováha

Prví Priekopníci (2018-2021)

GPT-2: Iskra, ktorá Prebudila Komunitu

Jún 2018. OpenAI publikuje GPT-2. Model je desivý — tak desivý, že OpenAI váha s jeho zverejnením. Ich argument? Schopnosť generovať koherentný text by mohla slúžiť dezinformáciám.

Zlý výpočet. Komunita netoleruje, že jej berú hračky. Keď je GPT-2 nakoniec vydané pod MIT licenciou, výskumníci z celého sveta ho okamžite prijímajú. Vytvára sa kolektív: EleutherAI. Ich misia? Dokázať, že modely s miliardami parametrov možno trénovať bez prostriedkov nadnárodnej spoločnosti.

"Chceli sme dokázať, že otvorená veda nepotrebuje miliardy dolárov na to, aby sa mohla rozvíjať."

— Connor Leahy, zakladateľ EleutherAI

Google Odpovedá s BERT a T5

Medzitým Google nezostáva nečinný. BERT (október 2018) revolucionizuje obojsmerné porozumenie jazyku. T5 (február 2020) navrhuje jednotný rámec, kde sa každá úloha stáva transformáciou textu na text.

Tieto modely, publikované pod Apache 2.0 licenciou, sa stávajú základom tisícok akademických výskumných projektov. Dokazujú jednu zásadnú vec: masívne predtrénovanie nasledované jemným doladením je kráľovská cesta.

Prvé Úspechy Komunity

V marci 2021 EleutherAI publikuje GPT-Neo s 2,7 miliardami parametrov. Je to technický úspech: model konkuruje vtedy aktuálnemu GPT-3, plne natrénovaný na darovanej výpočtovej sile a dobrovoľníckej práci.

Správa je jasná: open source môže konkurovať gigantom.

2022: Otvorená Veda Pod Tlakom

BigScience a BLOOM: Bezprecedentný Prístup

Rok 2022 znamená zlom. OpenAI uzatvára svoje modely za platenými API. Komunita reaguje inak.

BigScience, koordinovaný Hugging Face, zhromažďuje 1000 výskumníkov z 60 krajín. Ich cieľ? Vytvoriť najväčší viacjazyčný open source model, aký kedy bol postavený. Výsledok: BLOOM, 176 miliárd parametrov, 46 jazykov, 13 programovacích jazykov.

To, čo robí BLOOM historickým, nie je jeho veľkosť. Je to totálna transparentnosť: verejné trénovacie dáta, open source kód, kompletný tréningový log. Prvýkrát môžeme skutočne pochopiť, ako sa LLM narodil.

Meta Udrie Silou OPT

Takmer súčasne Meta AI spúšťa OPT (Open Pre-trained Transformer). Rovnaká veľkosť ako GPT-3, ale s jedným kľúčovým rozdielom: kompletná dokumentácia tréningového procesu.

Výskumníci môžu konečne študovať model tejto škály bez reverzného inžinierstva.

Galactica: Predzvesť

November 2022. Meta sa pokúša špecializovať AI pomocou Galactica, venovanej vedeckej literatúre. Model je stiahnutý do 48 hodín po kritike kvôli halucináciám.

Neúspech? Nie celkom. Galactica kladie základy pre tréning na špecializovaných korpusoch. Trend, ktorý exploduje o tri roky neskôr.

2023: Rok, keď Sa Všetko Zmenilo

24. Februára 2023: Efekt Llama

V ten deň Meta publikuje Llama. Model nie je určený pre širokú verejnosť — iba pre výskum. Ale jeho váhy uniknú online do dní.

Zápalná šnúra revolúcie.

Llama dokazuje, že skromnejší model (7 až 65 miliárd parametrov) trénovaný na viac tokenoch môže prekonať gigantov. Komunita ho okamžite prijíma.

Model Dátum Kľúčová Inovácia Licencia
Alpaca Marec 2023 Nákladovo efektívne doladenie cez self-instruct Nekomerčná
Vicuna Apríl 2023 90% kvality ChatGPT za 500 USD tréningových nákladov Nekomerčná
Falcon 40B Jún 2023 Prvý open source model dominujúci benchmarkom Apache 2.0
Mistral 7B Október 2023 Extrémna efektivita cez Sliding Window Attention Apache 2.0
Mixtral 8x7B December 2023 Demokratizovaná Mixture of Experts (MoE) Apache 2.0

QLoRA: Lokálna Demokratizácia

Apríl 2023. Jedna technika mení všetko: QLoRA (Quantized Low-Rank Adaptation).

Výsledok? Jemné doladenie modelu s 65 miliardami parametrov na jedinej konzumnej GPU. Malé firmy teraz môžu vytvárať vlastnú AI bez masívnej infraštruktúry.

Bariéry padajú jedna po druhej.

2024-2025: Technická Rovnováha

DeepSeek: Čína Vstupuje na Scénu

Leto 2024 znamená príchod nového významného hráča: DeepSeek, čínske laboratórium pridružené k High-Flyer Quant.

Ich majstrovský ťah? Ultra-efektívna MoE architektúra a mechanizmus MLA (Multi-head Latent Attention), ktorý znižuje potrebu pamäte KV cache o 93%.

Výsledok v januári 2025: DeepSeek-V3 dorovnáva GPT-4 za zlomok nákladov. Medzinárodná komunita objavuje, že open source už nie je nasledovník — je lídrom.

OpenAI Podľahne Tlaku

August 2025. OpenAI, po rokoch uzavretosti, publikuje GPT-OSS. Prvý model s otvorenými váhami od GPT-2. Optimalizovaný pre agentic workflows a dlhý kontext.

Prečo tento obrat? Konkurenčný tlak open source sa stal príliš silným. Keď bezplatné modely dorovnávajú tie vaše, uzavretosť už nestačí.

Meta Odpovedá Llama 4

Okamžitá odpoveď Meta: Llama 4. Nátívne multimodálny, schopný spracovať 10 miliónov tokenov kontextu.

Predstavte si: analýza celého kódového základu v jedinom dotaze. Teraz je to možné — a zadarmo.

Január 2026: Open Source Dominuje

Rebríček Najlepších Modelov

Tu sme dnes:

Pozícia Model Vývojár Skóre Kvality Špecializácia
1 Kimi K2.5 (Reasoning) Moonshot AI 46,77 Matematika, komplexné usudzovanie
2 GLM-4.7 (Thinking) Zhipu AI 41,70 Programovanie, Vízia-Jazyk
3 DeepSeek V3.2 DeepSeek 41,20 Efektivita, nízke náklady na inferenciu
4 GPT-OSS-120B OpenAI 40,50 Používanie nástrojov, agentic
5 Llama 4 (70B) Meta 39,80 Multimodálnosť, ekosystém
6 Qwen3-235B Alibaba 39,20 Viacjazyčnosť, RAG

Verdikt je brutálny: 5 zo 6 najlepších modelov sú open source. Iba GPT-OSS, irónicky, nesie meno bývalého proprietárneho lídra.

Inovácie, ktoré Zmenili Hru

MLA a DeepSeek Sparse Attention: Spracovanie miliónov kontextových tokenov vyžadovalo zakázanú pamäť KV cache. MLA agresívne komprimuje túto cache. DSA znižuje výpočtovú zložitosť spracovaním iba relevantných častí sekvencie.

BitNet 1.58b: Najradikálnejšia inovácia roku 2025. Namiesto kódovania váh na 16 bitov používa BitNet ternárne hodnoty {-1, 0, 1} — približne 1,58 bitu na parameter.

Dôsledok:

  • 70-80% zníženie spotreby energie
  • 2,3x až 6,1x zrýchlenie na štandardných procesoroch
  • Model so 100 miliardami parametrov bežiaci na bežnom stolovom počítači

Súverenita AI už nie je sen. Je to technická realita.

Lokálna Inferencia sa Stáva Štandardom

RTX 5090: Srdce AI Pracovných Staníc

Začiatkom roku 2025 NVIDIA vydáva RTX 5090. 32 GB GDDR7 pamäte, priepustnosť 1,79 TB/s (+77% oproti predošlej generácii).

Výsledky na konzumnej karte:

  • Llama 4 8B (4-bit): 180 tokenov/sekundu
  • DeepSeek-R1 14B (4-bit): 89 tokenov/sekundu
  • Qwen 2.5 32B (4-bit): 45 tokenov/sekundu

Modely 70B+ teraz bežia na lokálnych multi-GPU konfiguráciách s priemyselným výkonom.

vLLM vs Ollama

Dva ekosystémy dominujú:

  • vLLM: Produkcia štandard. PagedAttention engine, optimalizovaná správa KV cache, viacero súčasných používateľov.
  • Ollama: Obľúbené vývojárov. Extrémna jednoduchosť, nulová konfigurácia, natívna podpora macOS/Linux/Windows.

Agentická Éra: Od Chatu k Akcii

Devstral 2: AI v Službách Kódu

December 2025. Mistral AI spúšťa Devstral 2, 123 miliárd parametrov optimalizovaných pre vývoj softvéru.

Skóre SWE-bench Verified: 72,2%. Rovnaké ako Claude Sonnet 4, ale sedemkrát drahšie.

Cena: 0,40 $ za milión tokenov. Vývoj s podporou AI sa stáva ekonomicky uskutočniteľným pre malé firmy a freelancerov.

Vibe CLI: AI, ktorá Programuje Samá

V ten istý mesiac Mistral spúšťa Vibe CLI. Tento nástroj autonómne orcheštruje komplexné zmeny naprieč celými kódovými základňami.

Agentické modely z roku 2026 môžu:

  • Navigovať v komplexných súborových systémoch
  • Identifikovať závislosti medzi frameworkmi
  • Detekovať zlyhania testov a samoopraviť sa
  • Produkovť spoľahlivo štruktúrované JSON výstupy pre softvérovú integráciu

Prechádzame od “chat AI” k “action AI”.

Regulácia: Čo Zostáva z Otvoreného?

OSAID 1.0: Oficiálna Definícia

Október 2024. Open Source Initiative konečne publikuje oficiálnu definíciu Open Source AI.

Aby sa kvalifikovalo ako open source, systém musí garantovať štyri slobody: používať, študovať, upravovať a zdieľať. Tri kľúčové komponenty:

  1. Kód: Kompletný kód predtrénovania, filtrovania a inferencie
  2. Parametre: Váhy, nastavenia optimalizátora, konfigurácie architektúry
  3. Dáta: Podrobná dokumentácia o pôvode, výbere a spracovaní

Výsledok? Väčšina súčasných “open source” modelov nie je kompatibilná. Llama 4, Mistral, dokonca aj GPT-OSS postrádajú úplnú transparentnosť dát.

Iba Pythia (EleutherAI) a OLMo (AI2) získavajú označenie “skutočne open source”.

EU AI Act Štrukturuje Trh

Od februára 2025 platí EU AI Act. Open source modely profitujú z významných výnimiek — za predpokladu, že nie sú klasifikované ako “systémové riziko”.

Pre modely presahujúce 10^25 FLOPov platia povinnosti dokumentácie a kybernetickej bezpečnosti, nezávisle od licencie.

2026-2030: Čo Nás Čaká

Trendy, ktoré Nabúrajú Tvar

Post-Transformer: Nové architektúry vznikajú na zníženie kvadratickej zložitosti pozornosti. BitNet je len začiatok.

Edge AI: Modely ako Ministral 3B bežia na smartfónoch s masívnym kontextom. Domáca automatizácia a osobná robotika explodujú.

Suverenita Inteligencie: Firmy už nechcú “prenájmať” inteligenciu cez API. Chcú vlastniť vlastné digitálne mozgy, trénované na svojich priemyselných tajomstvách.

Multi-Agent Spolupráca: Budúcnosť spočíva v komunikácii medzi modelmi rôznych poskytovateľov. Riešenie problémov prostredníctvom spolupráce skôr než monolitickou hrubou silou.

Nový SEO Paradigma

Masívna integrácia LLM do vyhľadávačov transformovala online viditeľnosť. Teraz hovoríme o GEO (Generative Engine Optimization).

V roku 2026 približne 25% tradičného organického premávky zachytávajú AI-generované priame odpovede. Používatelia už neklikajú — čítajú syntézu.

Pre značku sa úspech už nemeria Google rankingom. Meria sa frekvenciou a stabilitou citácií v generatívnych odpovediach Gemini 3 alebo GPT-5.

A Teraz?

Open source ekosystém z roku 2026 dokázal jednu zásadnú vec: transparentnosť a spolupráca nie sú etické ideály, sú to nadradené konkurenčné výhody.

Zlomením monopolov inteligencie transformoval open source AI z exkluzívnej služby na globálnu verejnú infraštruktúru — rovnako fundamentálnu ako elektrina alebo internet.

Technická rovnováha je dosiahnutá. Ďalšia hranica? Totálna autonómia systémov v službách ľudstva.

Masívne generalistické modely sú dopĺňané, niekedy nahradzované, súhvezdiami špecializovaných, úspornejších, presnejších, suverénnejších modelov.

Open source zvíťazil. Zvyšok je len história.

Obsah