Transformer: Vynález, ktorý Zmenil Všetko
V júni 2017 publikovalo osem výskumníkov z Google dvanásťstránkový článok. Ešte to nevedeli, ale práve zapálili zápalnú šnúru revolúcie, ktorá zmení ľudstvo.
Transformer — tak sa volá — nahradil rekurentné neurónové siete mechanizmom pozornosti, ktorý umožňuje masívny paralelizmus spracovania dát. Na rozdiel od predchádzajúcich architektúr, ktoré spracovávali slová jedno po druhom, Transformer vidí celú vetu naraz. Tento jemný rozdiel zmení všetko.
Šesť rokov neskôr, v januári 2026, open source ekosystém dominuje globálnej umelej inteligencii. To, čo bolo kedysi len akademickým doplnkom proprietárnych gigantov, sa stalo motorom priemyselných inovácií. Ako sme sa sem dostali?
Prví Priekopníci (2018-2021)
GPT-2: Iskra, ktorá Prebudila Komunitu
Jún 2018. OpenAI publikuje GPT-2. Model je desivý — tak desivý, že OpenAI váha s jeho zverejnením. Ich argument? Schopnosť generovať koherentný text by mohla slúžiť dezinformáciám.
Zlý výpočet. Komunita netoleruje, že jej berú hračky. Keď je GPT-2 nakoniec vydané pod MIT licenciou, výskumníci z celého sveta ho okamžite prijímajú. Vytvára sa kolektív: EleutherAI. Ich misia? Dokázať, že modely s miliardami parametrov možno trénovať bez prostriedkov nadnárodnej spoločnosti.
"Chceli sme dokázať, že otvorená veda nepotrebuje miliardy dolárov na to, aby sa mohla rozvíjať."
Google Odpovedá s BERT a T5
Medzitým Google nezostáva nečinný. BERT (október 2018) revolucionizuje obojsmerné porozumenie jazyku. T5 (február 2020) navrhuje jednotný rámec, kde sa každá úloha stáva transformáciou textu na text.
Tieto modely, publikované pod Apache 2.0 licenciou, sa stávajú základom tisícok akademických výskumných projektov. Dokazujú jednu zásadnú vec: masívne predtrénovanie nasledované jemným doladením je kráľovská cesta.
Prvé Úspechy Komunity
V marci 2021 EleutherAI publikuje GPT-Neo s 2,7 miliardami parametrov. Je to technický úspech: model konkuruje vtedy aktuálnemu GPT-3, plne natrénovaný na darovanej výpočtovej sile a dobrovoľníckej práci.
Správa je jasná: open source môže konkurovať gigantom.
2022: Otvorená Veda Pod Tlakom
BigScience a BLOOM: Bezprecedentný Prístup
Rok 2022 znamená zlom. OpenAI uzatvára svoje modely za platenými API. Komunita reaguje inak.
BigScience, koordinovaný Hugging Face, zhromažďuje 1000 výskumníkov z 60 krajín. Ich cieľ? Vytvoriť najväčší viacjazyčný open source model, aký kedy bol postavený. Výsledok: BLOOM, 176 miliárd parametrov, 46 jazykov, 13 programovacích jazykov.
To, čo robí BLOOM historickým, nie je jeho veľkosť. Je to totálna transparentnosť: verejné trénovacie dáta, open source kód, kompletný tréningový log. Prvýkrát môžeme skutočne pochopiť, ako sa LLM narodil.
Meta Udrie Silou OPT
Takmer súčasne Meta AI spúšťa OPT (Open Pre-trained Transformer). Rovnaká veľkosť ako GPT-3, ale s jedným kľúčovým rozdielom: kompletná dokumentácia tréningového procesu.
Výskumníci môžu konečne študovať model tejto škály bez reverzného inžinierstva.
Galactica: Predzvesť
November 2022. Meta sa pokúša špecializovať AI pomocou Galactica, venovanej vedeckej literatúre. Model je stiahnutý do 48 hodín po kritike kvôli halucináciám.
Neúspech? Nie celkom. Galactica kladie základy pre tréning na špecializovaných korpusoch. Trend, ktorý exploduje o tri roky neskôr.
2023: Rok, keď Sa Všetko Zmenilo
24. Februára 2023: Efekt Llama
V ten deň Meta publikuje Llama. Model nie je určený pre širokú verejnosť — iba pre výskum. Ale jeho váhy uniknú online do dní.
Zápalná šnúra revolúcie.
Llama dokazuje, že skromnejší model (7 až 65 miliárd parametrov) trénovaný na viac tokenoch môže prekonať gigantov. Komunita ho okamžite prijíma.
| Model | Dátum | Kľúčová Inovácia | Licencia |
|---|---|---|---|
| Alpaca | Marec 2023 | Nákladovo efektívne doladenie cez self-instruct | Nekomerčná |
| Vicuna | Apríl 2023 | 90% kvality ChatGPT za 500 USD tréningových nákladov | Nekomerčná |
| Falcon 40B | Jún 2023 | Prvý open source model dominujúci benchmarkom | Apache 2.0 |
| Mistral 7B | Október 2023 | Extrémna efektivita cez Sliding Window Attention | Apache 2.0 |
| Mixtral 8x7B | December 2023 | Demokratizovaná Mixture of Experts (MoE) | Apache 2.0 |
QLoRA: Lokálna Demokratizácia
Apríl 2023. Jedna technika mení všetko: QLoRA (Quantized Low-Rank Adaptation).
Výsledok? Jemné doladenie modelu s 65 miliardami parametrov na jedinej konzumnej GPU. Malé firmy teraz môžu vytvárať vlastnú AI bez masívnej infraštruktúry.
Bariéry padajú jedna po druhej.
2024-2025: Technická Rovnováha
DeepSeek: Čína Vstupuje na Scénu
Leto 2024 znamená príchod nového významného hráča: DeepSeek, čínske laboratórium pridružené k High-Flyer Quant.
Ich majstrovský ťah? Ultra-efektívna MoE architektúra a mechanizmus MLA (Multi-head Latent Attention), ktorý znižuje potrebu pamäte KV cache o 93%.
Výsledok v januári 2025: DeepSeek-V3 dorovnáva GPT-4 za zlomok nákladov. Medzinárodná komunita objavuje, že open source už nie je nasledovník — je lídrom.
OpenAI Podľahne Tlaku
August 2025. OpenAI, po rokoch uzavretosti, publikuje GPT-OSS. Prvý model s otvorenými váhami od GPT-2. Optimalizovaný pre agentic workflows a dlhý kontext.
Prečo tento obrat? Konkurenčný tlak open source sa stal príliš silným. Keď bezplatné modely dorovnávajú tie vaše, uzavretosť už nestačí.
Meta Odpovedá Llama 4
Okamžitá odpoveď Meta: Llama 4. Nátívne multimodálny, schopný spracovať 10 miliónov tokenov kontextu.
Predstavte si: analýza celého kódového základu v jedinom dotaze. Teraz je to možné — a zadarmo.
Január 2026: Open Source Dominuje
Rebríček Najlepších Modelov
Tu sme dnes:
| Pozícia | Model | Vývojár | Skóre Kvality | Špecializácia |
|---|---|---|---|---|
| 1 | Kimi K2.5 (Reasoning) | Moonshot AI | 46,77 | Matematika, komplexné usudzovanie |
| 2 | GLM-4.7 (Thinking) | Zhipu AI | 41,70 | Programovanie, Vízia-Jazyk |
| 3 | DeepSeek V3.2 | DeepSeek | 41,20 | Efektivita, nízke náklady na inferenciu |
| 4 | GPT-OSS-120B | OpenAI | 40,50 | Používanie nástrojov, agentic |
| 5 | Llama 4 (70B) | Meta | 39,80 | Multimodálnosť, ekosystém |
| 6 | Qwen3-235B | Alibaba | 39,20 | Viacjazyčnosť, RAG |
Verdikt je brutálny: 5 zo 6 najlepších modelov sú open source. Iba GPT-OSS, irónicky, nesie meno bývalého proprietárneho lídra.
Inovácie, ktoré Zmenili Hru
MLA a DeepSeek Sparse Attention: Spracovanie miliónov kontextových tokenov vyžadovalo zakázanú pamäť KV cache. MLA agresívne komprimuje túto cache. DSA znižuje výpočtovú zložitosť spracovaním iba relevantných častí sekvencie.
BitNet 1.58b: Najradikálnejšia inovácia roku 2025. Namiesto kódovania váh na 16 bitov používa BitNet ternárne hodnoty {-1, 0, 1} — približne 1,58 bitu na parameter.
Dôsledok:
- 70-80% zníženie spotreby energie
- 2,3x až 6,1x zrýchlenie na štandardných procesoroch
- Model so 100 miliardami parametrov bežiaci na bežnom stolovom počítači
Súverenita AI už nie je sen. Je to technická realita.
Lokálna Inferencia sa Stáva Štandardom
RTX 5090: Srdce AI Pracovných Staníc
Začiatkom roku 2025 NVIDIA vydáva RTX 5090. 32 GB GDDR7 pamäte, priepustnosť 1,79 TB/s (+77% oproti predošlej generácii).
Výsledky na konzumnej karte:
- Llama 4 8B (4-bit): 180 tokenov/sekundu
- DeepSeek-R1 14B (4-bit): 89 tokenov/sekundu
- Qwen 2.5 32B (4-bit): 45 tokenov/sekundu
Modely 70B+ teraz bežia na lokálnych multi-GPU konfiguráciách s priemyselným výkonom.
vLLM vs Ollama
Dva ekosystémy dominujú:
- vLLM: Produkcia štandard. PagedAttention engine, optimalizovaná správa KV cache, viacero súčasných používateľov.
- Ollama: Obľúbené vývojárov. Extrémna jednoduchosť, nulová konfigurácia, natívna podpora macOS/Linux/Windows.
Agentická Éra: Od Chatu k Akcii
Devstral 2: AI v Službách Kódu
December 2025. Mistral AI spúšťa Devstral 2, 123 miliárd parametrov optimalizovaných pre vývoj softvéru.
Skóre SWE-bench Verified: 72,2%. Rovnaké ako Claude Sonnet 4, ale sedemkrát drahšie.
Cena: 0,40 $ za milión tokenov. Vývoj s podporou AI sa stáva ekonomicky uskutočniteľným pre malé firmy a freelancerov.
Vibe CLI: AI, ktorá Programuje Samá
V ten istý mesiac Mistral spúšťa Vibe CLI. Tento nástroj autonómne orcheštruje komplexné zmeny naprieč celými kódovými základňami.
Agentické modely z roku 2026 môžu:
- Navigovať v komplexných súborových systémoch
- Identifikovať závislosti medzi frameworkmi
- Detekovať zlyhania testov a samoopraviť sa
- Produkovť spoľahlivo štruktúrované JSON výstupy pre softvérovú integráciu
Prechádzame od “chat AI” k “action AI”.
Regulácia: Čo Zostáva z Otvoreného?
OSAID 1.0: Oficiálna Definícia
Október 2024. Open Source Initiative konečne publikuje oficiálnu definíciu Open Source AI.
Aby sa kvalifikovalo ako open source, systém musí garantovať štyri slobody: používať, študovať, upravovať a zdieľať. Tri kľúčové komponenty:
- Kód: Kompletný kód predtrénovania, filtrovania a inferencie
- Parametre: Váhy, nastavenia optimalizátora, konfigurácie architektúry
- Dáta: Podrobná dokumentácia o pôvode, výbere a spracovaní
Výsledok? Väčšina súčasných “open source” modelov nie je kompatibilná. Llama 4, Mistral, dokonca aj GPT-OSS postrádajú úplnú transparentnosť dát.
Iba Pythia (EleutherAI) a OLMo (AI2) získavajú označenie “skutočne open source”.
EU AI Act Štrukturuje Trh
Od februára 2025 platí EU AI Act. Open source modely profitujú z významných výnimiek — za predpokladu, že nie sú klasifikované ako “systémové riziko”.
Pre modely presahujúce 10^25 FLOPov platia povinnosti dokumentácie a kybernetickej bezpečnosti, nezávisle od licencie.
2026-2030: Čo Nás Čaká
Trendy, ktoré Nabúrajú Tvar
Post-Transformer: Nové architektúry vznikajú na zníženie kvadratickej zložitosti pozornosti. BitNet je len začiatok.
Edge AI: Modely ako Ministral 3B bežia na smartfónoch s masívnym kontextom. Domáca automatizácia a osobná robotika explodujú.
Suverenita Inteligencie: Firmy už nechcú “prenájmať” inteligenciu cez API. Chcú vlastniť vlastné digitálne mozgy, trénované na svojich priemyselných tajomstvách.
Multi-Agent Spolupráca: Budúcnosť spočíva v komunikácii medzi modelmi rôznych poskytovateľov. Riešenie problémov prostredníctvom spolupráce skôr než monolitickou hrubou silou.
Nový SEO Paradigma
Masívna integrácia LLM do vyhľadávačov transformovala online viditeľnosť. Teraz hovoríme o GEO (Generative Engine Optimization).
V roku 2026 približne 25% tradičného organického premávky zachytávajú AI-generované priame odpovede. Používatelia už neklikajú — čítajú syntézu.
Pre značku sa úspech už nemeria Google rankingom. Meria sa frekvenciou a stabilitou citácií v generatívnych odpovediach Gemini 3 alebo GPT-5.
A Teraz?
Open source ekosystém z roku 2026 dokázal jednu zásadnú vec: transparentnosť a spolupráca nie sú etické ideály, sú to nadradené konkurenčné výhody.
Zlomením monopolov inteligencie transformoval open source AI z exkluzívnej služby na globálnu verejnú infraštruktúru — rovnako fundamentálnu ako elektrina alebo internet.
Technická rovnováha je dosiahnutá. Ďalšia hranica? Totálna autonómia systémov v službách ľudstva.
Masívne generalistické modely sú dopĺňané, niekedy nahradzované, súhvezdiami špecializovaných, úspornejších, presnejších, suverénnejších modelov.
Open source zvíťazil. Zvyšok je len história.