Přejít na hlavní obsah
Back to Insights
Open Source LLM DeepSeek Llama Mistral Kimi Transformer Suverenita AI

Open Source Zvítězil: Jak Svobodná AI Dobyla Svět (2017-2026)

By Yoram Halberstam 35 min read

Transformer: Vynález, který Změnil Vše

V červnu 2017 publikovalo osm výzkumníků z Google dvanáctistránkový článek. Ještě to nevěděli, ale právě zapálili zápalnou šňůru revoluce, která změní lidstvo.

Transformer — tak se jmenuje — nahradil rekurentní neuronové sítě mechanismem pozornosti, který umožňuje masivní paralelizaci zpracování dat. Na rozdíl od předchozích architektur, které zpracovávaly slova jedno po druhém, Transformer vidí celou větu najednou. Tento jemný rozdíl změní vše.

Šest let později, v lednu 2026, dominuje open source ekosystém globální umělé inteligenci. To, co bylo kdysi pouze akademickým doplňkem proprietárních gigantů, se stalo motorem průmyslových inovací. Jak jsme se sem dostali?

2017
Rok Transformeru
2023
Efekt Llama
2026
Dosažena technická rovnováha

První Průkopníci (2018-2021)

GPT-2: Jiskra, která Probudila Komunitu

Červen 2018. OpenAI publikuje GPT-2. Model je děsivý — natolik, že OpenAI váhá s jeho zveřejněním. Jejich argument? Schopnost generovat koherentní text by mohla sloužit dezinformacím.

Špatný výpočet. Komunita netoleruje, že jí berou hračky. Když je GPT-2 konečně vydáno pod licencí MIT, výzkumníci z celého světa ho okamžitě přijímají. Vytváří se kolektiv: EleutherAI. Jejich mise? Dokázat, že lze trénovat modely s miliardami parametrů bez prostředků nadnárodní společnosti.

"Chtěli jsme dokázat, že otevřená věda nepotřebuje miliardy dolarů, aby se mohla rozvíjet."

— Connor Leahy, zakladatel EleutherAI

Google Odpovídá s BERT a T5

Mezitím Google nezůstává nečinný. BERT (říjen 2018) revolucionizuje obousměrné porozumění jazyku. T5 (únor 2020) navrhuje jednotný rámec, kde se každý úkol stává transformací textu na text.

Tyto modely, publikované pod licencí Apache 2.0, se stávají základem tisíců akademických výzkumných projektů. Dokazují jednu zásadní věc: masivní předtrénování následované jemným doladěním je královská cesta.

První Úspěchy Komunity

V březnu 2021 publikuje EleutherAI GPT-Neo s 2,7 miliardami parametrů. Je to technický úspěch: model konkuruje tehdejšímu GPT-3, plně natrénovaný na darované výpočetní síle a dobrovolnické práci.

Zpráva je jasná: open source může konkurovat gigantům.

2022: Otevřená Věda Pod Tlakem

BigScience a BLOOM: Bezprecedentní Přístup

Rok 2022 znamená zlom. OpenAI uzavírá své modely za placenými API. Komunita reaguje jinak.

BigScience, koordinovaný Hugging Face, shromažďuje 1000 výzkumníků z 60 zemí. Jejich cíl? Vytvořit největší vícejazyčný open source model, jaký kdy byl postaven. Výsledek: BLOOM, 176 miliard parametrů, 46 jazyků, 13 programovacích jazyků.

To, co činí BLOOM historickým, není jeho velikost. Je to totální transparentnost: veřejná trénovací data, open source kód, kompletní tréninkový log. Poprvé můžeme skutečně pochopit, jak se LLM narodil.

Meta Udeří Se Silou OPT

Téměř současně spouští Meta AI OPT (Open Pre-trained Transformer). Stejná velikost jako GPT-3, ale s jedním klíčovým rozdílem: kompletní dokumentace tréninkového procesu.

Výzkumníci konečně mohou studovat model této škály bez reverzního inženýrství.

Galactica: Předzvěst

Listopad 2022. Meta se pokouší specializovat AI pomocí Galactica, věnované vědecké literatuře. Model je stažen během 48 hodin po kritice ohledně halucinací.

Neúspěch? Ne zcela. Galactica položila základy pro trénink na specializovaných korpusech. Trend, který exploduje o tři roky později.

2023: Rok, Kdy Se Vše Změnilo

24. Února 2023: Efekt Llama

Tento den publikuje Meta Llama. Model není určen pro širokou veřejnost — pouze pro výzkum. Ale jeho váhy uniknou online během dnů.

Zápalná šňůra revoluce.

Llama dokazuje, že skromnější model (7 až 65 miliard parametrů) natrénovaný na více tokenech může překonat giganty. Komunita ho okamžitě přijímá.

Model Datum Klíčová Inovace Licence
Alpaca Březen 2023 Nákladově efektivní doladění přes self-instruct Nekomerční
Vicuna Duben 2023 90% kvality ChatGPT za 500 USD tréninkových nákladů Nekomerční
Falcon 40B Červen 2023 První open source model dominující benchmarkům Apache 2.0
Mistral 7B Říjen 2023 Extrémní efektivita přes Sliding Window Attention Apache 2.0
Mixtral 8x7B Prosinec 2023 Demokratizovaná Mixture of Experts (MoE) Apache 2.0

QLoRA: Lokální Demokratizace

Duben 2023. Jedna technika mění vše: QLoRA (Quantized Low-Rank Adaptation).

Výsledek? Jemné doladění modelu s 65 miliardami parametrů na jediné konzumní GPU. Malé firmy nyní mohou vytvářet vlastní AI bez masivní infrastruktury.

Bariéry padají jedna po druhé.

2024-2025: Technická Rovnováha

DeepSeek: Čína Vstupuje na Scénu

Léto 2024 znamená příchod nového významného hráče: DeepSeek, čínské laboratoře přidružené k High-Flyer Quant.

Jejich mistrovský tah? Ultra-efektivní MoE architektura a mechanismus MLA (Multi-head Latent Attention), který snižuje potřebu KV-cache paměti o 93%.

Výsledek v lednu 2025: DeepSeek-V3 dorovnává GPT-4 za zlomek nákladů. Mezinárodní komunita objevuje, že open source už není následovník — je lídrem.

OpenAI Podléhá Tlaku

Srpen 2025. OpenAI, po letech uzavřenosti, publikuje GPT-OSS. První model s otevřenými váhami od GPT-2. Optimalizovaný pro agentní workflow a dlouhý kontext.

Proč tento obrat? Konkurenční tlak open source se stal příliš silným. Když volné modely dorovnávají ty vaše, uzavřenost už nestačí.

Meta Odpovídá Llama 4

Okamžitá odpověď Meta: Llama 4. Nativně multimodální, schopný zpracovat 10 milionů tokenů kontextu.

Představte si: analyzovat celou kódovou základnu v jediném dotazu. Nyní je to možné — a zdarma.

Leden 2026: Open Source Dominuje

Žebříček Nejlepších Modelů

Zde jsme dnes:

Pozice Model Vývojář Skóre Kvality Specializace
1 Kimi K2.5 (Reasoning) Moonshot AI 46,77 Matematika, komplexní uvažování
2 GLM-4.7 (Thinking) Zhipu AI 41,70 Programování, Vize-Jazyk
3 DeepSeek V3.2 DeepSeek 41,20 Efektivita, nízké náklady na inference
4 GPT-OSS-120B OpenAI 40,50 Používání nástrojů, agentní schopnosti
5 Llama 4 (70B) Meta 39,80 Multimodálnost, ekosystém
6 Qwen3-235B Alibaba 39,20 Vícejazyčnost, RAG

Verdikt je brutální: 5 z 6 nejlepších modelů jsou open source. Pouze GPT-OSS, ironicky, nese jméno bývalého proprietárního lídra.

Inovace, které Změnily Hru

MLA a DeepSeek Sparse Attention: Zpracování milionů kontextových tokenů vyžadovalo zakázanou KV-cache paměť. MLA agresivně komprimuje tuto cache. DSA snižuje výpočetní složitost zpracováním pouze relevantních částí sekvence.

BitNet 1.58b: Nejradikálnější inovace roku 2025. Místo kódování vah na 16 bitů používá BitNet ternární hodnoty {-1, 0, 1} — přibližně 1,58 bitu na parametr.

Důsledek:

  • 70–80% snížení spotřeby energie
  • 2,3x až 6,1x zrychlení na standardních procesorech
  • Model s 100 miliardami parametrů běžící na standardním stolním počítači

Suverenita AI už není sen. Je to technická realita.

Lokální Inference se Stává Standardem

RTX 5090: Srdce AI Pracovních Stanic

Na začátku roku 2025 NVIDIA vydává RTX 5090. 32 GB GDDR7 paměti, 1,79 TB/s šířka pásma (+77% oproti předchozí generaci).

Výsledky na konzumní kartě:

  • Llama 4 8B (4-bit): 180 tokenů/sekundu
  • DeepSeek-R1 14B (4-bit): 89 tokenů/sekundu
  • Qwen 2.5 32B (4-bit): 45 tokenů/sekundu

Modely 70B+ nyní běží na lokálních multi-GPU konfiguracích s průmyslovým výkonem.

vLLM vs Ollama

Dva ekosystémy dominují:

  • vLLM: Produční standard. PagedAttention engine, optimalizovaná správa KV-cache, více současných uživatelů.
  • Ollama: Oblíbený vývojářů. Extrémní jednoduchost, nulová konfigurace, nativní podpora macOS/Linux/Windows.

Agentní Éra: Od Chatu k Akci

Devstral 2: AI ve Službách Kódu

Prosinec 2025. Mistral AI spouští Devstral 2, 123 miliardy parametrů optimalizovaných pro vývoj softwaru.

Skóre SWE-bench Verified: 72,2%. Stejné jako Claude Sonnet 4, ale sedmkrát dražší.

Cena: 0,40 USD za milion tokenů. Vývoj s podporou AI se stává ekonomicky uskutečnitelným pro malé firmy a freelancery.

Vibe CLI: AI, která Programuje Sama

Ve stejném měsíci spouští Mistral Vibe CLI. Tento nástroj autonomně orchestruje komplexní změny napříč celými kódovými základnami.

Agentní modely z roku 2026 mohou:

  • Navigovat složitými souborovými systémy
  • Identifikovat závislosti mezi frameworky
  • Detekovat selhání testů a samoopravit se
  • Spolehlivě produkovat strukturované JSON výstupy pro softwarovou integraci

Přecházíme od “chat AI” k “akční AI”.

Regulace: Co Zbývá z Otevřenosti?

OSAID 1.0: Oficiální Definice

Říjen 2024. Open Source Initiative konečně publikuje oficiální definici Open Source AI.

Aby se kvalifikoval jako open source, musí systém zaručit čtyři svobody: používat, studovat, upravovat a sdílet. Tři klíčové komponenty:

  1. Kód: Kompletní kód předtrénování, filtrování a inference
  2. Parametry: Váhy, nastavení optimalizátoru, konfigurace architektury
  3. Data: Podrobná dokumentace o původu, výběru a zpracování

Výsledek? Většina současných “open source” modelů není kompatibilní. Llama 4, Mistral, dokonce i GPT-OSS postrádají totální transparentnost dat.

Pouze Pythia (EleutherAI) a OLMo (AI2) získávají označení “skutečně open source”.

EU AI Act Strukturuje Trh

Od února 2025 platí EU AI Act. Open source modely těží z významných výjimek — za předpokladu, že nejsou klasifikovány jako “systémové riziko”.

Pro modely přesahující 10^25 FLOPs platí povinnosti dokumentace a kybernetické bezpečnosti, bez ohledu na licenci.

2026-2030: Co Nás Čeká

Trendy, které Nabírají Tvar

Post-Transformer: Nové architektury vznikají ke snížení kvadratické složitosti pozornosti. BitNet je jen začátek.

Edge AI: Modely jako Ministral 3B běží na smartphonech s masivním kontextem. Domácí automatizace a osobní robotika explodují.

Suverenita Inteligence: Firmy už nechtějí “pronajímat” inteligenci přes API. Chtějí vlastnit vlastní digitální mozky, trénované na svých průmyslových tajemstvích.

Multi-Agent Spolupráce: Budoucnost spočívá v komunikaci mezi modely různých poskytovatelů. Řešení problémů prostřednictvím spolupráce spíše než monolitické hrubé síly.

Nový SEO Paradigma

Masivní integrace LLM do vyhledávačů transformovala online viditelnost. Nyní hovoříme o GEO (Generative Engine Optimization).

V roce 2026 je přibližně 25% tradičního organického provozu zachyceno AI generovanými přímými odpověďmi. Uživatelé už neklikají — čtou syntézu.

Pro značku se úspěch už neměří Google rankingem. Měří se frekvencí a stabilitou citací v generativních odpovědích Gemini 3 nebo GPT-5.

A Teď Co?

Open source ekosystém z roku 2026 dokázal jednu zásadní věc: transparentnost a spolupráce nejsou etická ideála, jsou to superiorní konkurenční výhody.

Rozbitím monopolů inteligence transformoval open source AI z exkluzivní služby na globální veřejnou infrastrukturu — stejně fundamentální jako elektřina nebo internet.

Technická rovnováha je dosažena. Další hranice? Totální autonomie systémů ve službách lidstva.

Masivní generalistické modely jsou doplňovány, někdy nahrazovány, souhvězdími specializovaných, úspornějších, přesnějších, suverénnějších modelů.

Open source zvítězil. Zbytek je jen historie.

Obsah