Az Open Source Győzött: Hogyan Hódította Meg a Szabad MI a Világot (2017-2026)

A Transformer: Egy Találmány, amely Mindent Megváltoztatott

2017 júniusában nyolc Google-kutató tizenkétt oldalas cikket publikált. Még nem tudták, de épp meggyújtották egy forradalom kanócát, amely megváltoztatja az emberiséget.

A Transformer — így hívják — felváltotta a visszatérő neurális hálózatokat egy figyelem-mechanizmussal, amely lehetővé teszi az adatok tömeges párhuzamos feldolgozását. Ellentétben a korábbi architektúrákkal, amelyek szót szó után dolgoztak fel, a Transformer egyszerre látja az egész mondatot. Ez a különbség megváltoztat mindent.

Hat évvel később, 2026 januárjában az open source ökoszisztéma uralja a globális mesterséges intelligenciát. Ami egykor csak egy akadémiai kiegészítő volt a szabadalmaztatott óriásokhoz képest, az ipari innováció motorjává vált. Hogyan jutottunk el ide?

2017

A Transformer éve

2023

A Llama-jelenség

2026

Technikai egyenlőség elérve

Az Első Úttörők (2018-2021)

GPT-2: A Szikra, amely Felébresztette a Közösséget

2018 júniusa. Az OpenAI kiadja a GPT-2-t. A modell ijesztő — annyira, hogy az OpenAI habozik nyilvánossá tenni. Az érvelésük? A koherens szöveg generálásának képessége dezinformációhoz vezethet.

Rossz számítás. A közösség nem tűri, hogy elrejtsék előlük a játékokat. Amikor a GPT-2 végül MIT licenc alatt megjelenik, a világ minden tájáról érkező kutatók megragadják. Egy kollektíva alakul: EleutherAI. A küldetésük? Bizonyítani, hogy milliárdos paraméterű modelleket lehet képeznie multinacionális erőforrások nélkül.

"Azt akartuk bizonyítani, hogy a nyílt tudománynak nem kell milliárdok dollár ahhoz, hogy előrehaladjon."

— Connor Leahy, az EleutherAI alapítója

Google Visszavág a BERT és T5 Modellel

Addig a Google nem ül tétlenül. BERT (2018 október) forradalmasítja a kétirányú nyelvi megértést. T5 (2020 február) egy egységes keretrendszert javasol, ahol minden feladat szöveg-szöveg transzformációvá válik.

Ezek a modellek, az Apache 2.0 licenc alatt kiadva, több ezer akadémiai kutatási projekt alapjává válnak. Bizonyítanak egy lényeges dolgot: a tömeges előtanítás, majd finomhangolás a királyi út.

A Közösség Korai Siker

2021 márciusában az EleutherAI kiadja a GPT-Neo-t 2,7 milliárd paraméterrel. Ez egy technikai siker: a modell versenyez a korabeli GPT-3-mal, teljesen önkéntes munkával és adományozott számítási kapacitással képzve.

Az üzenet egyértelmű: az open source képes versenyezni az óriásokkal.

2022: A Nyílt Tudomány Nyomás Alatt

BigScience és BLOOM: Egy Egyedülálló Megközelítés

A 2022-es év fordulópontot jelent. Az OpenAI fizetős API-k mögé zárja modelljeit. A közösség másképp reagál.

A BigScience, a Hugging Face koordinálásával, 1000 kutatót gyűjt össze 60 országból. A céljuk? A valaha épített legnagyobb többnyelvű open source modell létrehozása. Az eredmény: BLOOM, 176 milliárd paraméter, 46 nyelv, 13 programozási nyelv.

Ami a BLOOM-ot történelmileg jelentőssé teszi, nem a mérete. Hanem a teljes átláthatóság: nyilvános tanító adatok, nyílt forráskódú kód, teljes tanítási napló. Először valóban megérthetjük, hogyan született meg egy LLM.

Meta Erőteljesen Belép az OPT-tel

Szinte egy időben az Meta AI elindítja az OPT-t (Open Pre-trained Transformer). Ugyanakkora, mint a GPT-3, de egy kulcsfontosságú különbséggel: a teljes tanítási folyamat dokumentációja.

A kutatók végre tanulmányozhatnak egy ilyen léptékű modellt reverz mérnökség nélkül.

Galactica: Egy Előjel

2022 november. A Meta megpróbálja specializálni az MI-t a Galactica-val, amely a tudományos irodalomnak szentelt. A modellt 48 órán belül visszavonják a hallucinációkkal kapcsolatos kritika miatt.

Kudarc? Nem egészen. A Galactica megalapozza a szakosított korpuszokon történő tanítást. Egy trend, amely három évvel később robban be.

2023: Az év, Amikor Minden Megváltozott

2023. Február 24: A Llama-jelenség

Ezen a napon a Meta kiadja a Llama-t. A modell nem a nagyközönségnek szól — csak kutatásra. De a súlyai napokon belül kiszivárognak online.

Egy forradalom kanóca.

A Llama bizonyítja, hogy egy szerényebb modell (7-65 milliárd paraméter), több tokenen tanítva, képes legyőzni az óriásokat. A közösség azonnal megragadja.

Modell	Dátum	Kulcsfontosságú Újítás	Licenc
Alpaca	2023 március	Alacsony költségű finomhangolás self-instruct-tel	Nem kereskedelmi
Vicuna	2023 április	90% ChatGPT minőség 500 USD tanítási költséggel	Nem kereskedelmi
Falcon 40B	2023 június	Első open source modell, amely uralja a benchmarkokat	Apache 2.0
Mistral 7B	2023 október	Extrém hatékonyság Sliding Window Attention-nel	Apache 2.0
Mixtral 8x7B	2023 december	Demokratizált Mixture of Experts (MoE)	Apache 2.0

QLoRA: Helyi Demokratizálás

2023 áprilisa. Egy technika megváltoztat mindent: QLoRA (Quantized Low-Rank Adaptation).

Eredmény? Egy 65 milliárd paraméterű modell finomhangolása egyetlen fogyasztói GPU-n. Kisvállalkozások mostantól saját MI-t hozhatnak létre tömeges infrastruktúra nélkül.

Az akadályok egyesével dőlnek le.

2024-2025: Technikai Egyenlőség

DeepSeek: Kína Belép a Színtérre

A 2024-es nyár egy új fontos szereplő érkezését jelenti: DeepSeek, egy kínai laboratórium, amely a High-Flyer Quant-hoz tartozik.

A mesterfogásuk? Egy ultra-hatékony MoE architektúra és az MLA (Multi-head Latent Attention) mechanizmus, amely 93%-kal csökkenti a KV gyorsítótár memóriaigényét.

Eredmény 2025 januárjában: A DeepSeek-V3 egyenlővé válik a GPT-4-gyel a költség töredékéért. A nemzetközi közösség felfedezi, hogy az open source már nem követő — hanem vezető.

OpenAI Enged a Nyomásnak

2025 augusztusa. Az OpenAI, évek zárkózottsága után kiadja a GPT-OSS-t. Az első nyílt súlyú modell a GPT-2 óta. Optimalizált agentic munkafolyamatokhoz és hosszú kontextushoz.

Miért ez a fordulat? Az open source versenyképességi nyomása túl erős lett. Amikor az ingyenes modellek egyenlővé válnak a tiéddel, a zárkózottság már nem elegendő.

Meta Válaszol a Llama 4-gyel

A Meta azonnali válasza: Llama 4. Natívan multimodális, képes 10 millió kontextus token feldolgozására.

Képzeld el: egy egész kódbázis elemzése egyetlen lekérdezéssel. Most már lehetséges — és ingyenes.

2026 Január: Az Open Source Uralkodik

A Legjobb Modellek Ranglistája

Itt tartunk ma:

Helyezés	Modell	Fejlesztő	Minőségi Pontszám	Specializáció
1	Kimi K2.5 (Reasoning)	Moonshot AI	46,77	Matematika, komplex érvelés
2	GLM-4.7 (Thinking)	Zhipu AI	41,70	Programozás, Látás-Nyelv
3	DeepSeek V3.2	DeepSeek	41,20	Hatékonyság, alacsony következtetési költség
4	GPT-OSS-120B	OpenAI	40,50	Eszközhasználat, agentic
5	Llama 4 (70B)	Meta	39,80	Multimodalitás, ökoszisztéma
6	Qwen3-235B	Alibaba	39,20	Többnyelvűség, RAG

Az ítélet kegyetlen: A legjobb 6 modellből 5 open source. Csak a GPT-OSS, ironikusan, viseli egy korábbi szabadalmaztatott vezető nevét.

A Játékot Megváltoztató Újítások

MLA és DeepSeek Sparse Attention: Milliónyi kontextus token kezelése tiltott KV gyorsítótár memóriát igényelt. Az MLA agresszíven tömöríti ezt a gyorsítótárat. A DSA csökkenti a számítási komplexitást azzal, hogy csak a releváns szekvenciarészeket dolgozza fel.

BitNet 1.58b: 2025 leginkább radikális újítása. Ahelyett, hogy a súlyokat 16 biten kódolná, a BitNet ternáris értékeket {-1, 0, 1} használ — körülbelül 1,58 bit paraméterenként.

Következmény:

70-80% energiafogyasztás csökkenés
2,3x-től 6,1x-ig gyorsulás szabványos CPU-kon
Egy 100 milliárd paraméterű modell egy szabványos asztali számítógépen futtatva

Az MI szuverenitás már nem álom. Technikai valóság.

A Helyi Következtetés Szabvánnyá Vál

Az RTX 5090: Az MI Munkaállomások Szíve

2025 elején az NVIDIA kiadja az RTX 5090-et. 32 GB GDDR7 memória, 1,79 TB/s sávszélesség (+77% az előző generációhoz képest).

Eredmények egy fogyasztói kártyán:

Llama 4 8B (4-bit): 180 token/másodperc
DeepSeek-R1 14B (4-bit): 89 token/másodperc
Qwen 2.5 32B (4-bit): 45 token/másodperc

70B+ modellek most már helyi multi-GPU konfigurációkon futnak ipari teljesítménnyel.

vLLM vs Ollama

Két ökoszisztéma uralja:

vLLM: Gyártási szabvány. PagedAttention motor, optimalizált KV gyorsítótár kezelés, több egyidejű felhasználó.
Ollama: Fejlesztők kedvence. Extrém egyszerűség, nulla konfiguráció, natív macOS/Linux/Windows támogatás.

Az Agentic Korszak: A Chat-től a Cselekvésig

Devstral 2: MI a Kód Szolgálatában

2025 decembere. A Mistral AI elindítja a Devstral 2-t, 123 milliárd paraméterrel, optimalizálva szoftverfejlesztésre.

SWE-bench Verified pontszám: 72,2%. Egyenlő a Claude Sonnet 4-gyel, mégis hétszer drágább.

Ár: 0,40 $ millió tokenenként. Az MI-támogatott fejlesztés gazdaságilag életképessé válik kis- és középvállalkozásoknak és függetleneknek.

Vibe CLI: MI, amely Egyedül Programozik

Ugyanebben a hónapban a Mistral kiadja a Vibe CLI-t. Ez az eszköz autonóm módon vezényel összetett változtatásokat egész kódbázisokon keresztül.

A 2026-os agentic modellek képesek:

Navigálni összetett fájlrendszerekben
Azonosítani függőségeket keretrendszerek között
Detektálni tesztelési hibákat és önjavítani
Megbízhatóan strukturált JSON kimeneteket produkálni szoftverintegrációhoz

A “chat MI”-ről áttérünk a “cselekvő MI”-re.

Szabályozás: Mi Marad a Nyíltból?

OSAID 1.0: A Hivatalos Meghatározás

2024 októbere. Az Open Source Initiative végül publikálja a Open Source AI hivatalos meghatározását.

Open source minősítéshez egy rendszernek garantálnia kell négy szabadságot: használat, tanulmányozás, módosítás és megosztás. Három alapvető összetevő:

Kód: Teljes előtanítási, szűrési és következtetési kód
Paraméterek: Súlyok, optimalizáló beállítások, architektúra konfigurációk
Adatok: Részletes dokumentáció az eredetről, kiválasztásról és feldolgozásról

Eredmény? A legtöbb mai “open source” modell nem megfelelő. A Llama 4, a Mistral, még a GPT-OSS is hiányzik a teljes adatátláthatóságból.

Csak a Pythia (EleutherAI) és az OLMo (AI2) kapják meg a “valóban open source” címkét.

Az EU AI Act Strukturálja a Piacot

2025 februárjától EU AI Act hatályos. Az open source modellek jelentős kivételekre jogosultak — feltéve, hogy nem minősülnek “rendszeres kockázatnak”.

A 10^25 FLOP-ot meghaladó modellekre dokumentációs és kiberbiztonsági kötelezettségek vonatkoznak, függetlenül a licencetől.

2026-2030: Mi Vár Ránk

Alakuló Trendek

Post-Transformer: Új architektúrák jelennek meg a figyelem négyzetes komplexitásának csökkentésére. A BitNet csak a kezdet.

Edge AI: Olyan modellek, mint a Ministral 3B, okostelefonokon futnak masszív kontextussal. Az otthoni automatizálás és a személyes robotika berobban.

Intelligencia Szerverenitás: A vállalatok már nem akarnak “bérelni” intelligenciát API-kon keresztül. Saját digitális agyakat akarnak birtokolni, ipari titkaikon tanítva.

Multi-Agent Együttműködés: A jövő különböző szolgáltatók modelljei közötti kommunikációban rejlik. Problémamegoldás együttműködésen keresztül, monolitikus nyers erő helyett.

Az Új SEO Paradigma

Az LLM-ek tömeges integrációja a keresőmotorokba átalakította az online láthatóságot. Most GEO-ról (Generative Engine Optimization) beszélünk.

2026-ban a hagyományos organikus forgalom körülbelül 25%-át AI-generált közvetlen válaszok fogják el. A felhasználók már nem kattintanak — olvassák a szintézist.

Egy márka számára a sikert már nem a Google rangsorolás méri. A Gemini 3 vagy GPT-5 generatív válaszaiban történő idézések gyakorisága és stabilitása méri.

És Most?

A 2026-os open source ökoszisztéma bebizonyított egy alapvető dolgot: az átláthatóság és az együttműködés nem etikai ideálok, hanem felsőbbrendű versenyelőnyök.

Az intelligencia-monopóliumok megtörésével az open source az MI-t egy kizárólagos szolgáltatásból globális közhasznú infrastruktúrává alakította — olyan alapvetővé, mint az áram vagy az internet.

A technikai egyenlőség elérve. A következő határ? A rendszerek teljes autonómiája az emberiség szolgálatában.

A tömeges generalista modelleket speciálisabb, gazdaságosabb, pontosabb, szuverénebb modellek konstellációi egészítik ki, néha helyettesítik.

Az Open Source győzött. A többi csak történelem.