A Transformer: Egy Találmány, amely Mindent Megváltoztatott
2017 júniusában nyolc Google-kutató tizenkétt oldalas cikket publikált. Még nem tudták, de épp meggyújtották egy forradalom kanócát, amely megváltoztatja az emberiséget.
A Transformer — így hívják — felváltotta a visszatérő neurális hálózatokat egy figyelem-mechanizmussal, amely lehetővé teszi az adatok tömeges párhuzamos feldolgozását. Ellentétben a korábbi architektúrákkal, amelyek szót szó után dolgoztak fel, a Transformer egyszerre látja az egész mondatot. Ez a különbség megváltoztat mindent.
Hat évvel később, 2026 januárjában az open source ökoszisztéma uralja a globális mesterséges intelligenciát. Ami egykor csak egy akadémiai kiegészítő volt a szabadalmaztatott óriásokhoz képest, az ipari innováció motorjává vált. Hogyan jutottunk el ide?
Az Első Úttörők (2018-2021)
GPT-2: A Szikra, amely Felébresztette a Közösséget
2018 júniusa. Az OpenAI kiadja a GPT-2-t. A modell ijesztő — annyira, hogy az OpenAI habozik nyilvánossá tenni. Az érvelésük? A koherens szöveg generálásának képessége dezinformációhoz vezethet.
Rossz számítás. A közösség nem tűri, hogy elrejtsék előlük a játékokat. Amikor a GPT-2 végül MIT licenc alatt megjelenik, a világ minden tájáról érkező kutatók megragadják. Egy kollektíva alakul: EleutherAI. A küldetésük? Bizonyítani, hogy milliárdos paraméterű modelleket lehet képeznie multinacionális erőforrások nélkül.
"Azt akartuk bizonyítani, hogy a nyílt tudománynak nem kell milliárdok dollár ahhoz, hogy előrehaladjon."
Google Visszavág a BERT és T5 Modellel
Addig a Google nem ül tétlenül. BERT (2018 október) forradalmasítja a kétirányú nyelvi megértést. T5 (2020 február) egy egységes keretrendszert javasol, ahol minden feladat szöveg-szöveg transzformációvá válik.
Ezek a modellek, az Apache 2.0 licenc alatt kiadva, több ezer akadémiai kutatási projekt alapjává válnak. Bizonyítanak egy lényeges dolgot: a tömeges előtanítás, majd finomhangolás a királyi út.
A Közösség Korai Siker
2021 márciusában az EleutherAI kiadja a GPT-Neo-t 2,7 milliárd paraméterrel. Ez egy technikai siker: a modell versenyez a korabeli GPT-3-mal, teljesen önkéntes munkával és adományozott számítási kapacitással képzve.
Az üzenet egyértelmű: az open source képes versenyezni az óriásokkal.
2022: A Nyílt Tudomány Nyomás Alatt
BigScience és BLOOM: Egy Egyedülálló Megközelítés
A 2022-es év fordulópontot jelent. Az OpenAI fizetős API-k mögé zárja modelljeit. A közösség másképp reagál.
A BigScience, a Hugging Face koordinálásával, 1000 kutatót gyűjt össze 60 országból. A céljuk? A valaha épített legnagyobb többnyelvű open source modell létrehozása. Az eredmény: BLOOM, 176 milliárd paraméter, 46 nyelv, 13 programozási nyelv.
Ami a BLOOM-ot történelmileg jelentőssé teszi, nem a mérete. Hanem a teljes átláthatóság: nyilvános tanító adatok, nyílt forráskódú kód, teljes tanítási napló. Először valóban megérthetjük, hogyan született meg egy LLM.
Meta Erőteljesen Belép az OPT-tel
Szinte egy időben az Meta AI elindítja az OPT-t (Open Pre-trained Transformer). Ugyanakkora, mint a GPT-3, de egy kulcsfontosságú különbséggel: a teljes tanítási folyamat dokumentációja.
A kutatók végre tanulmányozhatnak egy ilyen léptékű modellt reverz mérnökség nélkül.
Galactica: Egy Előjel
2022 november. A Meta megpróbálja specializálni az MI-t a Galactica-val, amely a tudományos irodalomnak szentelt. A modellt 48 órán belül visszavonják a hallucinációkkal kapcsolatos kritika miatt.
Kudarc? Nem egészen. A Galactica megalapozza a szakosított korpuszokon történő tanítást. Egy trend, amely három évvel később robban be.
2023: Az év, Amikor Minden Megváltozott
2023. Február 24: A Llama-jelenség
Ezen a napon a Meta kiadja a Llama-t. A modell nem a nagyközönségnek szól — csak kutatásra. De a súlyai napokon belül kiszivárognak online.
Egy forradalom kanóca.
A Llama bizonyítja, hogy egy szerényebb modell (7-65 milliárd paraméter), több tokenen tanítva, képes legyőzni az óriásokat. A közösség azonnal megragadja.
| Modell | Dátum | Kulcsfontosságú Újítás | Licenc |
|---|---|---|---|
| Alpaca | 2023 március | Alacsony költségű finomhangolás self-instruct-tel | Nem kereskedelmi |
| Vicuna | 2023 április | 90% ChatGPT minőség 500 USD tanítási költséggel | Nem kereskedelmi |
| Falcon 40B | 2023 június | Első open source modell, amely uralja a benchmarkokat | Apache 2.0 |
| Mistral 7B | 2023 október | Extrém hatékonyság Sliding Window Attention-nel | Apache 2.0 |
| Mixtral 8x7B | 2023 december | Demokratizált Mixture of Experts (MoE) | Apache 2.0 |
QLoRA: Helyi Demokratizálás
2023 áprilisa. Egy technika megváltoztat mindent: QLoRA (Quantized Low-Rank Adaptation).
Eredmény? Egy 65 milliárd paraméterű modell finomhangolása egyetlen fogyasztói GPU-n. Kisvállalkozások mostantól saját MI-t hozhatnak létre tömeges infrastruktúra nélkül.
Az akadályok egyesével dőlnek le.
2024-2025: Technikai Egyenlőség
DeepSeek: Kína Belép a Színtérre
A 2024-es nyár egy új fontos szereplő érkezését jelenti: DeepSeek, egy kínai laboratórium, amely a High-Flyer Quant-hoz tartozik.
A mesterfogásuk? Egy ultra-hatékony MoE architektúra és az MLA (Multi-head Latent Attention) mechanizmus, amely 93%-kal csökkenti a KV gyorsítótár memóriaigényét.
Eredmény 2025 januárjában: A DeepSeek-V3 egyenlővé válik a GPT-4-gyel a költség töredékéért. A nemzetközi közösség felfedezi, hogy az open source már nem követő — hanem vezető.
OpenAI Enged a Nyomásnak
2025 augusztusa. Az OpenAI, évek zárkózottsága után kiadja a GPT-OSS-t. Az első nyílt súlyú modell a GPT-2 óta. Optimalizált agentic munkafolyamatokhoz és hosszú kontextushoz.
Miért ez a fordulat? Az open source versenyképességi nyomása túl erős lett. Amikor az ingyenes modellek egyenlővé válnak a tiéddel, a zárkózottság már nem elegendő.
Meta Válaszol a Llama 4-gyel
A Meta azonnali válasza: Llama 4. Natívan multimodális, képes 10 millió kontextus token feldolgozására.
Képzeld el: egy egész kódbázis elemzése egyetlen lekérdezéssel. Most már lehetséges — és ingyenes.
2026 Január: Az Open Source Uralkodik
A Legjobb Modellek Ranglistája
Itt tartunk ma:
| Helyezés | Modell | Fejlesztő | Minőségi Pontszám | Specializáció |
|---|---|---|---|---|
| 1 | Kimi K2.5 (Reasoning) | Moonshot AI | 46,77 | Matematika, komplex érvelés |
| 2 | GLM-4.7 (Thinking) | Zhipu AI | 41,70 | Programozás, Látás-Nyelv |
| 3 | DeepSeek V3.2 | DeepSeek | 41,20 | Hatékonyság, alacsony következtetési költség |
| 4 | GPT-OSS-120B | OpenAI | 40,50 | Eszközhasználat, agentic |
| 5 | Llama 4 (70B) | Meta | 39,80 | Multimodalitás, ökoszisztéma |
| 6 | Qwen3-235B | Alibaba | 39,20 | Többnyelvűség, RAG |
Az ítélet kegyetlen: A legjobb 6 modellből 5 open source. Csak a GPT-OSS, ironikusan, viseli egy korábbi szabadalmaztatott vezető nevét.
A Játékot Megváltoztató Újítások
MLA és DeepSeek Sparse Attention: Milliónyi kontextus token kezelése tiltott KV gyorsítótár memóriát igényelt. Az MLA agresszíven tömöríti ezt a gyorsítótárat. A DSA csökkenti a számítási komplexitást azzal, hogy csak a releváns szekvenciarészeket dolgozza fel.
BitNet 1.58b: 2025 leginkább radikális újítása. Ahelyett, hogy a súlyokat 16 biten kódolná, a BitNet ternáris értékeket {-1, 0, 1} használ — körülbelül 1,58 bit paraméterenként.
Következmény:
- 70-80% energiafogyasztás csökkenés
- 2,3x-től 6,1x-ig gyorsulás szabványos CPU-kon
- Egy 100 milliárd paraméterű modell egy szabványos asztali számítógépen futtatva
Az MI szuverenitás már nem álom. Technikai valóság.
A Helyi Következtetés Szabvánnyá Vál
Az RTX 5090: Az MI Munkaállomások Szíve
2025 elején az NVIDIA kiadja az RTX 5090-et. 32 GB GDDR7 memória, 1,79 TB/s sávszélesség (+77% az előző generációhoz képest).
Eredmények egy fogyasztói kártyán:
- Llama 4 8B (4-bit): 180 token/másodperc
- DeepSeek-R1 14B (4-bit): 89 token/másodperc
- Qwen 2.5 32B (4-bit): 45 token/másodperc
70B+ modellek most már helyi multi-GPU konfigurációkon futnak ipari teljesítménnyel.
vLLM vs Ollama
Két ökoszisztéma uralja:
- vLLM: Gyártási szabvány. PagedAttention motor, optimalizált KV gyorsítótár kezelés, több egyidejű felhasználó.
- Ollama: Fejlesztők kedvence. Extrém egyszerűség, nulla konfiguráció, natív macOS/Linux/Windows támogatás.
Az Agentic Korszak: A Chat-től a Cselekvésig
Devstral 2: MI a Kód Szolgálatában
2025 decembere. A Mistral AI elindítja a Devstral 2-t, 123 milliárd paraméterrel, optimalizálva szoftverfejlesztésre.
SWE-bench Verified pontszám: 72,2%. Egyenlő a Claude Sonnet 4-gyel, mégis hétszer drágább.
Ár: 0,40 $ millió tokenenként. Az MI-támogatott fejlesztés gazdaságilag életképessé válik kis- és középvállalkozásoknak és függetleneknek.
Vibe CLI: MI, amely Egyedül Programozik
Ugyanebben a hónapban a Mistral kiadja a Vibe CLI-t. Ez az eszköz autonóm módon vezényel összetett változtatásokat egész kódbázisokon keresztül.
A 2026-os agentic modellek képesek:
- Navigálni összetett fájlrendszerekben
- Azonosítani függőségeket keretrendszerek között
- Detektálni tesztelési hibákat és önjavítani
- Megbízhatóan strukturált JSON kimeneteket produkálni szoftverintegrációhoz
A “chat MI”-ről áttérünk a “cselekvő MI”-re.
Szabályozás: Mi Marad a Nyíltból?
OSAID 1.0: A Hivatalos Meghatározás
2024 októbere. Az Open Source Initiative végül publikálja a Open Source AI hivatalos meghatározását.
Open source minősítéshez egy rendszernek garantálnia kell négy szabadságot: használat, tanulmányozás, módosítás és megosztás. Három alapvető összetevő:
- Kód: Teljes előtanítási, szűrési és következtetési kód
- Paraméterek: Súlyok, optimalizáló beállítások, architektúra konfigurációk
- Adatok: Részletes dokumentáció az eredetről, kiválasztásról és feldolgozásról
Eredmény? A legtöbb mai “open source” modell nem megfelelő. A Llama 4, a Mistral, még a GPT-OSS is hiányzik a teljes adatátláthatóságból.
Csak a Pythia (EleutherAI) és az OLMo (AI2) kapják meg a “valóban open source” címkét.
Az EU AI Act Strukturálja a Piacot
2025 februárjától EU AI Act hatályos. Az open source modellek jelentős kivételekre jogosultak — feltéve, hogy nem minősülnek “rendszeres kockázatnak”.
A 10^25 FLOP-ot meghaladó modellekre dokumentációs és kiberbiztonsági kötelezettségek vonatkoznak, függetlenül a licencetől.
2026-2030: Mi Vár Ránk
Alakuló Trendek
Post-Transformer: Új architektúrák jelennek meg a figyelem négyzetes komplexitásának csökkentésére. A BitNet csak a kezdet.
Edge AI: Olyan modellek, mint a Ministral 3B, okostelefonokon futnak masszív kontextussal. Az otthoni automatizálás és a személyes robotika berobban.
Intelligencia Szerverenitás: A vállalatok már nem akarnak “bérelni” intelligenciát API-kon keresztül. Saját digitális agyakat akarnak birtokolni, ipari titkaikon tanítva.
Multi-Agent Együttműködés: A jövő különböző szolgáltatók modelljei közötti kommunikációban rejlik. Problémamegoldás együttműködésen keresztül, monolitikus nyers erő helyett.
Az Új SEO Paradigma
Az LLM-ek tömeges integrációja a keresőmotorokba átalakította az online láthatóságot. Most GEO-ról (Generative Engine Optimization) beszélünk.
2026-ban a hagyományos organikus forgalom körülbelül 25%-át AI-generált közvetlen válaszok fogják el. A felhasználók már nem kattintanak — olvassák a szintézist.
Egy márka számára a sikert már nem a Google rangsorolás méri. A Gemini 3 vagy GPT-5 generatív válaszaiban történő idézések gyakorisága és stabilitása méri.
És Most?
A 2026-os open source ökoszisztéma bebizonyított egy alapvető dolgot: az átláthatóság és az együttműködés nem etikai ideálok, hanem felsőbbrendű versenyelőnyök.
Az intelligencia-monopóliumok megtörésével az open source az MI-t egy kizárólagos szolgáltatásból globális közhasznú infrastruktúrává alakította — olyan alapvetővé, mint az áram vagy az internet.
A technikai egyenlőség elérve. A következő határ? A rendszerek teljes autonómiája az emberiség szolgálatában.
A tömeges generalista modelleket speciálisabb, gazdaságosabb, pontosabb, szuverénebb modellek konstellációi egészítik ki, néha helyettesítik.
Az Open Source győzött. A többi csak történelem.