Transformer: Pronalazak koji je Promijenio Sve
U lipnju 2017. godine, osam Googleovih istraživača objavilo je dvanaestostranični članak. Još nisu znali, ali upravo su zapalili fitilj revolucije koja će transformirati čovječanstvo.
Transformer — tako se zove — zamijenio je povratne neuronske mreže mehanizmom pozornosti koji omogućuje masivnu paralelnu obradu podataka. Za razliku od prethodnih arhitektura koje su obrađivale riječi jednu po jednu, Transformer vidi cijelu rečenicu odjednom. Ta suptilna razlika mijenja sve.
Šest godina kasnije, u siječnju 2026. godine, open source ekosustav dominira globalnom umjetnom inteligencijom. Ono što je nekoć bilo samo akademski dodatak vlasničkim divovima postalo je pokretač industrijske inovacije. Kako smo stigli dovde?
Prvi Pioniri (2018-2021)
GPT-2: Iskra koja je Probudila Zajednicu
Lipanj 2018. OpenAI objavljuje GPT-2. Model je zastrašujući — toliko da OpenAI oklijeva učiniti ga javnim. Njihov argument? Sposobnost generiranja koherentnog teksta mogla bi služiti dezinformacijama.
Loš proračun. Zajednica ne tolerira da joj se skrivaju igračke. Kada GPT-2 konačno izlazi pod MIT licencom, istraživači diljem svijeta ga zgrabljuju. Formira se kolektiv: EleutherAI. Njihova misija? Dokazati da se modeli s milijardama parametara mogu trenirati bez resursa multinacionalne tvrtke.
"Željeli smo dokazati da otvorena znanost ne treba milijarde dolara da bi napredovala."
Google Odgovara s BERT-om i T5
U međuvremenu, Google ne sjedi skrštenih ruku. BERT (listopad 2018.) revolucionira dvosmjerno razumijevanje jezika. T5 (veljača 2020.) predlaže ujedinjeni okvir gdje svaki zadatak postaje tekst-u-tekst transformacija.
Ovi modeli, objavljeni pod Apache 2.0 licencom, postaju temelj tisuća akademskih istraživačkih projekata. Dokazuju jednu bitnu stvar: masivno pretreniranje praćeno finim podešavanjem je kraljevski put.
Rani Uspjesi Zajednice
U ožujku 2021., EleutherAI objavljuje GPT-Neo s 2,7 milijardi parametara. To je tehnički uspjeh: model se ravna s tadašnjim GPT-3, u potpunosti treniran na doniranoj računalnoj snazi i volonterskom radu.
Poruka je jasna: open source može parirati divovima.
2022: Otvorena Znanost Pod Pritiskom
BigScience i BLOOM: Nezapamćen Pristup
Godina 2022. označava prekretnicu. OpenAI zatvara svoje modele iza plaćenih API-ja. Zajednica reagira drugačije.
BigScience, koordiniran od strane Hugging Face-a, okuplja 1000 istraživača iz 60 zemalja. Njihov cilj? Stvoriti najveći višejezični open source model ikad izgrađen. Rezultat: BLOOM, 176 milijardi parametara, 46 jezika, 13 programskih jezika.
Ono što čini BLOOM povijesnim nije njegova veličina. Već potpuna transparentnost: javni podaci za treniranje, open source kôd, potpuni dnevnik treniranja. Prvi put možemo zaista razumjeti kako se rodio LLM.
Meta Udara Snažno s OPT-om
Gotovo istovremeno, Meta AI pokreće OPT (Open Pre-trained Transformer). Ista veličina kao GPT-3, ali s jednom ključnom razlikom: potpuna dokumentacija procesa treniranja.
Istraživači konačno mogu proučavati model ove veličine bez obrnutog inženjeringa.
Galactica: Predosjećaj
Studeni 2022. Meta pokušava specijalizirati AI s Galacticom, posvećenom znanstvenoj literaturi. Model se povlači unutar 48 sati nakon kritika zbog halucinacija.
Neuspjeh? Ne baš. Galactica postavlja temelje za treniranje na specijaliziranim korpusima. Trend koji će eksplodirati tri godine kasnije.
2023: Godina u kojoj se Sve Promijenilo
24. Veljače 2023.: Llama Efekt
Tog dana, Meta objavljuje Llama. Model nije namijenjen širokoj javnosti — samo istraživanju. Ali njegove težine procuri online unutar dana.
Okidač revolucije.
Llama dokazuje da skromniji model (7 do 65 milijardi parametara) treniran na više tokena može nadmašiti divove. Zajednica ga trenutno usvaja.
| Model | Datum | Ključna Inovacija | Licencija |
|---|---|---|---|
| Alpaca | Ožujak 2023. | Fino podešavanje niskih troškova putem self-instruct | Ne-komercijalna |
| Vicuna | Travanj 2023. | 90% ChatGPT kvalitete za 500 USD troškova treninga | Ne-komercijalna |
| Falcon 40B | Lipanj 2023. | Prvi open source model koji dominira benchmarkovima | Apache 2.0 |
| Mistral 7B | Listopad 2023. | Ekstremna učinkovitost putem Sliding Window Attention | Apache 2.0 |
| Mixtral 8x7B | Prosinac 2023. | Demokratizirana Mixture of Experts (MoE) | Apache 2.0 |
QLoRA: Lokalna Demokratizacija
Travanj 2023. Jedna tehnika mijenja sve: QLoRA (Quantized Low-Rank Adaptation).
Rezultat? Fino podešavanje modela s 65 milijardi parametara na jednoj potrošačkoj GPU. Mali biznisi sada mogu stvoriti vlastiti AI bez masivne infrastrukture.
Barijere padaju jedna po jedna.
2024-2025: Tehnička Ravnopravnost
DeepSeek: Kina Ulazi na Pozornicu
Ljeto 2024. označava dolazak novog značajnog igrača: DeepSeek, kineski laboratorij povezan s High-Flyer Quant.
Njihov majstorski potez? Ultra-učinkovita MoE arhitektura i MLA (Multi-head Latent Attention) mehanizam koji smanjuje potrebe za memorijom KV cache za 93%.
Rezultat u siječnju 2025.: DeepSeek-V3 izjednačava se s GPT-4 uz djelić troškova. Međunarodna zajednica otkriva da open source više nije slijedbenik — već vođa.
OpenAI Popušta Pod Pritiskom
Kolovoz 2025. OpenAI, nakon godina zatvorenosti, objavljuje GPT-OSS. Prvi model s otvorenim težinama od GPT-2. Optimiziran za agentne radne tokove i dugi kontekst.
Zašto ovaj zaokret? Konkurentni pritisak open source postao je prejak. Kada besplatni modeli izjednačavaju vaše, zatvaranje više nije dovoljno.
Meta Odgovara s Llama 4
Nemjedi odgovor Meta-e: Llama 4. Nativno multimodalna, sposobna obraditi 10 milijuna tokena konteksta.
Zamislite: analiza cijele baze koda u jednom upitu. Sada je to moguće — i besplatno.
Siječanj 2026.: Open Source Vladara
Ljestvica Najboljih Modela
Evo gdje smo danas:
| Mjesto | Model | Developer | Kvalitetni Rezultat | Specijalizacija |
|---|---|---|---|---|
| 1 | Kimi K2.5 (Reasoning) | Moonshot AI | 46,77 | Matematika, kompleksno zaključivanje |
| 2 | GLM-4.7 (Thinking) | Zhipu AI | 41,70 | Kodiranje, Vid-Jezik |
| 3 | DeepSeek V3.2 | DeepSeek | 41,20 | Učinkovitost, niski trošak zaključivanja |
| 4 | GPT-OSS-120B | OpenAI | 40,50 | Korištenje alata, agentnost |
| 5 | Llama 4 (70B) | Meta | 39,80 | Multimodalnost, ekosustav |
| 6 | Qwen3-235B | Alibaba | 39,20 | Višejezičnost, RAG |
Presuda je brutalna: 5 od 6 najboljih modela su open source. Samo GPT-OSS, ironično, nosi ime bivšeg vlasničkog vođe.
Inovacije koje su Promijenile Igru
MLA i DeepSeek Sparse Attention: Rukovanje milijunima tokena konteksta zahtijevalo je zabranjenu memoriju KV cache. MLA agresivno komprimira ovu cache memoriju. DSA smanjuje složenost izračuna obrađujući samo relevantne dijelove sekvence.
BitNet 1.58b: Najradikalnija inovacija 2025. Umjesto kodiranja težina na 16 bitova, BitNet koristi ternarne vrijednosti {-1, 0, 1} — otprilike 1,58 bita po parametru.
Posljedica:
- 70-80% smanjenje potrošnje energije
- 2,3x do 6,1x ubrzanje na standardnim CPU-ima
- Model s 100 milijardi parametara koji radi na standardnom stolnom računalu
AI suverenost više nije san. To je tehnička stvarnost.
Lokalno Zaključivanje Postaje Standard
RTX 5090: Srce AI Radnih Stanica
Početkom 2025., NVIDIA lansira RTX 5090. 32 GB GDDR7 memorije, propusnost od 1,79 TB/s (+77% u odnosu na prethodnu generaciju).
Rezultati na potrošačkoj kartici:
- Llama 4 8B (4-bit): 180 tokena/sekundu
- DeepSeek-R1 14B (4-bit): 89 tokena/sekundu
- Qwen 2.5 32B (4-bit): 45 tokena/sekundu
Modeli 70B+ sada rade na lokalnim multi-GPU konfiguracijama s industrijskim performansama.
vLLM vs Ollama
Dva ekosustava dominiraju:
- vLLM: Produkcijski standard. PagedAttention engine, optimizirano upravljanje KV cache memorijom, više istovremenih korisnika.
- Ollama: Omiljeni developera. Ekstremna jednostavnost, nula konfiguracije, nativna podrška za macOS/Linux/Windows.
Agentna Era: Od Chata do Akcije
Devstral 2: AI u Službi Koda
Prosinac 2025. Mistral AI pokreće Devstral 2, 123 milijarde parametara optimiziranih za razvoj softvera.
SWE-bench Verified rezultat: 72,2%. Jednak Claude Sonnet 4, ali sedam puta skuplji.
Cijena: 0,40 $ po milijunu tokena. AI-potpomognuti razvoj postaje ekonomski isplativ za male biznise i neovisne.
Vibe CLI: AI koja Kodira Samostalno
Isti mjesec, Mistral objavljuje Vibe CLI. Ovaj alat autonomno orkestrira složene promjene u cijelim bazama koda.
Agentni modeli 2026. mogu:
- Navigirati složenim datotečnim sustavima
- Identificirati ovisnosti među okvirima
- Detektirati neuspjehe testova i samoispraviti se
- Pouzdano proizvoditi strukturirane JSON izlaze za softversku integraciju
Prelazimo s “chat AI” na “action AI”.
Regulacija: Što Ostaje od Otvorenog?
OSAID 1.0: Službena Definicija
Listopad 2024. Open Source Initiative konačno objavljuje službenu definiciju Open Source AI.
Da bi se kvalificirao kao open source, sustav mora garantirati četiri slobode: korištenje, proučavanje, modificiranje i dijeljenje. Tri ključne komponente:
- Kôd: Potpuni kôd pretreniranja, filtriranja i zaključivanja
- Parametri: Težine, postavke optimizatora, konfiguracije arhitekture
- Podaci: Detaljna dokumentacija o podrijetlu, odabiru i obradi
Rezultat? Većina trenutnih “open source” modela nije sukladna. Llama 4, Mistral, čak i GPT-OSS nemaju potpunu transparentnost podataka.
Samo Pythia (EleutherAI) i OLMo (AI2) zaslužuju oznaku “istinski open source”.
EU AI Act Strukturira Tržište
Od veljače 2025., EU AI Act je na snazi. Open source modeli imaju koristi od značajnih iznimaka — pod uvjetom da nisu klasificirani kao “sistemski rizik”.
Za modele koji prelaze 10^25 FLOP-ova, primjenjuju se obveze dokumentacije i kibernetičke sigurnosti, bez obzira na licencu.
2026-2030: Što Nas Očekuje
Trendovi koji Oblikuju Oblicje
Post-Transformer: Nove arhitekture se pojavljuju kako bi smanjile kvadratičnu složenost pozornosti. BitNet je samo početak.
Edge AI: Modeli poput Ministral 3B rade na pametnim telefonima s masivnim kontekstom. Kućna automatizacija i osobna robotika eksplodirat će.
Suverenost Inteligencije: Tvrtke više ne žele “najmiti” inteligenciju putem API-ja. Žele posjedovati vlastite digitalne mozgove, trenirane na svojim industrijskim tajnama.
Multi-Agent Suradnja: Budućnost leži u komunikaciji između modela različitih pružatelja. Rješavanje problema suradnjom umjesto monolitnom grubom silom.
Nova SEO Paradigma
Masivna integracija LLM-ova u tražilice transformirala je online vidljivost. Sada govorimo o GEO (Generative Engine Optimization).
U 2026., približno 25% tradicionalnog organskog prometa zaokupljaju AI-generirani izravni odgovori. Korisnici više ne klikću — čitaju sintezu.
Za marku, uspjeh se više ne mjeri Google rangiranjem. Mjeri se frekvencijom i stabilnošću citiranja u generativnim odgovorima Gemini 3 ili GPT-5.
Što Sada?
Open source ekosustav 2026. dokazao je jednu bitnu stvar: transparentnost i suradnja nisu etički ideali, već superiorne konkurentne prednosti.
Lomeći monopole inteligencije, open source je transformirao AI iz ekskluzivne usluge u globalnu javnu infrastrukturu — jednako fundamentalnu kao električna energija ili internet.
Tehnička ravnopravnost postignuta je. Sljedeća granica? Potpuna autonomija sustava u službi čovječanstva.
Masivni generalistički modeli dopunjuju se, ponekad zamjenjuju, sazvežđima specijaliziranih, ekonomičnijih, preciznijih, suverenijih modela.
Open source je pobijedio. Ostalo je samo povijest.