Open Source Pobijedio: Kako je Slobodna AI Osvojila Svijet (2017-2026)

Transformer: Pronalazak koji je Promijenio Sve

U lipnju 2017. godine, osam Googleovih istraživača objavilo je dvanaestostranični članak. Još nisu znali, ali upravo su zapalili fitilj revolucije koja će transformirati čovječanstvo.

Transformer — tako se zove — zamijenio je povratne neuronske mreže mehanizmom pozornosti koji omogućuje masivnu paralelnu obradu podataka. Za razliku od prethodnih arhitektura koje su obrađivale riječi jednu po jednu, Transformer vidi cijelu rečenicu odjednom. Ta suptilna razlika mijenja sve.

Šest godina kasnije, u siječnju 2026. godine, open source ekosustav dominira globalnom umjetnom inteligencijom. Ono što je nekoć bilo samo akademski dodatak vlasničkim divovima postalo je pokretač industrijske inovacije. Kako smo stigli dovde?

2017

Godina Transformer

2023

Llama efekt

2026

Postignuta tehnička ravnopravnost

Prvi Pioniri (2018-2021)

GPT-2: Iskra koja je Probudila Zajednicu

Lipanj 2018. OpenAI objavljuje GPT-2. Model je zastrašujući — toliko da OpenAI oklijeva učiniti ga javnim. Njihov argument? Sposobnost generiranja koherentnog teksta mogla bi služiti dezinformacijama.

Loš proračun. Zajednica ne tolerira da joj se skrivaju igračke. Kada GPT-2 konačno izlazi pod MIT licencom, istraživači diljem svijeta ga zgrabljuju. Formira se kolektiv: EleutherAI. Njihova misija? Dokazati da se modeli s milijardama parametara mogu trenirati bez resursa multinacionalne tvrtke.

"Željeli smo dokazati da otvorena znanost ne treba milijarde dolara da bi napredovala."

— Connor Leahy, osnivač EleutherAI

Google Odgovara s BERT-om i T5

U međuvremenu, Google ne sjedi skrštenih ruku. BERT (listopad 2018.) revolucionira dvosmjerno razumijevanje jezika. T5 (veljača 2020.) predlaže ujedinjeni okvir gdje svaki zadatak postaje tekst-u-tekst transformacija.

Ovi modeli, objavljeni pod Apache 2.0 licencom, postaju temelj tisuća akademskih istraživačkih projekata. Dokazuju jednu bitnu stvar: masivno pretreniranje praćeno finim podešavanjem je kraljevski put.

Rani Uspjesi Zajednice

U ožujku 2021., EleutherAI objavljuje GPT-Neo s 2,7 milijardi parametara. To je tehnički uspjeh: model se ravna s tadašnjim GPT-3, u potpunosti treniran na doniranoj računalnoj snazi i volonterskom radu.

Poruka je jasna: open source može parirati divovima.

2022: Otvorena Znanost Pod Pritiskom

BigScience i BLOOM: Nezapamćen Pristup

Godina 2022. označava prekretnicu. OpenAI zatvara svoje modele iza plaćenih API-ja. Zajednica reagira drugačije.

BigScience, koordiniran od strane Hugging Face-a, okuplja 1000 istraživača iz 60 zemalja. Njihov cilj? Stvoriti najveći višejezični open source model ikad izgrađen. Rezultat: BLOOM, 176 milijardi parametara, 46 jezika, 13 programskih jezika.

Ono što čini BLOOM povijesnim nije njegova veličina. Već potpuna transparentnost: javni podaci za treniranje, open source kôd, potpuni dnevnik treniranja. Prvi put možemo zaista razumjeti kako se rodio LLM.

Meta Udara Snažno s OPT-om

Gotovo istovremeno, Meta AI pokreće OPT (Open Pre-trained Transformer). Ista veličina kao GPT-3, ali s jednom ključnom razlikom: potpuna dokumentacija procesa treniranja.

Istraživači konačno mogu proučavati model ove veličine bez obrnutog inženjeringa.

Galactica: Predosjećaj

Studeni 2022. Meta pokušava specijalizirati AI s Galacticom, posvećenom znanstvenoj literaturi. Model se povlači unutar 48 sati nakon kritika zbog halucinacija.

Neuspjeh? Ne baš. Galactica postavlja temelje za treniranje na specijaliziranim korpusima. Trend koji će eksplodirati tri godine kasnije.

2023: Godina u kojoj se Sve Promijenilo

24. Veljače 2023.: Llama Efekt

Tog dana, Meta objavljuje Llama. Model nije namijenjen širokoj javnosti — samo istraživanju. Ali njegove težine procuri online unutar dana.

Okidač revolucije.

Llama dokazuje da skromniji model (7 do 65 milijardi parametara) treniran na više tokena može nadmašiti divove. Zajednica ga trenutno usvaja.

Model	Datum	Ključna Inovacija	Licencija
Alpaca	Ožujak 2023.	Fino podešavanje niskih troškova putem self-instruct	Ne-komercijalna
Vicuna	Travanj 2023.	90% ChatGPT kvalitete za 500 USD troškova treninga	Ne-komercijalna
Falcon 40B	Lipanj 2023.	Prvi open source model koji dominira benchmarkovima	Apache 2.0
Mistral 7B	Listopad 2023.	Ekstremna učinkovitost putem Sliding Window Attention	Apache 2.0
Mixtral 8x7B	Prosinac 2023.	Demokratizirana Mixture of Experts (MoE)	Apache 2.0

QLoRA: Lokalna Demokratizacija

Travanj 2023. Jedna tehnika mijenja sve: QLoRA (Quantized Low-Rank Adaptation).

Rezultat? Fino podešavanje modela s 65 milijardi parametara na jednoj potrošačkoj GPU. Mali biznisi sada mogu stvoriti vlastiti AI bez masivne infrastrukture.

Barijere padaju jedna po jedna.

2024-2025: Tehnička Ravnopravnost

DeepSeek: Kina Ulazi na Pozornicu

Ljeto 2024. označava dolazak novog značajnog igrača: DeepSeek, kineski laboratorij povezan s High-Flyer Quant.

Njihov majstorski potez? Ultra-učinkovita MoE arhitektura i MLA (Multi-head Latent Attention) mehanizam koji smanjuje potrebe za memorijom KV cache za 93%.

Rezultat u siječnju 2025.: DeepSeek-V3 izjednačava se s GPT-4 uz djelić troškova. Međunarodna zajednica otkriva da open source više nije slijedbenik — već vođa.

OpenAI Popušta Pod Pritiskom

Kolovoz 2025. OpenAI, nakon godina zatvorenosti, objavljuje GPT-OSS. Prvi model s otvorenim težinama od GPT-2. Optimiziran za agentne radne tokove i dugi kontekst.

Zašto ovaj zaokret? Konkurentni pritisak open source postao je prejak. Kada besplatni modeli izjednačavaju vaše, zatvaranje više nije dovoljno.

Meta Odgovara s Llama 4

Nemjedi odgovor Meta-e: Llama 4. Nativno multimodalna, sposobna obraditi 10 milijuna tokena konteksta.

Zamislite: analiza cijele baze koda u jednom upitu. Sada je to moguće — i besplatno.

Siječanj 2026.: Open Source Vladara

Ljestvica Najboljih Modela

Evo gdje smo danas:

Mjesto	Model	Developer	Kvalitetni Rezultat	Specijalizacija
1	Kimi K2.5 (Reasoning)	Moonshot AI	46,77	Matematika, kompleksno zaključivanje
2	GLM-4.7 (Thinking)	Zhipu AI	41,70	Kodiranje, Vid-Jezik
3	DeepSeek V3.2	DeepSeek	41,20	Učinkovitost, niski trošak zaključivanja
4	GPT-OSS-120B	OpenAI	40,50	Korištenje alata, agentnost
5	Llama 4 (70B)	Meta	39,80	Multimodalnost, ekosustav
6	Qwen3-235B	Alibaba	39,20	Višejezičnost, RAG

Presuda je brutalna: 5 od 6 najboljih modela su open source. Samo GPT-OSS, ironično, nosi ime bivšeg vlasničkog vođe.

Inovacije koje su Promijenile Igru

MLA i DeepSeek Sparse Attention: Rukovanje milijunima tokena konteksta zahtijevalo je zabranjenu memoriju KV cache. MLA agresivno komprimira ovu cache memoriju. DSA smanjuje složenost izračuna obrađujući samo relevantne dijelove sekvence.

BitNet 1.58b: Najradikalnija inovacija 2025. Umjesto kodiranja težina na 16 bitova, BitNet koristi ternarne vrijednosti {-1, 0, 1} — otprilike 1,58 bita po parametru.

Posljedica:

70-80% smanjenje potrošnje energije
2,3x do 6,1x ubrzanje na standardnim CPU-ima
Model s 100 milijardi parametara koji radi na standardnom stolnom računalu

AI suverenost više nije san. To je tehnička stvarnost.

Lokalno Zaključivanje Postaje Standard

RTX 5090: Srce AI Radnih Stanica

Početkom 2025., NVIDIA lansira RTX 5090. 32 GB GDDR7 memorije, propusnost od 1,79 TB/s (+77% u odnosu na prethodnu generaciju).

Rezultati na potrošačkoj kartici:

Llama 4 8B (4-bit): 180 tokena/sekundu
DeepSeek-R1 14B (4-bit): 89 tokena/sekundu
Qwen 2.5 32B (4-bit): 45 tokena/sekundu

Modeli 70B+ sada rade na lokalnim multi-GPU konfiguracijama s industrijskim performansama.

vLLM vs Ollama

Dva ekosustava dominiraju:

vLLM: Produkcijski standard. PagedAttention engine, optimizirano upravljanje KV cache memorijom, više istovremenih korisnika.
Ollama: Omiljeni developera. Ekstremna jednostavnost, nula konfiguracije, nativna podrška za macOS/Linux/Windows.

Agentna Era: Od Chata do Akcije

Devstral 2: AI u Službi Koda

Prosinac 2025. Mistral AI pokreće Devstral 2, 123 milijarde parametara optimiziranih za razvoj softvera.

SWE-bench Verified rezultat: 72,2%. Jednak Claude Sonnet 4, ali sedam puta skuplji.

Cijena: 0,40 $ po milijunu tokena. AI-potpomognuti razvoj postaje ekonomski isplativ za male biznise i neovisne.

Vibe CLI: AI koja Kodira Samostalno

Isti mjesec, Mistral objavljuje Vibe CLI. Ovaj alat autonomno orkestrira složene promjene u cijelim bazama koda.

Agentni modeli 2026. mogu:

Navigirati složenim datotečnim sustavima
Identificirati ovisnosti među okvirima
Detektirati neuspjehe testova i samoispraviti se
Pouzdano proizvoditi strukturirane JSON izlaze za softversku integraciju

Prelazimo s “chat AI” na “action AI”.

Regulacija: Što Ostaje od Otvorenog?

OSAID 1.0: Službena Definicija

Listopad 2024. Open Source Initiative konačno objavljuje službenu definiciju Open Source AI.

Da bi se kvalificirao kao open source, sustav mora garantirati četiri slobode: korištenje, proučavanje, modificiranje i dijeljenje. Tri ključne komponente:

Kôd: Potpuni kôd pretreniranja, filtriranja i zaključivanja
Parametri: Težine, postavke optimizatora, konfiguracije arhitekture
Podaci: Detaljna dokumentacija o podrijetlu, odabiru i obradi

Rezultat? Većina trenutnih “open source” modela nije sukladna. Llama 4, Mistral, čak i GPT-OSS nemaju potpunu transparentnost podataka.

Samo Pythia (EleutherAI) i OLMo (AI2) zaslužuju oznaku “istinski open source”.

EU AI Act Strukturira Tržište

Od veljače 2025., EU AI Act je na snazi. Open source modeli imaju koristi od značajnih iznimaka — pod uvjetom da nisu klasificirani kao “sistemski rizik”.

Za modele koji prelaze 10^25 FLOP-ova, primjenjuju se obveze dokumentacije i kibernetičke sigurnosti, bez obzira na licencu.

2026-2030: Što Nas Očekuje

Trendovi koji Oblikuju Oblicje

Post-Transformer: Nove arhitekture se pojavljuju kako bi smanjile kvadratičnu složenost pozornosti. BitNet je samo početak.

Edge AI: Modeli poput Ministral 3B rade na pametnim telefonima s masivnim kontekstom. Kućna automatizacija i osobna robotika eksplodirat će.

Suverenost Inteligencije: Tvrtke više ne žele “najmiti” inteligenciju putem API-ja. Žele posjedovati vlastite digitalne mozgove, trenirane na svojim industrijskim tajnama.

Multi-Agent Suradnja: Budućnost leži u komunikaciji između modela različitih pružatelja. Rješavanje problema suradnjom umjesto monolitnom grubom silom.

Nova SEO Paradigma

Masivna integracija LLM-ova u tražilice transformirala je online vidljivost. Sada govorimo o GEO (Generative Engine Optimization).

U 2026., približno 25% tradicionalnog organskog prometa zaokupljaju AI-generirani izravni odgovori. Korisnici više ne klikću — čitaju sintezu.

Za marku, uspjeh se više ne mjeri Google rangiranjem. Mjeri se frekvencijom i stabilnošću citiranja u generativnim odgovorima Gemini 3 ili GPT-5.

Što Sada?

Open source ekosustav 2026. dokazao je jednu bitnu stvar: transparentnost i suradnja nisu etički ideali, već superiorne konkurentne prednosti.

Lomeći monopole inteligencije, open source je transformirao AI iz ekskluzivne usluge u globalnu javnu infrastrukturu — jednako fundamentalnu kao električna energija ili internet.

Tehnička ravnopravnost postignuta je. Sljedeća granica? Potpuna autonomija sustava u službi čovječanstva.

Masivni generalistički modeli dopunjuju se, ponekad zamjenjuju, sazvežđima specijaliziranih, ekonomičnijih, preciznijih, suverenijih modela.

Open source je pobijedio. Ostalo je samo povijest.