Aqbeż għall-kontenut ewlieni
Back to Insights
Open Source LLM DeepSeek Llama Mistral Kimi Transformer Sovranità AI

Rebħa Open Source: Kif AI Ħieles Qabad id-Dinja (2017-2026)

By Yoram Halberstam 35 min read

Transformer: Invenzjoni li Bidlet Kollox

F’Ġunju 2017, tmien riċerċaturi tal-Google ppubblikaw artiklu ta’ tnax-il paġna. Għadhom ma jafux, imma għadhom kemm ħawwdu l-moħħ ta’ rivoluzzjoni li tittrasforma l-umanità.

Transformer — hekk jismu — biddel in-netwerks newrali ripetittivi b’mekkaniżmu ta’ attenzjoni li jippermetti paralleliżżazzjoni massiċċa tal-ipproċessar tad-data. Mhux bħall-arkitetturi preċedenti li pproċessaw il-kliem wieħed wieħed, il-Transformer jara s-sentenza kollha flimkien. Din id-differenza sottili tbiddel kollox.

Sitt snin wara, f’Jannar 2026, l-ekoċistema open source tiddomina l-intelliġenza artifiċjali globali. Dak li kien darbant kompliment akkademiku għall-ġganti proprjetarji sar il-mutur tal-innovazzjoni industrijali. Kif wasalna hawn?

2017
Is-sena tal-Transformer
2023
L-effett Llama
2026
Parità teknikha riċevuta

L-Ewwel Pijunieri (2018-2021)

GPT-2: Il-Ħaġra li Qamdet il-Komunità

Ġunju 2018. OpenAI toħroġ il-GPT-2. Il-mudell huwa tal-biża’ — daqshekk li OpenAI tbatiex tagħmlu pubbliku. L-argument tagħhom? Il-kapaċità li tiġġenera test koerenti tista’ sservi għad-dezinformazzjoni.

Ħażin il-ħsieb. Il-komunità ma t toleratewx li jinħbewilha l-ġugarelli. Meta l-GPT-2 fl-aħħar jiġi rilaxxat taħt liċenzja MIT, ir-riċerkaturi minn madwar id-dinja jaqbaduh. Jiffurmaw kollettiv: EleutherAI. Il-missjoni tagħhom? Juru li l-mudelli bil-biljuni ta’ parametri jistgħu jiġu mtaħħra mingħajr ir-riżorsi ta’ kumpanija multinazzjonali.

"Ridna nuru li x-xjenza miftuħa ma għandhiex bżonn biljuni ta' dollari biex tavvanza."

— Connor Leahy, fundatur ta' EleutherAI

Google Tirrispondi ma’ BERT u T5

Fil-Ħin li qiegħed, Google ma joqogħodx għal kollox. BERT (Ottubru 2018) tirrivoluzzjona l-fehim bidirezżjonali tal-lingwa. T5 (Frar 2020 tipproponi qafas unifikat fejn kull kompitu jsir trasformazzjoni test-test.

Dawn il-mudelli, rilaxxati taħt liċenzja Apache 2.0, isiru l-bażi għal eluf ta’ proġetti ta’ riċerka akkademika. Juru ħaga waħda importanti: it-taħriġ massiv preliminari segwit minn aġġustament fin huwa t-triq reali.

Is-Suċċessi Bikrin tal-Komunità

F’Marzu 2021, EleutherAI toħroġ il-GPT-Neo b’2.7 biljun parametru. Dan huwa suċċess tekniku: il-mudell jikkompeti mal-GPT-3 ta’ dak iż-żmien, kompletament imtaħħar fuq il-poter komputazzjonali donat u x-xogħol volontarju.

Il-messaġġ huwa ċar: l-open source jista’ jikkompeti mal-ġganti.

2022: X-Xjenza Miftuħa taħt Pressjoni

BigScience u BLOOM: Approċċ Unpreċedentat

Is-sena 2022 timmarka punt ta’ bidla. OpenAI tagħlaq il-mudelli tagħha wara API paywalls. Il-komunità tirrispondi differenti.

BigScience, koordinat minn Hugging Face, tiġbor flimkien 1,000 riċerkatur minn 60 pajjiż. L-għan tagħhom? Toħloq l-ikbar mudell open source multilingwi li qatt bniet. Ir-riżultat: BLOOM, 176 biljun parametru, 46 lingwa, 13 lingwi tal-programmar.

Dak li jagħmel lil BLOOM storiku mhux id-daqs tiegħu. Hija t-trasparenza totali: data pubblika għat-taħriġ, kodiċi open source, loġġ sħiħ tat-taħriġ. L-ewwel darba nistgħu verament nifhmu kif twieled LLM.

Meta Tlaqt bil-Qawwa ma’ OPT

Kważi fl-istess ħin, Meta AI tibda l-OPT (Open Pre-trained Transformer). Daqs wieħed ma’ GPT-3, imma b’differenza kruċjali waħda: dokumentazzjoni kompluta tal-proċess ta’ taħriġ.

Ir-riċerkaturi jistgħu fl-aħħar jistudjaw mudell ta’ din l-iskala mingħajr inġinjerija inversa.

Galactica: Premonizzjoni

Novembru 2022. Meta tipprova tispeċjalizza l-AI bil-Galactica, iddedikata għall-letteratura xjentifika. Il-mudell jitneħħa fi 48 siegħa wara kritika dwar l-alluċinazzjonijiet tiegħu.

Falliment? Mhux kompletament. Il-Galactica tqiegħed il-pedamenti għat-taħriġ fuq korpora speċjalizzati. Trend li se jisplodi tliet snin aktar tard.

2023: Is-Sena li Kollox Inbidel

24 ta’ Frar 2023: L-effett Llama

F’dak il-jum, Meta tippubblika l-Llama. Il-mudell mhuwiex maħsub għall-pubbliku wiesa’ — riċerka biss. Imma l-piżijiet tiegħu jaħarbu online fi ftit jiem.

Il-moqq tal-rivoluzzjoni.

Il-Llama turi li mudell aktar modest (7 sa 65 biljun parametru) imtaħħar fuq iktar tokens jista’ jaqbeż lill-ġganti. Il-komunità tieħuha minnufih.

Mudell Data Innovazzjoni Ewlenija Liċenzja
Alpaca Marzu 2023 Aġġustament fin bi prezz baxx permezz ta' self-instruct Mhux kummerċjali
Vicuna April 2023 90% kwalità ChatGPT għal $500 tal-ispejjeż ta' taħriġ Mhux kummerċjali
Falcon 40B Ġunju 2023 L-ewwel mudell open source li jiddomina benchmarks Apache 2.0
Mistral 7B Ottubru 2023 Effeċjenza estrema permezz ta' Sliding Window Attention Apache 2.0
Mixtral 8x7B Diċembru 2023 Mixture of Experts (MoE) demokratizzata Apache 2.0

QLoRA: Demokratizzazzjoni Lokali

April 2023. Teknika waħda tbiddel kollox: QLoRA (Quantized Low-Rank Adaptation).

Riżultat? Aġġustament fin ta’ mudell b’65 biljun parametru fuq GPU konsumatur wieħed biss. L-intrapriżi żgħar issa jistgħu joħolqu l-AI tagħhom stess mingħajr infrastruttura massiva.

L-ostakoli jaqgħu wieħed wara l-ieħor.

2024-2025: Parità Teknika

DeepSeek: Iċ-Ċina Tidħol fuq il-Palk

Is-sajf tal-2024 jimmarka l-wasla ta’ player ġdid importanti: DeepSeek, laboratorju Ċiniż affiliat ma’ High-Flyer Quant.

Il-moviment tal-ġenju tagħhom? Arkitettura MoE ultra-effeċjenti u l-mekkaniżmu MLA (Multi-head Latent Attention) li jonfoq il-ħtiġijiet tal-memorja tal-cache KV b’93%.

Riżultat f’Jannar 2025: Il-DeepSeek-V3 jegwalejja lill-GPT-4 għal frazzjoni tal-ispiża. Il-komunità internazzjonali tiskopri li l-open source mhuwiex aktur segwaċi — huwa l-kap.

OpenAI Cedi taħt il-Pressjoni

Awwissu 2025. OpenAI, wara snin ta’ għeluq, toħroġ il-GPT-OSS. L-ewwel mudell bil-piżijiet miftuħa mill-GPT-2. Ottimizzat għal workflows aġenzjali u kontest twil.

Għaliex din il-bidla? Il-pressjoni kompetittiva tal-open source saret qawwija wisq. Meta l-mudelli b’xejn jegwalew tiegħek, il-għeluq mhuwiex iktar biżżejjed.

Meta Tirrispondi bil-Llama 4

Ir-risposta immedjata ta’ Meta: Llama 4. Nattivament multimodali, kapaċi jiġi pproċessat 10 miljun token ta’ kontest.

Imaġina: analiżi ta’ bażi kodiċi sħiħa f’inkjesta waħda. Issa huwa possibbli — u b’xejn.

Jannar 2026: Open Source Ddomina

Klassifikazzjoni tal-Aħjar Mudelli

Hawnhekk aħna llum:

Rank Mudell Żviluppatur Skor tal-Kwalità Speċjalizzazzjoni
1 Kimi K2.5 (Reasoning) Moonshot AI 46,77 Matematika, raġunar kompless
2 GLM-4.7 (Thinking) Zhipu AI 41,70 Kodifikazzjoni, Viżjoni-Lingwa
3 DeepSeek V3.2 DeepSeek 41,20 Effeċjenza, spiża baxxa ta' inferenza
4 GPT-OSS-120B OpenAI 40,50 Użu ta' għodda, aġenzjalità
5 Llama 4 (70B) Meta 39,80 Multimodwalità, ekoċistema
6 Qwen3-235B Alibaba 39,20 Multilingwiżmu, RAG

Il-vedett huwa krudi: 5 minn 6 mudelli l-aħjar huma open source. Biss il-GPT-OSS, b’mod ironiku, iġorr l-isem ta’ kap proprjetarju tal-passat.

Innovazzjonijiet li Bidlulha l-Logħba

MLA u DeepSeek Sparse Attention: Il-ġestjoni tal-miljuni ta’ tokens tal-kontest kienet teħtieġ memorja tal-cache KV projbita. Il-MLA tikkumprimi b’mod aġġressiv din il-cache. L-DSA tnaqqas il-kumplessità tal-komputazzjoni billi tipproċessa biss il-partijiet rilevanti tal-sekwenza.

BitNet 1.58b: L-innovazzjoni l-aktar radikali tal-2025. Minflok li tikkodifika l-piżijiet fuq 16-il bit, il-BitNet tuża valuri ternarji {-1, 0, 1} — madwar 1.58 bit għal kull parametru.

Konsegwenza:

  • Tnaqqis ta’ 70-80% fil-konsum tal-enerġija
  • Aċċelerazzjoni ta’ 2.3x sa 6.1x fuq CPU standard
  • Mudell b’100 biljun parametru li jaħdem fuq kompjuter desktop standard

Is-sovranità tal-AI mhiex iktar ħolma. Hija realtà teknika.

L-Inferenza Lokali ssir Standard

RTX 5090: Il-Qalb tal-Istazzjonijiet tax-Xogħol tal-AI

Bil-bidu tal-2025, NVIDIA toħroġ il-RTX 5090. 32 GB ta’ memorja GDDR7, bandwidth ta’ 1.79 TB/s (+77% meta mqabbel maċ-ċentinarja preċedenti).

Riżultati fuq kard tal-konsumatur:

  • Llama 4 8B (4-bit): 180 token/siegħa
  • DeepSeek-R1 14B (4-bit): 89 token/siegħa
  • Qwen 2.5 32B (4-bit): 45 token/siegħa

Il-mudelli 70B+ issa jaħdmu fuq konfigurazzjonijiet multi-GPU lokali b’prestazzjoni industrijali.

vLLM vs Ollama

Żewġ ekoċistemi jiddominaw:

  • vLLM: Standard tal-produzzjoni. Magni PagedAttention, ġestjoni ottimizzata tal-cache KV, utenti multipli simultanji.
  • Ollama: Favorit tal-iżviluppaturi. Sempliċità estrema, żero konfigurazzjoni, appoġġ nativ għal macOS/Linux/Windows.

L-Era Aġenzjali: Mill-Chat għall-Azzjoni

Devstral 2: AI fis-Servizz tal-Kodiċi

Diċembru 2025. Mistral AI tibda l-Devstral 2, 123 biljun parametru ottimizzati għaż-żvilupp tas-software.

Skor SWE-bench Verified: 72,2%. Ekwivalenti għal Claude Sonnet 4, għadhom sebat darbiet aktar għaljin.

Prezz: 0,40 $ għal kull miljun token. Iż-żvilupp appoġġjat mill-AI jsir ekonomikament vijabbli għall-intrapriżi żgħar u l-indipendenti.

Vibe CLI: AI li Tippprogramma Waħda

Fix-xahar stess, Mistral toħroġ il-Vibe CLI. Din l-għodda tiorkestra b’mod awtonomu bidliet komplessi fiċ-ċentri tal-kodiċi kollha.

Il-mudelli aġenzjali tal-2026 jistgħu:

  • Jinnavigaw fis-sistemi tal-fajls komplessi
  • Jidentifikaw id-dipendenzi bejn il-frameworks
  • Jindunaw fallimenti fit-testijiet u jaġġustaw lilhom infushom
  • Jipproduċu b’mod affidabbli outputs JSON strutturati għall-integrazzjoni tas-software

Qed nimxu mill-”AI tal-chat” għall-”AI tal-azzjoni”.

Regolamentazzjoni: X’Inbidel mill-Miftuħ?

OSAID 1.0: Id-Definizzjoni Uffiċjali

Ottubru 2024. Open Source Initiative fl-aħħar tippubblika definizzjoni uffiċjali tal-Open Source AI.

Biex jikkwalifika bħala open source, sistema trid tiżgura erba’ ħelsien: użu, studju, modifika u mqassam. Tliet komponenti ewlenin:

  1. Kodiċi: Kodiċi komplut għat-taħriġ preliminari, iffiltrar u inferenza
  2. Parametri: Piżijiet, settings tal-ottimizzatur, konfigurazzjonijiet tal-arkitettura
  3. Data: Dokumentazzjoni dettaljata dwar l-oriġini, għażla u proċessar

Riżultat? Il-biċċa tal-mudelli “open source” attwali m’humiex konformi. Il-Llama 4, il-Mistral, anke l-GPT-OSS jonqsuhom it-trasparenza totali tad-data.

Biss Pythia (EleutherAI) u OLMo (AI2) jiksbu t-tikketta “verament open source”.

L-AI Act tal-UE Tistruttura s-Suq

Mill-Frar 2025, l-AI Act tal-UE huwa fis-seħħ. Il-mudelli open source jibbenefikaw minn eżenzjonijiet sinifikanti — bil-kundizzjoni li ma jiġux kklassifikati bħala “riskju sistemiku”.

Għal mudelli li jaqbeżu 10^25 FLOPs, japplikaw obbligi ta’ dokumentazzjoni u ċibersigurtà, indipendentement mill-liċenzja.

2026-2030: X’Jinsab Quddiemna

Trendijiet li qed Jieħdu Forma

Post-Transformer: Arkitetturi ġodda qed joħorġu biex inaqqsu l-kumplessità kwadratika tal-attenzjoni. Il-BitNet huwa biss il-bidu.

Edge AI: Mudelli bħal Ministral 3B jaħdmu fuq smartphones b’kontest massiv. L-awtomazzjoni tad-dar u r-robotika personali se jisplodu.

Sovranità tal-Intelliġenza: L-intrapriżi ma jridux iktar “jirrendu” intelliġenza permezz ta’ API. Irridu jkollhom moħħhom diġitali stess, imtaħħra fuq is-sigrieti industrijali tagħhom.

Kooperazzjoni Multi-Agent: Il-ġejjieni jinsab fil-komunikazzjoni bejn mudelli minn fornituri differenti. Soluzzjoni tal-problemi permezz ta’ kooperazzjoni minflok forza monolitika.

In-New Paradigma SEO

L-integrazzjoni massiva tal-LLM fis-magni tat-tiftix trasformiet il-viżibbiltà online. Issa nitkellmu dwar GEO (Generative Engine Optimization).

Fl-2026, madwar 25% tat-traffiku organiku tradizzjonali jiġi rkuprat minn risposti diretti ġġenerati mill-AI. L-utenti ma jikklikkjawx iktar — jaqraw is-sintesi.

Għal marka, is-suċċess mhuwiex iktar imkejjes bil-klassifikazzjoni fuq Google. Jiġi mkejjes bil-frekwenza u s-stabbiltà tal-citazzjonijiet fir-risposti ġenerattivi tal-Gemini 3 jew GPT-5.

U Issa?

L-ekoċistema open source tal-2026 wriet ħaġa waħda essenzjali: it-trasparenza u l-kooperazzjoni m’humiex idejali etiċi, huma vantaġġi kompetittivi superjuri.

Billi kissret il-monopolji tal-intelliġenza, l-open source trasformiet l-AI minn servizz esklussiv għal infrastruttura pubblika globali — daqshekk fundamentali bħalma huma l-elettriku jew l-internet.

Il-parità teknikha ntlaħqet. Il-fruntiera li jmiss? L-awtonomija totali tas-sistemi fis-servizz tal-umanità.

Il-mudelli ġeneralistiċi massivi jinkomplu, kultant jinbidlu, bi kostellazzjonijiet ta’ mudelli speċjalizzati, aktar ekonomiċi, aktar preċiżi, aktar sovrani.

Open Source rebaħ. Il-bqija huwa biss storja.

Werrej