Bua Open Source: Conas a Ghabh AI Saor an Domhan (2017-2026)

Transformer: Fionnachtain a D’athraigh Rud ar Bith

I mí an Mheithimh 2017, d’fhoilsigh ocht n-eolaí Google alt dhá leathanach dhéag. Ní raibh a fhios acu go fóill, ach las siad an méarchaill le réabhlóid a dhéanfadh athrú ar an gcine daonna.

Transformer — sin an t-ainm atá air — chuir sé meicníocht aird in áit na líonraí néarón athfhillteacha a chuireann comhthreabhú mórscála ar chúrsaíocht sonraí ar bun. Murab ionann agus na hailtireachtaí roimhe sin a phróiseáil focail aonair ag an am, feiceann an Transformer an abairt iomlán ag an am céanna. Déanann an difríocht shoiléir seo difríocht.

Sé bliana ina dhiaidh sin, i mí Eanáir 2026, táispeánann córas open source domhanda an domhanda. An rud a bhí ina chomhlachta acadúil do na giofóga propráideacha, tá sé ina innéacs nuálaíochta tionsclaíochta. Conas a tháinig muid anseo?

2017

Bliain an Transformer

2023

Éifeacht Llama

2026

Comhionannas teicniúil bainte amach

Na Chéad Phionéirí (2018-2021)

GPT-2: An Spréach a Dhuisigh an Pobal

Meitheamh 2018. Cuireann OpenAI GPT-2 ar fáil. Is scanraitheach an samhail é — chomh scanraitheach nach ndéanann OpenAI teacht air go poiblí. An t-argóint acu? D’fhéadfadh an cumas téacs comhéifeachtach a ghiniúint eolas mícheart a chothú.

Ríomh mícheart. Ní fheidhmeoidh an pobal le bréagáin a choinneáil uathu. Nuair a chuirtear GPT-2 ar fáil faoi cheadúnas MIT de réir a chéile, gabhann taighdeoirí ó gach cearn den domhan leis. Tugtar bailiúchán le chéile: EleutherAI. An misean acu? Cruthú gur féidir samhlacha le paraiméadair billiúnacha a oiliúint gan acmhainní corparáide ilnáisiúnta.

"Theastaigh uainn a chruthú nach raibh billiúiní dollar ag teastáil ón eolaíocht oscailte chun dul chun cinn."

— Connor Leahy, bunaitheoir EleutherAI

Freagraíonn Google le BERT agus T5

Idir an dá linn, níl Google ag suí leis. Réabhlóideoidh BERT (Deireadh Fómhair 2018) tuiscint dháiríre ar an teanga. Cuireann T5 (Feabhra 2020) creat aontaithe ar fáil ina ndéanann gach tasc claochlú téacs-go-téacs.

Bíonn na samhlacha seo, a cuirtear ar fáil faoi cheadúnas Apache 2.0, mar bhonn do mhílte tasc taighde acadúil. Cruthaíonn siad rud amháin tábhachtach: is é réamh-oiliúint mhórscála, le mínchoigeartú ina diaidh, an bealach ríoga.

Luathéachtaí an Phobail

I mí an Mhárta 2021, cuireann EleutherAI GPT-Neo ar fáil le 2.7 bhilliún paraiméadar. Is éacht teicniúil é: déanann an tsamhail iomaíocht le GPT-3 an ama sin, go hiomlán oiliúnaithe ar ríomhacht bhronnta agus ar shaothar deonach.

Is soiléir an teachtaireacht: is féidir le open source dul i ngleic leis na giaráin.

2022: An Eolaíocht Oscailte faoi Bhrú

BigScience agus BLOOM: Cur Chuige Gan Sárú

Léiríonn 2022 pointe casctha. Dúnann OpenAI a samhlacha taobh thiar d’APIanna íoctha. Freagraíonn an pobal ar bhealach difriúil.

Tugann BigScience, a chomhordú ó Hugging Face, 1,000 taighdeoir ó 60 tír le chéile. An sprioc acu? An tsamhail ildhathach open source is mó a cruthaíodh riamh a chruthú. An toradh: BLOOM, 176 bhilliún paraiméadar, 46 teanga, 13 teanga ríomhchláraithe.

Níl méid BLOOM mar a dhéanann stair de. Is é an trédhearcacht iomlán é: sonraí oiliúna poiblí, cód open source, loga oiliúna iomlán. An chéad uair, is féidir linn tuiscint iomlán a fháil ar conas a rugadh LLM.

Buille Láidir Meta le OPT

Beagnach ag an am céanna, seolann Meta AI OPT (Open Pre-trained Transformer). An méid céanna le GPT-3, ach le difríocht amháin ríthábhachtach: doiciméadú iomlán ar an bpróiseas oiliúna.

Is féidir le taighdeoirí staidéar a dhéanamh ar shamhail den scála seo gan ailtireacht a chur ar an gcúl a bhíonn ar an tosach.

Galactica: Réamhchomhartha

Samhain 2022. Déanann Meta iarracht AI a dhíolmhú le Galactica, dírithe ar litríocht eolaíoch. Tógann an tsamhail amach taobh istigh de 48 uair an chloig tar éis cáineadh faoina hallucinations.

Teip? Go hiomlán. Cuireann Galactica na bunchloch le haghaidh oiliúna ar chóras speisialaithe. Treocht a bhfuil pléascadh i ndán di trí bliana ina dhiaidh sin.

2023: An Bliain a d’Athraigh Rud ar Bith

24 Feabhra 2023: Éifeacht Llama

An lá sin, cuireann Meta Llama ar fáil. Níl an tsamhail dírithe ar an bpobal mór — taighde amháin. Ach sceitheann a meáchain ar líne laethanta.

An t-adharc réabhlóide.

Cruthaíonn Llama gur féidir le samhail níos coimeádaí (7 go 65 bhilliún paraiméadar) a oiliúint ar níos mó comharthaí na ngiaráin a shárú. Gabhann an pobal léi láithreach.

Samhail	Dáta	Nuálaíocht Chuí	Ceadúnas
Alpaca	Márta 2023	Mínchoigeartú ísealchostais trí self-instruct	Neamhthráchtála
Vicuna	Aibreán 2023	90% caighdeán ChatGPT ar chostas oiliúna 500$	Neamhthráchtála
Falcon 40B	Meitheamh 2023	An chéad tsamhail open source a sháraíonn benchmarks	Apache 2.0
Mistral 7B	Deireadh Fómhair 2023	Éifeachtúlacht shuntasach trí Sliding Window Attention	Apache 2.0
Mixtral 8x7B	Nollaig 2023	Deamhcruthú Mixture of Experts (MoE)	Apache 2.0

QLoRA: Daonlathú Áitiúil

Aibreán 2023. Athraíonn modh amháin rud ar bith: QLoRA (Quantized Low-Rank Adaptation).

Toradh? Samhail 65 bhilliún paraiméadar a mínchoigeartú ar GPU tomhaltóra amháin. Is féidir le gnólachtaí beaga a n-AI féin a chruthú anois gan bonneagar ollmhór.

Titeann na bacainní ceann ar cheann.

2024-2025: Comhionannas Teicniúil

DeepSeek: An tSín ag Teacht ar an Stáitse

Samhradh 2024. Léiríonn sé teacht ar ghníomhaire nua tábhachtach: DeepSeek, saotharlann Síneach atá ceangailte le High-Flyer Quant.

An caide a bhfuil siad go maith ann? Ailtireacht MoE ultra-éifeachtach agus meicníocht MLA (Multi-head Latent Attention) a laghdaíonn riachtanais chuimhne cache KV 93%.

Toradh i mí Eanáir 2025: DeepSeek-V3 cothrom le GPT-4 ar chostas murúin. Aithníonn an pobal idirnáisiúnta nach leanúr atá sa chód oscailte — is ceannaire é.

Tugann OpenAI faoi Bhrú

Lúnasa 2025. Tar éis blianta faoi ghlas, cuireann OpenAI GPT-OSS ar fáil. An chéad tsamhail le meáchain oscailte ó GPT-2. Optamaithe le haghaidh sreafaí oibre gníomhaireachta agus comhthéacs fada.

Cén fáth an casadh seo? Bhí an brú iomaíoch ón gcód oscailte ró láidir. Nuair a bhíonn samhlacha saor in aisce ar comhchéim le do chuid féin, ní leor an dúnadh.

Freagraíonn Meta le Llama 4

Freagra láithreach Meta: Llama 4. Ilmhodúil go nádúrtha, in ann 10 milliún chomhartha comhthéacs a phróiseáil.

Samhlaigh: anailís ar bhunús cód iomlán i gceist amháin. Is féidir é anois — agus saor in aisce.

Eanáir 2026: Tá an Cód Oscailte i gCeannas

Rangú na nSamhalacha is Fearr

Seo an áit ina bhfuilimid inniu:

Rang	Samhail	Forbróir	Scór Caighdeáin	Speisialtóireacht
1	Kimi K2.5 (Reasoning)	Moonshot AI	46,77	Matamaitic, réasúnú casta
2	GLM-4.7 (Thinking)	Zhipu AI	41,70	Códú, Amharc-Teanga
3	DeepSeek V3.2	DeepSeek	41,20	Éifeachtúlacht, costas íseal inference
4	GPT-OSS-120B	OpenAI	40,50	Úsáid uirlisí, gníomhaireacht
5	Llama 4 (70B)	Meta	39,80	Ilmhodúlacht, éiceachóras
6	Qwen3-235B	Alibaba	39,20	Ilteangachas, RAG

Is cruaidh an breithiúnas é: as 6 samhail is fearr, tá 5 open source. Níl ach GPT-OSS, go híorónach, a iompraíonn ainm iarcheannaire propráideach.

Nuálaíochtaí a d’Athraigh an Cluiche

MLA agus DeepSeek Sparse Attention: Theastaigh cuimhne cache KV dhocht chun na milliúin chomharthaí comhthéacs a láimhseáil. Comhbhrúíonn an MLA an cache seo go hagressach. Laghdaíonn DSA castacht an ríomhaireachta trí chodanna ábhartha den seicheamh amháin a phróiseáil.

BitNet 1.58b: An nuálaíocht is radacaí de 2025. In ionad meáchain a chódú ar 16 ngiotán, úsálann BitNet luachanna ternártha {-1, 0, 1} — thart ar 1.58 giotán in aghaidh an pharaiméadair.

Toradh:

Laghdú 70-80% ar an tomhaltas fuinnimh
Luasú 2.3x go 6.1x ar CPUanna caighdeánacha
Samhail 100 bhilliún paraiméadar ag rith ar ríomhaire deisce caighdeánach

Ní aisling an ceannas AI a thuilleadh. Is réaltacht theicniúil é.

Déanann Inference Áitiúil Caighdeán

RTX 5090: Croí Stáisiúin Oibre AI

Ag tús 2025, seolann NVIDIA an RTX 5090. 32 GB cuimhne GDDR7, bandaleithead 1.79 TB/s (+77% i gcomparáid leis an nglúin roimhe seo).

Torthaí ar chárta tomhaltóra:

Llama 4 8B (4-bhíog): 180 comhartha/soicind
DeepSeek-R1 14B (4-bhíog): 89 comhartha/soicind
Qwen 2.5 32B (4-bhíog): 45 comhartha/soicind

Imríonn samhlacha 70B+ anois ar chumraíochtaí il-GPU áitiúla le feidhmíocht thionsclaíoch.

vLLM vs Ollama

Dhá éiceachóras a sháraíonn:

vLLM: Caighdeán táirgthe. Inneall PagedAttention, bainistíocht optamaithe ar cache KV, úsáideoirí ilchomhuaineacha.
Ollama: Is fearr le forbróirí. Simplíocht shuntasach, náid chumraíocht, tacaíocht dúchasach macOS/Linux/Windows.

Ré Gníomhaireachta: Ó Chomhrá go Gníomh

Devstral 2: AI i Seirbhís an Chóid

Nollaig 2025. Seolann Mistral AI Devstral 2, 123 bhilliún paraiméadar optamaithe le haghaidh forbartha bogearraí.

Scór SWE-bench Verified: 72,2%. Cothrom le Claude Sonnet 4, fós seacht n-uaire níos daoire.

Praghas: 0,40 $ in aghaidh milliún comhartha. Bíonn forbairt a bhfuil AI ag tacú léi inmharthanach go heacnamaíoch do ghnólachtaí beaga agus neamhspleáigh.

Vibe CLI: AI a Chódálann Léi Féin

An mhí chéanna, seolann Mistral Vibe CLI. Ordaíonn an uirlis seo go neamhspleách athruithe casta ar fud bunúsanna cód iomlána.

Is féidir le samhlacha gníomhaireachta 2026:

Nascleanúint a dhéanamh ar chórais comhaid chasta
Spleáchais a aithint idir creatlacha
Teipeanna tástála a bhrath agus féincheartú a dhéanamh

Téimid ó “AI comhrá” go “AI gnímh”.

Rialáil: Cad atá Fágtha den Oscailt?

OSAID 1.0: An Sainmhíniú Oifigiúil

Deireadh Fómhair 2024. Foilsíonn an Open Source Initiative sainmhíniú oifigiúil ar Open Source AI.

Chun cáiliú mar chód oscailte, ní mór don chóras ceithre shaoirse a chinntiú: úsáid, staidéar, athrú agus comhroinnt. Trí chomhpháirt riachtanach:

Cód: Cód iomlán réamh-oiliúna, scagtha agus inference
Paraiméadair: Meáchain, socruithe optamóra, cumraíochtaí ailtireachta
Sonraí: Doiciméadú mionsonraithe ar bhunús, roghnú agus próiseáil

Toradh? Níl formhór na samhalacha “open source” reatha ag teacht leis na caighdeáin. Tá easpa trédhearcachta sonraí iomlán i Llama 4, Mistral, fiú GPT-OSS.

Ní bhaineann Pythia (EleutherAI) agus OLMo (AI2) an lipéad “open source fíor” amach.

Struchtúraíonn AI Act AE an Margadh

Ó Feabhra 2025, tá AI Act AE i bhfeidhm. Baineann samhlacha open source leas as díolúintí suntasacha — chomh fada nach n-aicmítear iad mar “riosca córasach”.

I gcás samhalacha a sháraíonn 10^25 FLOPanna, baineann oibleagáidí doiciméadachta agus chibearshlándála, beag beann ar an gceadúnas.

2026-2030: Cad atá Romhainn?

Treochtaí a bhfuil Táirgiú i ndán Dóibh

Post-Transformer: Ag teacht chun cinn ar ailtireachtaí nua chun castacht chearnach an aird a laghdú. Níl BitNet ach tús.

Edge AI: Ritheann samhlacha cosúil le Ministral 3B ar fhóin chliste le comhthéacs ollmhór. Pléascfaidh uathoibriú an tí agus róbatacht phearsanta.

Ceannas Intleachta: Níl gnólachtaí ag iarraidh “cíos” a íoc ar intleacht trí APIanna a thuilleadh. Teastaíonn uathu a n-aigne dhigiteacha féin a bheith acu, oiliúnaithe ar a rúin tionsclaíocha.

Comhar Multi-Gníomhaire: Tá an todhchaí i gcomhthrácht idir samhlacha ó sholáthraithe éagsúla. Fadhbanna a réiteach trí chomhar in áit fórsa mhonolitigh.

An Nua-SEO Paradaim

D’athraigh comhtháthú ollmhór LLManna isteach in innill chuardaigh infheictheacht ar líne. Labhraímid anois faoi GEO (Generative Engine Optimization).

In 2026, gabhann thart ar 25% den tráchtáil orgánach thraidisiúnta freagraí díreacha ginte ag AI. Ní chliceálann úsáideoirí a thuilleadh — léann siad an t-aischéimniú.

I gcás branda, ní mheastar an rath a thuilleadh le rangú Google. Meastar é le minicíocht agus le cobhsaíocht na n-aistriúchán i bhfreagraí ginte Gemini 3 nó GPT-5.

Agus Anois?

Chruthaigh éiceachóras open source 2026 rud amháin suntasach: ní ideáil eiticiúla an trédhearcacht agus an comhar, is buntáistí iomaíochais shárshaothraithe iad.

Trí mhonaplachtaí intleachta a bhriseadh, d’athraigh an cód oscailte AI ó sheirbhís eisiach go bonneagar poiblí domhanda — chomh fúndúil le leictreachas nó idirlíon.

Tá comhionannas teicniúil bainte amach. An chéad teorainn eile? Féinriail iomlán na gcóras i seirbhís an chine daonna.

Comhlántar, uaireanta cuirtear in áit, samhlacha géaralaitheacha ollmhóra le réaltraí samhalacha speisialaithe, níos eacnamaí, níos cruinne, níos suveréine.

Bhuaigh an cód oscailte. Is stair an chuid eile.