Transformer: Fionnachtain a D’athraigh Rud ar Bith
I mí an Mheithimh 2017, d’fhoilsigh ocht n-eolaí Google alt dhá leathanach dhéag. Ní raibh a fhios acu go fóill, ach las siad an méarchaill le réabhlóid a dhéanfadh athrú ar an gcine daonna.
Transformer — sin an t-ainm atá air — chuir sé meicníocht aird in áit na líonraí néarón athfhillteacha a chuireann comhthreabhú mórscála ar chúrsaíocht sonraí ar bun. Murab ionann agus na hailtireachtaí roimhe sin a phróiseáil focail aonair ag an am, feiceann an Transformer an abairt iomlán ag an am céanna. Déanann an difríocht shoiléir seo difríocht.
Sé bliana ina dhiaidh sin, i mí Eanáir 2026, táispeánann córas open source domhanda an domhanda. An rud a bhí ina chomhlachta acadúil do na giofóga propráideacha, tá sé ina innéacs nuálaíochta tionsclaíochta. Conas a tháinig muid anseo?
Na Chéad Phionéirí (2018-2021)
GPT-2: An Spréach a Dhuisigh an Pobal
Meitheamh 2018. Cuireann OpenAI GPT-2 ar fáil. Is scanraitheach an samhail é — chomh scanraitheach nach ndéanann OpenAI teacht air go poiblí. An t-argóint acu? D’fhéadfadh an cumas téacs comhéifeachtach a ghiniúint eolas mícheart a chothú.
Ríomh mícheart. Ní fheidhmeoidh an pobal le bréagáin a choinneáil uathu. Nuair a chuirtear GPT-2 ar fáil faoi cheadúnas MIT de réir a chéile, gabhann taighdeoirí ó gach cearn den domhan leis. Tugtar bailiúchán le chéile: EleutherAI. An misean acu? Cruthú gur féidir samhlacha le paraiméadair billiúnacha a oiliúint gan acmhainní corparáide ilnáisiúnta.
"Theastaigh uainn a chruthú nach raibh billiúiní dollar ag teastáil ón eolaíocht oscailte chun dul chun cinn."
Freagraíonn Google le BERT agus T5
Idir an dá linn, níl Google ag suí leis. Réabhlóideoidh BERT (Deireadh Fómhair 2018) tuiscint dháiríre ar an teanga. Cuireann T5 (Feabhra 2020) creat aontaithe ar fáil ina ndéanann gach tasc claochlú téacs-go-téacs.
Bíonn na samhlacha seo, a cuirtear ar fáil faoi cheadúnas Apache 2.0, mar bhonn do mhílte tasc taighde acadúil. Cruthaíonn siad rud amháin tábhachtach: is é réamh-oiliúint mhórscála, le mínchoigeartú ina diaidh, an bealach ríoga.
Luathéachtaí an Phobail
I mí an Mhárta 2021, cuireann EleutherAI GPT-Neo ar fáil le 2.7 bhilliún paraiméadar. Is éacht teicniúil é: déanann an tsamhail iomaíocht le GPT-3 an ama sin, go hiomlán oiliúnaithe ar ríomhacht bhronnta agus ar shaothar deonach.
Is soiléir an teachtaireacht: is féidir le open source dul i ngleic leis na giaráin.
2022: An Eolaíocht Oscailte faoi Bhrú
BigScience agus BLOOM: Cur Chuige Gan Sárú
Léiríonn 2022 pointe casctha. Dúnann OpenAI a samhlacha taobh thiar d’APIanna íoctha. Freagraíonn an pobal ar bhealach difriúil.
Tugann BigScience, a chomhordú ó Hugging Face, 1,000 taighdeoir ó 60 tír le chéile. An sprioc acu? An tsamhail ildhathach open source is mó a cruthaíodh riamh a chruthú. An toradh: BLOOM, 176 bhilliún paraiméadar, 46 teanga, 13 teanga ríomhchláraithe.
Níl méid BLOOM mar a dhéanann stair de. Is é an trédhearcacht iomlán é: sonraí oiliúna poiblí, cód open source, loga oiliúna iomlán. An chéad uair, is féidir linn tuiscint iomlán a fháil ar conas a rugadh LLM.
Buille Láidir Meta le OPT
Beagnach ag an am céanna, seolann Meta AI OPT (Open Pre-trained Transformer). An méid céanna le GPT-3, ach le difríocht amháin ríthábhachtach: doiciméadú iomlán ar an bpróiseas oiliúna.
Is féidir le taighdeoirí staidéar a dhéanamh ar shamhail den scála seo gan ailtireacht a chur ar an gcúl a bhíonn ar an tosach.
Galactica: Réamhchomhartha
Samhain 2022. Déanann Meta iarracht AI a dhíolmhú le Galactica, dírithe ar litríocht eolaíoch. Tógann an tsamhail amach taobh istigh de 48 uair an chloig tar éis cáineadh faoina hallucinations.
Teip? Go hiomlán. Cuireann Galactica na bunchloch le haghaidh oiliúna ar chóras speisialaithe. Treocht a bhfuil pléascadh i ndán di trí bliana ina dhiaidh sin.
2023: An Bliain a d’Athraigh Rud ar Bith
24 Feabhra 2023: Éifeacht Llama
An lá sin, cuireann Meta Llama ar fáil. Níl an tsamhail dírithe ar an bpobal mór — taighde amháin. Ach sceitheann a meáchain ar líne laethanta.
An t-adharc réabhlóide.
Cruthaíonn Llama gur féidir le samhail níos coimeádaí (7 go 65 bhilliún paraiméadar) a oiliúint ar níos mó comharthaí na ngiaráin a shárú. Gabhann an pobal léi láithreach.
| Samhail | Dáta | Nuálaíocht Chuí | Ceadúnas |
|---|---|---|---|
| Alpaca | Márta 2023 | Mínchoigeartú ísealchostais trí self-instruct | Neamhthráchtála |
| Vicuna | Aibreán 2023 | 90% caighdeán ChatGPT ar chostas oiliúna 500$ | Neamhthráchtála |
| Falcon 40B | Meitheamh 2023 | An chéad tsamhail open source a sháraíonn benchmarks | Apache 2.0 |
| Mistral 7B | Deireadh Fómhair 2023 | Éifeachtúlacht shuntasach trí Sliding Window Attention | Apache 2.0 |
| Mixtral 8x7B | Nollaig 2023 | Deamhcruthú Mixture of Experts (MoE) | Apache 2.0 |
QLoRA: Daonlathú Áitiúil
Aibreán 2023. Athraíonn modh amháin rud ar bith: QLoRA (Quantized Low-Rank Adaptation).
Toradh? Samhail 65 bhilliún paraiméadar a mínchoigeartú ar GPU tomhaltóra amháin. Is féidir le gnólachtaí beaga a n-AI féin a chruthú anois gan bonneagar ollmhór.
Titeann na bacainní ceann ar cheann.
2024-2025: Comhionannas Teicniúil
DeepSeek: An tSín ag Teacht ar an Stáitse
Samhradh 2024. Léiríonn sé teacht ar ghníomhaire nua tábhachtach: DeepSeek, saotharlann Síneach atá ceangailte le High-Flyer Quant.
An caide a bhfuil siad go maith ann? Ailtireacht MoE ultra-éifeachtach agus meicníocht MLA (Multi-head Latent Attention) a laghdaíonn riachtanais chuimhne cache KV 93%.
Toradh i mí Eanáir 2025: DeepSeek-V3 cothrom le GPT-4 ar chostas murúin. Aithníonn an pobal idirnáisiúnta nach leanúr atá sa chód oscailte — is ceannaire é.
Tugann OpenAI faoi Bhrú
Lúnasa 2025. Tar éis blianta faoi ghlas, cuireann OpenAI GPT-OSS ar fáil. An chéad tsamhail le meáchain oscailte ó GPT-2. Optamaithe le haghaidh sreafaí oibre gníomhaireachta agus comhthéacs fada.
Cén fáth an casadh seo? Bhí an brú iomaíoch ón gcód oscailte ró láidir. Nuair a bhíonn samhlacha saor in aisce ar comhchéim le do chuid féin, ní leor an dúnadh.
Freagraíonn Meta le Llama 4
Freagra láithreach Meta: Llama 4. Ilmhodúil go nádúrtha, in ann 10 milliún chomhartha comhthéacs a phróiseáil.
Samhlaigh: anailís ar bhunús cód iomlán i gceist amháin. Is féidir é anois — agus saor in aisce.
Eanáir 2026: Tá an Cód Oscailte i gCeannas
Rangú na nSamhalacha is Fearr
Seo an áit ina bhfuilimid inniu:
| Rang | Samhail | Forbróir | Scór Caighdeáin | Speisialtóireacht |
|---|---|---|---|---|
| 1 | Kimi K2.5 (Reasoning) | Moonshot AI | 46,77 | Matamaitic, réasúnú casta |
| 2 | GLM-4.7 (Thinking) | Zhipu AI | 41,70 | Códú, Amharc-Teanga |
| 3 | DeepSeek V3.2 | DeepSeek | 41,20 | Éifeachtúlacht, costas íseal inference |
| 4 | GPT-OSS-120B | OpenAI | 40,50 | Úsáid uirlisí, gníomhaireacht |
| 5 | Llama 4 (70B) | Meta | 39,80 | Ilmhodúlacht, éiceachóras |
| 6 | Qwen3-235B | Alibaba | 39,20 | Ilteangachas, RAG |
Is cruaidh an breithiúnas é: as 6 samhail is fearr, tá 5 open source. Níl ach GPT-OSS, go híorónach, a iompraíonn ainm iarcheannaire propráideach.
Nuálaíochtaí a d’Athraigh an Cluiche
MLA agus DeepSeek Sparse Attention: Theastaigh cuimhne cache KV dhocht chun na milliúin chomharthaí comhthéacs a láimhseáil. Comhbhrúíonn an MLA an cache seo go hagressach. Laghdaíonn DSA castacht an ríomhaireachta trí chodanna ábhartha den seicheamh amháin a phróiseáil.
BitNet 1.58b: An nuálaíocht is radacaí de 2025. In ionad meáchain a chódú ar 16 ngiotán, úsálann BitNet luachanna ternártha {-1, 0, 1} — thart ar 1.58 giotán in aghaidh an pharaiméadair.
Toradh:
- Laghdú 70-80% ar an tomhaltas fuinnimh
- Luasú 2.3x go 6.1x ar CPUanna caighdeánacha
- Samhail 100 bhilliún paraiméadar ag rith ar ríomhaire deisce caighdeánach
Ní aisling an ceannas AI a thuilleadh. Is réaltacht theicniúil é.
Déanann Inference Áitiúil Caighdeán
RTX 5090: Croí Stáisiúin Oibre AI
Ag tús 2025, seolann NVIDIA an RTX 5090. 32 GB cuimhne GDDR7, bandaleithead 1.79 TB/s (+77% i gcomparáid leis an nglúin roimhe seo).
Torthaí ar chárta tomhaltóra:
- Llama 4 8B (4-bhíog): 180 comhartha/soicind
- DeepSeek-R1 14B (4-bhíog): 89 comhartha/soicind
- Qwen 2.5 32B (4-bhíog): 45 comhartha/soicind
Imríonn samhlacha 70B+ anois ar chumraíochtaí il-GPU áitiúla le feidhmíocht thionsclaíoch.
vLLM vs Ollama
Dhá éiceachóras a sháraíonn:
- vLLM: Caighdeán táirgthe. Inneall PagedAttention, bainistíocht optamaithe ar cache KV, úsáideoirí ilchomhuaineacha.
- Ollama: Is fearr le forbróirí. Simplíocht shuntasach, náid chumraíocht, tacaíocht dúchasach macOS/Linux/Windows.
Ré Gníomhaireachta: Ó Chomhrá go Gníomh
Devstral 2: AI i Seirbhís an Chóid
Nollaig 2025. Seolann Mistral AI Devstral 2, 123 bhilliún paraiméadar optamaithe le haghaidh forbartha bogearraí.
Scór SWE-bench Verified: 72,2%. Cothrom le Claude Sonnet 4, fós seacht n-uaire níos daoire.
Praghas: 0,40 $ in aghaidh milliún comhartha. Bíonn forbairt a bhfuil AI ag tacú léi inmharthanach go heacnamaíoch do ghnólachtaí beaga agus neamhspleáigh.
Vibe CLI: AI a Chódálann Léi Féin
An mhí chéanna, seolann Mistral Vibe CLI. Ordaíonn an uirlis seo go neamhspleách athruithe casta ar fud bunúsanna cód iomlána.
Is féidir le samhlacha gníomhaireachta 2026:
- Nascleanúint a dhéanamh ar chórais comhaid chasta
- Spleáchais a aithint idir creatlacha
- Teipeanna tástála a bhrath agus féincheartú a dhéanamh
Téimid ó “AI comhrá” go “AI gnímh”.
Rialáil: Cad atá Fágtha den Oscailt?
OSAID 1.0: An Sainmhíniú Oifigiúil
Deireadh Fómhair 2024. Foilsíonn an Open Source Initiative sainmhíniú oifigiúil ar Open Source AI.
Chun cáiliú mar chód oscailte, ní mór don chóras ceithre shaoirse a chinntiú: úsáid, staidéar, athrú agus comhroinnt. Trí chomhpháirt riachtanach:
- Cód: Cód iomlán réamh-oiliúna, scagtha agus inference
- Paraiméadair: Meáchain, socruithe optamóra, cumraíochtaí ailtireachta
- Sonraí: Doiciméadú mionsonraithe ar bhunús, roghnú agus próiseáil
Toradh? Níl formhór na samhalacha “open source” reatha ag teacht leis na caighdeáin. Tá easpa trédhearcachta sonraí iomlán i Llama 4, Mistral, fiú GPT-OSS.
Ní bhaineann Pythia (EleutherAI) agus OLMo (AI2) an lipéad “open source fíor” amach.
Struchtúraíonn AI Act AE an Margadh
Ó Feabhra 2025, tá AI Act AE i bhfeidhm. Baineann samhlacha open source leas as díolúintí suntasacha — chomh fada nach n-aicmítear iad mar “riosca córasach”.
I gcás samhalacha a sháraíonn 10^25 FLOPanna, baineann oibleagáidí doiciméadachta agus chibearshlándála, beag beann ar an gceadúnas.
2026-2030: Cad atá Romhainn?
Treochtaí a bhfuil Táirgiú i ndán Dóibh
Post-Transformer: Ag teacht chun cinn ar ailtireachtaí nua chun castacht chearnach an aird a laghdú. Níl BitNet ach tús.
Edge AI: Ritheann samhlacha cosúil le Ministral 3B ar fhóin chliste le comhthéacs ollmhór. Pléascfaidh uathoibriú an tí agus róbatacht phearsanta.
Ceannas Intleachta: Níl gnólachtaí ag iarraidh “cíos” a íoc ar intleacht trí APIanna a thuilleadh. Teastaíonn uathu a n-aigne dhigiteacha féin a bheith acu, oiliúnaithe ar a rúin tionsclaíocha.
Comhar Multi-Gníomhaire: Tá an todhchaí i gcomhthrácht idir samhlacha ó sholáthraithe éagsúla. Fadhbanna a réiteach trí chomhar in áit fórsa mhonolitigh.
An Nua-SEO Paradaim
D’athraigh comhtháthú ollmhór LLManna isteach in innill chuardaigh infheictheacht ar líne. Labhraímid anois faoi GEO (Generative Engine Optimization).
In 2026, gabhann thart ar 25% den tráchtáil orgánach thraidisiúnta freagraí díreacha ginte ag AI. Ní chliceálann úsáideoirí a thuilleadh — léann siad an t-aischéimniú.
I gcás branda, ní mheastar an rath a thuilleadh le rangú Google. Meastar é le minicíocht agus le cobhsaíocht na n-aistriúchán i bhfreagraí ginte Gemini 3 nó GPT-5.
Agus Anois?
Chruthaigh éiceachóras open source 2026 rud amháin suntasach: ní ideáil eiticiúla an trédhearcacht agus an comhar, is buntáistí iomaíochais shárshaothraithe iad.
Trí mhonaplachtaí intleachta a bhriseadh, d’athraigh an cód oscailte AI ó sheirbhís eisiach go bonneagar poiblí domhanda — chomh fúndúil le leictreachas nó idirlíon.
Tá comhionannas teicniúil bainte amach. An chéad teorainn eile? Féinriail iomlán na gcóras i seirbhís an chine daonna.
Comhlántar, uaireanta cuirtear in áit, samhlacha géaralaitheacha ollmhóra le réaltraí samhalacha speisialaithe, níos eacnamaí, níos cruinne, níos suveréine.
Bhuaigh an cód oscailte. Is stair an chuid eile.