Pāriet uz galveno saturu
Back to Insights
Open Source LLM DeepSeek Llama Mistral Kimi Transformer AI Suverenitāte

Open Source Uzvarēja: Kā Brīvā AI Ieguva Pasauli (2017-2026)

By Yoram Halberstam 35 min read

Transformer: Izgudrojums, kas Mainīja Visu

  1. gada jūnijā astoņi Google pētnieki publicēja divpadsmit lapaspusju garu rakstu. Viņi vēl nezināja, bet tieši tikko aizdedzināja revolūcijas degturi, kas pārveidos cilvēci.

Transformer — tā tas saucas — aizvietoja atkārtotās neironu tīkļus ar uzmanības mehānismu, kas ļauj masīvu paralēlo datu apstrādi. Atšķirībā no iepriekšējām arhitektūrām, kas apstrādāja vārdus pa vienam, Transformer redz visu teikumu uzreiz. Šī niansētā atšķirība maina visu.

Sešus gadus vēlāk, 2026. gada janvārī, atvērtā koda ekosistēma dominē globālajā mākslīgajā intelektā. Tas, kas kādreiz bija tikai akadēmisks papildinājums patentētajiem gigantiem, kļuva par rūpniecības inovāciju dzinējspēku. Kā mēs nonācām līdz šim?

2017
Transformer gada
2023
Llama efekts
2026
Sasniegta tehniskā vienlīdzība

Pirmie Ceļu Licēji (2018-2021)

GPT-2: Dzirkstele, kas Modināja Kopien

  1. gada jūnijs. OpenAI izlaiž GPT-2. Modelis ir biedējošs — tik ļoti, ka OpenAI šaubās, vai to padarīt publisku. Viņu arguments? Spēja ģenerēt saliktu tekstu varētu kalpot dezinformācijai.

Nepareizs aprēķins. Kopiena nepiecietīgi uztver, ja no tās slēpj rotaļlietas. Kad GPT-2 beidzot tiek izdots ar MIT licenci, pētnieki no visas pasaules to satver. Veidojas kolektīvs: EleutherAI. Viņu misija? Pierādīt, ka modeļus ar miljardiem parametru var apmācīt bez starptautiskā uzņēmuma resursiem.

"Mēs gribējām pierādīt, ka atvērtajai zinātnei nav vajadzīgi miljardi dolāru, lai virzītos uz priekšu."

— Connor Leahy, EleutherAI dibinātājs

Google Atbild ar BERT un T5

Pa to laiku Google nesēž ar saliktām rokām. BERT (2018. gada oktobris) revolucionizē divvirzienu valodas izpratni. T5 (2020. gada februāris) piedāvā vienotu sistēmu, kurā katrs uzdevums kļūst par teksta-teksta transformāciju.

Šie modeļi, kas izdoti ar Apache 2.0 licenci, kļūst par tūkstošiem akadēmisko pētniecības projektu pamatu. Tie pierāda vienu būtisku lietu: masīva priekšapmācība, kam seko precīza regulēšana, ir karaliskais ceļš.

Kopienas Agrīnie Panākumi

  1. gada martā EleutherAI izdod GPT-Neo ar 2,7 miljardiem parametru. Tas ir tehnisks panākums: modelis konkurē ar tā laika GPT-3, pilnībā apmācīts, izmantojot ziedoto skaitļošanas jaudu un brīvprātīgo darbu.

Vēstījums ir skaidrs: atvērtais kods var konkurēt ar milžiem.

2022: Atvērtā Zinātne Zem Spiediena

BigScience un BLOOM: Bezprecedenta Pieeja

  1. gads ir pagrieziena punkts. OpenAI aizver savus modeļus aiz maksas API. Kopiena reaģē savādāk.

BigScience, ko koordinē Hugging Face, pulcē 1000 pētniekus no 60 valstīm. Viņu mērķis? Izveidot lielāko jebkad izveidoto daudzvalodu atvērtā koda modeli. Rezultāts: BLOOM, 176 miljardi parametru, 46 valodas, 13 programmēšanas valodas.

To, kas padara BLOOM par vēsturisku, nav tā izmērs. Tā ir pilnīga pārredzamība: publiski apmācības dati, atvērtā koda kods, pilnīgs apmācības žurnāls. Pirmo reizi mēs patiešām varam saprast, kā dzimis LLM.

Meta Iebrauc ar Spēku OPT

Gandrīz vienlaicīgi Meta AI palaiž OPT (Open Pre-trained Transformer). Tāds pats izmērs kā GPT-3, bet ar vienu būtisku atšķirību: pilnīga apmācības procesa dokumentācija.

Pētnieki beidzot var izpētīt šāda mēroga modeli bez inženierijas.

Galactica: Priekšnojauta

  1. gada novembris. Meta mēģina specializēt AI ar Galactica, kas veltīta zinātniskajai literatūrai. Modelis tiek atsaukts 48 stundu laikā pēc kritikas par halucinācijām.

Neveiksme? Ne gluži. Galactica liek pamatus specializētu korpusu apmācībai. Tendence, kas eksplodēs pēc trim gadiem.

2023: Gads, kad Viss Mainījās

2023. gada 24. februāris: Llama Efekts

Tajā dienā Meta publicē Llama. Modelis nav paredzēts plašai sabiedrībai — tikai pētniecībai. Bet tā svari noplūst tiešsaistē dienu laikā.

Revolūcijas aizdedzinātājs.

Llama pierāda, ka pieticīgāks modelis (no 7 līdz 65 miljardiem parametru), kas apmācīts ar vairāk žetoniem, var pārspēt milžus. Kopiena to uzreiz satver.

Modelis Datums Galvenā Inovācija Licence
Alpaca 2023. gada marts Zemas izmaksas precīza regulēšana caur self-instruct Ne-komerciāla
Vicuna 2023. gada aprīlis 90% ChatGPT kvalitāte par 500 USD apmācības izmaksām Ne-komerciāla
Falcon 40B 2023. gada jūnijs Pirmais atvērtā koda modelis, kas dominē etalonos Apache 2.0
Mistral 7B 2023. gada oktobris Ekstremāla efektivitāte ar Sliding Window Attention Apache 2.0
Mixtral 8x7B 2023. gada decembris Demokratizēta Mixture of Experts (MoE) Apache 2.0

QLoRA: Vietējā Demokratizācija

  1. gada aprīlis. Viena tehnoloģija maina visu: QLoRA (Quantized Low-Rank Adaptation).

Rezultāts? 65 miljardu parametru modeļa precīza regulēšana uz vienas patērētāju GPU. Mazie uzņēmumi tagad var izveidot savu AI bez masīvas infrastruktūras.

Šķēršļi krīt viens pēc otra.

2024-2025: Tehniskā Vienlīdzība

DeepSeek: Ķīna Ienāk Scenā

  1. gada vasara iezīmē jauna nozīmīga spēlētāja ierašanos: DeepSeek, ķīņu laboratorija, kas pieder High-Flyer Quant.

Viņu meistardarbs? Ultra-efektīva MoE arhitektūra un MLA (Multi-head Latent Attention) mehānisms, kas samazina KV kešatmiņas vajadzības par 93%.

Rezultāts 2025. gada janvārī: DeepSeek-V3 vienlīdzinās ar GPT-4 par daļu izmaksu. Starptautiskā kopiena atklāj, ka atvērtais kods vairs nav sekotājs — tas ir līderis.

OpenAI Padodas Spiedienam

  1. gada augusts. OpenAI, pēc gadiem ilgas slēgtības, izdod GPT-OSS. Pirmais modelis ar atvērtiem svariem kopš GPT-2. Optimizēts aģentu darba plūsmām un garam kontekstam.

Kāpēc šis pagrieziens? Atvērtā koda konkurences spiediens kļuva pārāk spēcīgs. Kad bezmaksas modeļi vienlīdzinās ar jūsu, slēgšana vairs nepietiek.

Meta Atbild ar Llama 4

Meta tūlītējā atbilde: Llama 4. Iedzimti multimodāls, spējīgs apstrādāt 10 miljonus konteksta žetonu.

Iedomājieties: visas koda bāzes analīze vienā pieprasījumā. Tagad tas ir iespējams — un bez maksas.

2026. gada Janvāris: Atvērtais Kods Valda

Labāko Modeļu Reitings

Šeit mēs esam šodien:

Vieta Modelis Izstrādātājs Kvalitātes Rezultāts Specializācija
1 Kimi K2.5 (Reasoning) Moonshot AI 46,77 Matemātika, sarežģīta spriešana
2 GLM-4.7 (Thinking) Zhipu AI 41,70 Programmēšana, Redze-Valoda
3 DeepSeek V3.2 DeepSeek 41,20 Efektivitāte, zemas izsecināšanas izmaksas
4 GPT-OSS-120B OpenAI 40,50 Rīku izmantošana, aģentiskums
5 Llama 4 (70B) Meta 39,80 Multimodalitāte, ekosistēma
6 Qwen3-235B Alibaba 39,20 Daudzvalodība, RAG

Spriedums ir nežēlīgs: 5 no 6 labākajiem modeļiem ir atvērtā koda. Tikai GPT-OSS, ironiski, nes bijušā patentētā līdera vārdu.

Spēli Mainošās Inovācijas

MLA un DeepSeek Sparse Attention: Miljonu konteksta žetonu apstrāde prasīja aizliegtu KV kešatmiņu. MLA agresīvi saspiest šo kešatmiņu. DSA samazina skaitļošanas sarežģītību, apstrādājot tikai atbilstošās secības daļas.

BitNet 1.58b: 2025. gada visradikālākā inovācija. Tā vietā, lai kodētu svarus ar 16 bitiem, BitNet izmanto ternāras vērtības {-1, 0, 1} — aptuveni 1,58 bitus parametram.

Sekas:

  • 70-80% enerģijas patēriņa samazinājums
  • 2,3x līdz 6,1x paātrinājums standarta CPU
  • 100 miljardu parametru modelis, kas darbojas standarta datorā

AI suverenitāte vairs nav sapnis. Tā ir tehniska realitāte.

Vietējā Izvade Kļūst par Standartu

RTX 5090: AI Darbstaciju Sirds

  1. gada sākumā NVIDIA izlaiž RTX 5090. 32 GB GDDR7 atmiņas, 1,79 TB/s caurlaide (+77% salīdzinājumā ar iepriekšējo paaudzi).

Rezultāti uz patērētāju kartes:

  • Llama 4 8B (4-bit): 180 žetonu/sekundē
  • DeepSeek-R1 14B (4-bit): 89 žetonu/sekundē
  • Qwen 2.5 32B (4-bit): 45 žetonu/sekundē

70B+ modeļi tagad darbojas vietējās vairāku GPU konfigurācijās ar rūpniecisko veiktspēju.

vLLM vs Ollama

Divas ekosistēmas dominē:

  • vLLM: Ražošanas standarts. PagedAttention dzinējs, optimizēta KV kešatmiņas pārvaldība, vairāki vienlaicīgi lietotāji.
  • Ollama: Izstrādātāju favorīts. Ekstrēma vienkāršība, nulles konfigurācija, dzimtais macOS/Linux/Windows atbalsts.

Aģentu Ēra: No Tērzēšanas uz Darbību

Devstral 2: AI Koda Pakalpojumā

  1. gada decembris. Mistral AI palaiž Devstral 2, 123 miljardi parametru, optimizēti programmatūras izstrādei.

SWE-bench Verified rezultāts: 72,2%. Vienāds ar Claude Sonnet 4, tomēr septiņas reizes dārgāks.

Cena: 0,40 $ par miljonu žetonu. AI atbalstīta izstrāde kļūst ekonomiski dzīvotspējīga mazajiem uzņēmumiem un neatkarīgajiem.

Vibe CLI: AI, kas Programmē Pati

Tajā pašā mēnesī Mistral izdod Vibe CLI. Šis rīks autonomi orķestrē sarežģītas izmaiņas visās koda bāzēs.

  1. gada aģentu modeļi var:
  • Navigēt sarežģītās failu sistēmās
  • Identificēt atkarības starp ietvariem
  • Noteikt testu neveiksmes un pašlaboties
  • Uzticami ražot strukturētus JSON izvades programmatūras integrācijai

Mēs pārejam no “tērzēšanas AI” uz “darbības AI”.

Regulēšana: Kas Paliek no Atvērtā?

OSAID 1.0: Oficiālā Definīcija

  1. gada oktobris. Open Source Initiative beidzot publicē oficiālu Open Source AI definīciju.

Lai kvalificētos kā atvērtais kods, sistēmai jāgarantē četras brīvības: izmantošana, studēšana, modifikācija un kopīgošana. Trīs būtiskās sastāvdaļas:

  1. Kods: Pilnīgs priekšapmācības, filtrēšanas un izsecināšanas kods
  2. Parametri: Svari, optimizatora iestatījumi, arhitektūras konfigurācijas
  3. Dati: Detalizēta dokumentācija par izcelsmi, atlasi un apstrādi

Rezultāts? Lielākā daļa mūsdienu “atvērtā koda” modeļu neatbilst. Llama 4, Mistral, pat GPT-OSS trūkst pilnīgas datu pārredzamības.

Tikai Pythia (EleutherAI) un OLMo (AI2) iegūst “patiesi atvērtā koda” etiķeti.

EU AI Act Strukturē Tirgu

No 2025. gada februāra EU AI Act ir spēkā. Atvērtā koda modeļi gūst ievērojamus izņēmumus — ar nosacījumu, ka tie netiek klasificēti kā “sistemātisks risks”.

Modeļiem, kas pārsniedz 10^25 FLOP, piemēro dokumentācijas un kiberdrošības pienākumus, neatkarīgi no licences.

2026-2030: Kas Mūs Sagaida

Veidojošās Tendences

Post-Transformer: Jaunas arhitektūras parādās, lai samazinātu uzmanības kvadrātisko sarežģītību. BitNet ir tikai sākums.

Edge AI: Modeļi, piemēram, Ministral 3B, darbojas viedtālruņos ar masīvu kontekstu. Mājas automatizācija un personiskā robotika eksplodēs.

Intelekta Suverenitāte: Uzņēmumi vairs nevēlas “īrēt” intelektu caur API. Viņi vēlas būt par saviem digitālajiem smadzenēm, apmācītiem uz savas rūpniecības noslēpumiem.

Multi-Agent Sadarbība: Nākotne slēpjas komunikācijā starp dažādu piegādātāju modeļiem. Problēmu risināšana sadarbībā, nevis monolītā spēkā.

Jaunā SEO Paradigma

Masīvā LLM integrācija meklētājprogrammās ir transformējusi tiešsaistes redzamību. Tagad mēs runājam par GEO (Generative Engine Optimization).

  1. gadā aptuveni 25% no tradicionālās organiskās plūsmas tiek iegūts no AI ģenerētām tiešajām atbildēm. Lietotāji vairs neklikšķina — lasa sintēzi.

Zīmolam panākums vairs netiek mērīts ar Google reitingu. To mēra ar citātu biežumu un stabilitāti Gemini 3 vai GPT-5 ģeneratīvajās atbildēs.

Un Tagad?

  1. gada atvērtā koda ekosistēma pierādīja vienu būtisku lietu: pārredzamība un sadarbība nav ētiski ideāli, tie ir pārāki konkurences priekšrocības.

Salaužot intelekta monopolus, atvērtais kods pārveidoja AI no ekskluzīva pakalpojuma par globālu publisko infrastruktūru — tikpat fundamentālu kā elektrība vai internets.

Tehniskā vienlīdzība ir sasniegta. Nākamā robeža? Sistēmu pilnīga autonomija cilvēces labā.

Masīvie ģenerālistu modeļi tiek papildināti, dažreiz aizstāti, ar specializētu, ekonomiskāku, precīzāku, suverēnāku modeļu kopumiem.

Atvērtais kods uzvarēja. Viss pārējais ir tikai vēsture.

Saturs