Siirry pääsisältöön
Back to Insights
Open Source LLM DeepSeek Llama Mistral Kimi Transformer Tekoälyn Suvereniteetti

Open Source Voitti: Kuinka Vapaa Tekoäly Valloitti Maailman (2017-2026)

By Yoram Halberstam 35 min read

Transformer: Keksintö, joka Muutti Kaiken

Kesäkuussa 2017 kahdeksan Google-tutkijaa julkaisi kaksitoistasivuisen artikkelin. He eivät vielä tienneet, mutta he olivat juuri sytyttäneet tulen vallankumoukselle, joka muuttaisi ihmiskunnan.

Transformer — näin se nimeltään — korvasi toistuvat neuroverkot huomiomekanismilla, joka mahdollistaa massiivisen rinnakkaisen tiedonkäsittelyn. Toisin kuin aiemmat arkkitehtuurit, jotka käsittelivät sanoja yksi kerrallaan, Transformer näkee koko lauseen kerralla. Tämä hienovarainen ero muuttaa kaiken.

Kuusi vuotta myöhemmin, tammikuussa 2026, open source -ekosysteemi hallitsee maailmanlaajuista tekoälyä. Se, mikä oli kerran vain akateeminen täydennys yksityisille jättiläisille, on nyt teollisuuden innovaatioiden moottori. Miten pääsimme tänne?

2017
Transformerin vuosi
2023
Llama-ilmiö
2026
Tekninen tasa-arvo saavutettu

Ensimmäiset Edelläkävijät (2018-2021)

GPT-2: Kipinä, joka Herätti Yhteisön

Kesäkuu 2018. OpenAI julkaisee GPT-2. Malli on pelottava — niin pelottava, että OpenAI epäröi tehdä siitä julkista. Heidän argumenttinsa? Kyky tuottaa johdonmukaista tekstiä voitaisiin käyttää desinformaatioon.

Väärä laskelma. Yhteisö ei siedä, että siltä viedään lelut. Kun GPT-2 lopulta julkaistaan MIT-lisenssillä, tutkijat ympäri maailmaa tarttuvat siihen. Muodostuu kollektiivi: EleutherAI. Heidän tehtävänsä? Todeta, että malleja, joilla on miljardeja parametreja, voidaan kouluttaa ilman monikansallisen resursseja.

"Halusimme todistaa, että avoin tiede ei tarvinnut miljardeja dollareita edetäkseen."

— Connor Leahy, EleutherAI:n perustaja

Google Iskee Takaisin BERT:llä ja T5:llä

Sillä välin Google ei istu paikoillaan. BERT (lokakuu 2018) mullistaa kaksisuuntaisen kielen ymmärtämisen. T5 (helmikuu 2020) ehdottaa yhtenäistä kehystä, jossa jokainen tehtävä muuttuu tekstistä tekstiksi -transformaatioksi.

Nämä mallit, julkaistut Apache 2.0 -lisenssillä, muodostavat perustan tuhansille akateemisille tutkimusprojekteille. Ne todistavat yhden ratkaisevan asian: massiivinen esikoulutus, jota seuraa hienosäätö, on kuninkaallinen tie.

Yhteisön Ensimmäiset Menestykset

Maaliskuussa 2021 EleutherAI julkaisee GPT-Neon 2,7 miljardilla parametrilla. Se on tekninen menestys: malli kilpailee tuon ajan GPT-3:n kanssa, täysin koulutettu lahjoituslaskennalla ja vapaaehtoistyöllä.

Viesti on selvä: open source voi kilpailla jättiläisten kanssa.

2022: Avoin Tiede Paineen Alaisena

BigScience ja BLOOM: Ennennäkemätön Lähestymistapa

Vuosi 2022 merkitsee käännekohtaa. OpenAI sulkee mallinsa maksettujen API:iden taakse. Yhteisö reagoi toisin.

BigScience, jota koordinoi Hugging Face, kerää 1 000 tutkijaa 60 maasta. Heidän tavoitteensa? Luoda suurin monikielinen open source -malli, joka on koskaan rakennettu. Tulos: BLOOM, 176 miljardia parametria, 46 kieltä, 13 ohjelmointikieltä.

Se, mikä tekee BLOOM:sta historiallisen, ei ole sen koko. Se on täydellinen läpinäkyvyys: julkiset koulutusdata, avoin lähdekoodi, täydellinen koulutusloki. Ensimmäistä kertaa voimme todella ymmärtää, miten LLM syntyi.

Meta Iskee Kovaa OPT:llä

Lähes samanaikaisesti Meta AI käynnistää OPT:n (Open Pre-trained Transformer). Sama koko kuin GPT-3:lla, mutta yhdellä ratkaisevalla erolla: täydellinen dokumentaatio koulutusprosessista.

Tutkijat voivat vihdoin tutkia tämän mittakaavan mallia ilman käänteistä suunnittelua.

Galactica: Ennakoiva

Marraskuu 2022. Meta yrittää erikoistaa tekoälyä Galactica:lla, omistettuna tieteelliselle kirjallisuudelle. Malli vedetään pois 48 tunnin kuluessa kritiikistä hallusinaatioiden takia.

Epäonnistuminen? Ei täysin. Galactica luo pohjan koulutukselle erikoistuneilla korpuksilla. Trendi, joka räjähtäisi kolme vuotta myöhemmin.

2023: Vuosi, jolloin Kaikki Muuttui

24. Helmikuuta 2023: Llama-ilmiö

Sinä päivänä Meta julkaisee Llama:n. Malli ei ole tarkoitettu suurelle yleisölle — vain tutkimukseen. Mutta sen painot vuotavat verkkoon päivissä.

Vallankumouksen sytyke.

Llama todistaa, että vaatimattomampi malli (7–65 miljardia parametria), joka on koulutettu enemmällä datalla, voi ylittää jättiläiset. Yhteisö tarttuu siihen välittömästi.

Malli Päivämäärä Tärkein Innovaatio Lisenssi
Alpaca Maaliskuu 2023 Matalakustannushienosäätö self-instructilla Ei-kaupallinen
Vicuna Huhtikuu 2023 90 % ChatGPT-laatu 500 dollarin koulutuskustannuksilla Ei-kaupallinen
Falcon 40B Kesäkuu 2023 Ensimmäinen open source -malli, joka hallitsee vertailuja Apache 2.0
Mistral 7B Lokakuu 2023 Äärimmäinen tehokkuus Sliding Window Attentionilla Apache 2.0
Mixtral 8x7B Joulukuu 2023 Demokratisoitu Mixture of Experts (MoE) Apache 2.0

QLoRA: Paikallinen Demokratisointi

Huhtikuu 2023. Yksi tekniikka muuttaa kaiken: QLoRA (Quantized Low-Rank Adaptation).

Tulos? Hienosäädä 65 miljardin parametrin malli yhdellä kuluttaja-GPU:lla. Pienet yritykset voivat nyt luoda oman tekoälynsä ilman massiivista infrastruktuuria.

Esteet kaatuvat yksi kerrallaan.

2024-2025: Tekninen Tasa-arvo

DeepSeek: Kiina Astuu Näyttämölle

Kesä 2024 merkitsee uuden tärkeän toimijan saapumista: DeepSeek, High-Flyer Quant:iin kuuluva kiinalainen laboratorio.

Heidän mestarillinen siirtonsa? Ultra-tehokas MoE-arkkitehtuuri ja MLA (Multi-head Latent Attention) -mekanismi, joka vähentää KV-välimuistin muistitarvetta 93 %:lla.

Tulos tammikuussa 2025: DeepSeek-V3 saavuttaa GPT-4:n tasolla murto-osalla kustannuksista. Kansainvälinen yhteisö huomaa, että open source ei ole enää seuraaja — se on johtaja.

OpenAI Antaa Periksi Paineelle

Elokuu 2025. OpenAI, vuosien sulkeutumisen jälkeen, julkaisee GPT-OSS:n. Ensimmäinen avoimen painon malli sitten GPT-2:n. Optimoitu agenttisille työnkuluille ja pitkälle kontekstille.

Miksi tämä käännös? Open source:n kilpailupaine oli tullut liian vahvaksi. Kun ilmaiset mallit vastaavat omiasi, sulkeminen ei enää riitä.

Meta Vastaa Llama 4:llä

Metan välitön vastaus: Llama 4. Natiivisti monimodalinen, kykenevä käsittelemään 10 miljoonaa kontekstin tokenia.

Kuvittele: analysoida koko koodikanta yhdellä kyselyllä. Nyt se on mahdollista — ja ilmaista.

Tammikuu 2026: Open Source Hallitsee

Parhaiden Mallien Sijoitus

Tässä olemme tänään:

Sijoitus Malli Kehittäjä Laatupisteet Erikoisuus
1 Kimi K2.5 (Reasoning) Moonshot AI 46,77 Matematiikka, monimutkainen päättely
2 GLM-4.7 (Thinking) Zhipu AI 41,70 Koodaus, Näkö-Kieli
3 DeepSeek V3.2 DeepSeek 41,20 Tehokkuus, alhaiset päätelmakustannukset
4 GPT-OSS-120B OpenAI 40,50 Työkalujen käyttö, agenttisuus
5 Llama 4 (70B) Meta 39,80 Monimodaalisuus, ekosysteemi
6 Qwen3-235B Alibaba 39,20 Monikielisyys, RAG

Tuomio on julma: 5 kuudesta parhaasta mallista on open source. Vain GPT-OSS, ironisesti, kantaa entisen yksityisen johtajan nimeä.

Peliä Muuttaneet Innovaatiot

MLA ja DeepSeek Sparse Attention: Miljoonien kontekstitokenien käsittely vaati kiellettyä KV-välimuistia. MLA pakkaa tämän välimuistin aggressiivisesti. DSA vähentää laskennan monimutkaisuutta käsittelemällä vain relevantit sekvenssin osat.

BitNet 1.58b: Vuoden 2025 radikaalein innovaatio. Sen sijaan, että painot koodattaisiin 16 bitillä, BitNet käyttää kolmiarvoisia arvoja {-1, 0, 1} — noin 1,58 bittiä per parametri.

Seuraus:

  • 70–80 % energiankulutuksen vähennys
  • 2,3x–6,1x nopeutus standardiprosessoreilla
  • 100 miljardin parametrin malli, joka toimii tavallisella pöytätietokoneella

Tekoälyn suvereniteetti ei ole enää unelma. Se on tekninen todellisuus.

Paikallinen Päätelmästä Tulee Standardi

RTX 5090: Tekoälytyöasemien Sydän

Vuoden 2025 alussa NVIDIA julkaisee RTX 5090:n. 32 Gt GDDR7-muistia, 1,79 Tt/s kaistanleveys (+77 % edelliseen sukupolveen verrattuna).

Tulokset kuluttajakortilla:

  • Llama 4 8B (4-bittinen): 180 tokenia/sekunti
  • DeepSeek-R1 14B (4-bittinen): 89 tokenia/sekunti
  • Qwen 2.5 32B (4-bittinen): 45 tokenia/sekunti

70B+ mallit toimivat nyt paikallisissa multi-GPU-kokoonpanoissa teollisella suorituskyvyllä.

vLLM vs Ollama

Kaksi ekosysteemiä hallitsee:

  • vLLM: Tuotantostandardi. PagedAttention-moottori, optimoitu KV-välimuistin hallinta, useita samanaikaisia käyttäjiä.
  • Ollama: Kehittäjien suosikki. Äärimmäinen yksinkertaisuus, nolla konfigurointi, natiivi macOS/Linux/Windows-tuki.

Agenttinen Aikakausi: Chatista Toimintaan

Devstral 2: Tekoäly Koodin Palveluksessa

Joulukuu 2025. Mistral AI käynnistää Devstral 2:n, 123 miljardia parametria optimoitu ohjelmistokehitykseen.

SWE-bench Verified -pisteet: 72,2 %. Yhtä suuri kuin Claude Sonnet 4, mutta seitsemän kertaa kalliimpi.

Hinta: 0,40 dollaria miljoonaa tokenia kohden. Tekoälyavusteinen kehitys tulee taloudellisesti kannattavaksi pk-yrityksille ja freelancerille.

Vibe CLI: Tekoäly, joka Ohjelmoi Itse

Samana kuukautena Mistral käynnistää Vibe CLI:n. Tämä työkalu orkesteroi itsenäisesti monimutkaisia muutoksia koko koodikannoissa.

Vuoden 2026 agenttiset mallit voivat:

  • Navigoida monimutkaisissa tiedostojärjestelmissä
  • Tunnistaa riippuvuuksia kehysten välillä
  • Havaita testivirheitä ja itsekorjata
  • Tuottaa luotettavasti strukturoituja JSON-tulosteita ohjelmistointegraatiota varten

Siirrymme “chat-tekoälystä” “toiminta-tekoälyyn”.

Sääntely: Mitä Jäljellä on Avoimesta?

OSAID 1.0: Virallinen Määritelmä

Lokakuu 2024. Open Source Initiative julkaisee vihdoin virallisen määritelmän Open Source AI:sta.

Jotta järjestelmä voisi kelvata open source -järjestelmäksi, sen on taattava neljä vapautta: käyttää, tutkia, muokata ja jakaa. Kolme ratkaisevaa komponenttia:

  1. Koodi: Täydellinen esikoulutus-, suodatus- ja päätelmäkoodi
  2. Parametrit: Painot, optimointiasetukset, arkkitehtuurin konfiguraatiot
  3. Tiedot: Yksityiskohtainen dokumentaatio alkuperästä, valinnasta ja käsittelystä

Tulos? Useimmat nykyiset “open source” -mallit eivät ole yhteensopivia. Llama 4, Mistral, jopa GPT-OSS puuttuvat täydellisestä datan läpinäkyvyydestä.

Vain Pythia (EleutherAI) ja OLMo (AI2) saavat merkinnän “todella open source”.

EU AI Act Rakennetaan Markkinat

Helmikuusta 2025 lähtien EU AI Act on voimassa. Open source -mallit hyötyvät merkittävistä poikkeuksista — edellyttäen, että niitä ei luokitella “järjestelmäksi riskiksi”.

Malleille, jotka ylittävät 10^25 FLOP:tä, sovelletaan dokumentointi- ja kyberturvallisuusvelvoitteita riippumatta lisenssistä.

2026-2030: Mitä Edessä

Muotoutuvat Trendit

Post-Transformer: Uusia arkkitehtuureja syntyy vähentämään huomion neliöllistä monimutkaisuutta. BitNet on vasta alkua.

Edge AI: Mallit kuten Ministral 3B toimivat älypuhelimissa massiivisella kontekstilla. Kodin automaatio ja henkilökohtainen robotiikka räjähtävät.

Intelligenssin Suvereniteetti: Yritykset eivät halua enää “vuokrata” älykkyyttä API:iden kautta. He haluavat omistaa omat digitaaliset aivonsa, koulutettuina heidän teollisilla salaisuuksillaan.

Moniagenttiyhteistyö: Tulevaisuus on eri toimittajien mallien välisessä viestinnässä. Ongelmien ratkaiseminen yhteistyön kautta pikemmin kuin monoliittisen raaka voiman avulla.

Uusi SEO-Paradigma

LLM:ien massiivinen integrointi hakukoneisiin on muuttanut verkkonäkyvyyttä. Puhumme nyt GEO:sta (Generative Engine Optimization).

Vuonna 2026 noin 25 % perinteisestä orgaanisesta liikenteestä siepataan tekoälyn tuottamilla suorilla vastauksilla. Käyttäjät eivät enää napsauta — he lukeavat synteesin.

Brändille menestystä ei enää mitata Google-sijoituksella. Sitä mitataan sitaattejen esiintymistiheydellä ja vakaudella Gemini 3:n tai GPT-5:n generatiivisissa vastauksissa.

Entä Nyt?

Vuoden 2026 open source -ekosysteemi on todistanut yhden ratkaisevan asian: läpinäkyvyys ja yhteistyö eivät ole eettisiä ihanteita, ne ovat parempia kilpailuetuja.

Rikkomalla älykkyysmonopolit open source muutti tekoälyn eksklusiivisesta palvelusta maailmanlaajuiseksi julkiseksi infrastruktuuriksi — yhtä perustavaa laatua kuin sähkö tai internet.

Tekninen tasa-arvo on saavutettu. Seuraava raja? Järjestelmien täydellinen itsenäisyys ihmiskunnan palveluksessa.

Massiivisia generalistisia malleja täydennetään, joskus korvataan, erikoistuneiden, säästäväisempien, tarkempien, suvereenimpien mallien konstellaatioilla.

Open source voitti. Loput on vain historiaa.

Sisällysluettelo