Atvirojo kodo DI modelių „sprogimas“ ir nauja technologinė geopolitika

Per mažiau nei dvejus metus atvirojo kodo dirbtinio intelekto (DI) modeliai iš techninės nišos virto pasaulinės politikos ir ekonomikos tema. 2023–2024 m. tokie modeliai kaip „Llama 3“, „Mistral“, „Qwen“, „Phi-3“, „Gemma“ ar „Mixtral“ iš esmės pakeitė DI rinkos dinamiką, o kartu – ir technologinę geopolitiką.

Šiandien DI modelių klausimas yra ne tik apie inovacijas ar startuolius. Tai – apie tai, kas valdys skaičiavimo išteklius, duomenis, standartus ir talentus. Atvirojo kodo banga čia tampa netikėtu geopolitiniu „laukinės kortos“ veiksniu.

Kas iš tikrųjų įvyko: atvirų DI modelių „sprogimas“

Trumpa chronologija: nuo GPT-3 iki atvirų alternatyvų

Dar 2020–2021 m. DI modelių rinką dominavo uždari, debesijoje laikomi modeliai, tokie kaip „GPT-3“. Tačiau 2023 m. situacija pradėjo keistis:

  • 2023 m. pavasaris: „Meta“ paviešina „LLaMA“ modelio svorius tyrėjams, kas netikėtai paskatina šimtus bendruomenės modifikacijų.
  • 2023 m. ruduo: „Mistral AI“ pristato itin efektyvius mišrius ekspertų modelius („Mixtral“), kurie daugeliu užduočių konkuruoja su uždarais gigantais.
  • 2023–2024 m. žiema–pavasaris: Kinijos technologijų milžinai („Alibaba“ su „Qwen“, „Baidu“, „Zhipu“ ir kt.) agresyviai išleidžia atvirus arba pusiau atvirus modelius, siekdami globalios įtakos.
  • 2024 m. pavasaris–vasara: „Meta“ su „Llama 3“, „Google“ su „Gemma“, „Microsoft“ ir „NVIDIA“ aktyviai remia atvirojo kodo ekosistemą, suprasdamos jos strateginę vertę.

Rezultatas – per trumpą laiką atsirado dešimtys konkurencingų atvirų modelių, kuriuos galima paleisti ne tik debesijoje, bet ir vietiniuose serveriuose ar net galingesniuose nešiojamuose kompiuteriuose.

Kodėl atvirojo kodo DI toks svarbus?

Atvirojo kodo DI modeliai keičia žaidimo taisykles keliais lygmenimis:

  • Prieinamumas: organizacijos ir šalys, neturinčios milžiniškų biudžetų, gali naudotis pažangiais modeliais.
  • Kontrolė: modelius galima paleisti savo infrastruktūroje, neperduodant duomenų JAV ar Kinijos debesijai.
  • Skaidrumas: tyrėjai gali analizuoti modelius, ieškoti šališkumų, saugumo spragų ir jas taisyti.
  • Lokalizacija: lengviau pritaikyti konkrečioms kalboms (pvz., lietuvių) ir sektoriams (sveikata, finansai, viešasis sektorius).

Visa tai tiesiogiai virsta geopolitiniu klausimu: kas sugebės sukurti ir valdyti savo DI sluoksnį, o kas liks priklausomas nuo kitų valstybių debesijos ir standartų.

Naujoji technologinė geopolitika: kas kovoja dėl DI įtakos

JAV: uždari milžinai + atviro kodo ekosistemos lyderiai

JAV ir toliau išlieka DI inovacijų epicentras. Čia įsikūrę tiek uždari rinkos lyderiai („OpenAI“, „Anthropic“), tiek atvirojo kodo varikliai („Meta“, „Google“ su „Gemma“, „NVIDIA“, „Hugging Face“, tūkstančiai startuolių).

Strategiškai JAV žaidžia dvigubą žaidimą:

  • Uždari modeliai – kaip aukščiausios klasės „premium“ paslauga, glaudžiai integruota į debesijos ekosistemas („Azure“, „AWS“, „Google Cloud“).
  • Atviri modeliai – kaip būdas išlaikyti technologinį dominavimą, nustatyti de facto standartus ir neleisti konkurentams (ypač Kinijai) monopolizuoti atvirų ekosistemų.

„Meta“ agresyviai pozicionuoja „Llama“ kaip pasaulinį atvirą standartą, tikėdamasi, kad tūkstančiai kūrėjų ir įmonių susies savo sistemas būtent su šia architektūra. Tai – klasikinė platformų geopolitika: kuo daugiau priklausomų ekosistemų, tuo didesnė įtaka.

Kinija: atviri modeliai kaip „minkštosios galios“ įrankis

Kinija, susidurianti su JAV eksporto kontrolės ribojimais (ypač GPU ir pažangios litografijos srityje), DI mato kaip būdą kompensuoti technologinius barjerus. Atviri ar pusiau atviri modeliai, tokie kaip „Qwen“, tampa:

  • Eksporto produktu – siūlomu Azijos, Afrikos, Lotynų Amerikos rinkoms.
  • Priklausomybės kanalu – kai trečiosios šalys pradeda naudoti kiniškus modelius, didėja jų technologinė ir reguliacinė priklausomybė nuo Kinijos ekosistemos.
  • Standartų formavimo įrankiu – ypač kalbų, kuriose Vakarų modeliai yra silpnesni.

Nors daugelis kiniškų modelių licencijų yra labiau „šaltinio prieigos“ nei klasikinio atvirojo kodo, geopolitiniu požiūriu jie veikia panašiai: mažina priklausomybę nuo JAV debesijos ir suteikia Pekinui papildomą derybinę galią.

Europa: tarp saugumo, reguliavimo ir noro neatsilikti

Europos Sąjunga ilgą laiką atsiliko nuo JAV ir Kinijos DI lenktynėse, tačiau 2023–2024 m. situacija pradėjo keistis. ES priėmė pirmąjį pasaulyje išsamų DI reguliavimą – AI Act – ir tuo pačiu mato atvirąjį kodą kaip šansą sumažinti priklausomybę nuo užjūrio technologijų.

Prancūzijos „Mistral AI“ tapo simboliniu pavyzdžiu, kad Europa gali kurti pasaulinio lygio atvirus modelius. Vokietija, Nyderlandai, Skandinavija ir Baltijos šalys investuoja į europinius superkompiuterius, atvirus duomenų rinkinius ir bendrus DI centrus.

Tačiau ES strategija sudėtinga: būtina suderinti:

  • Inovacijų laisvę – kad atviras DI galėtų sparčiai vystytis.
  • Saugumą ir teises – privatumas, autorių teisės, dezinformacijos rizikos.
  • Technologinį suverenitetą – kad kritinės sistemos nepriklausytų vien JAV ar Kinijos debesijai.

Atviras DI čia tampa tiltu tarp inovacijų ir suvereniteto: valstybės gali naudoti pažangius modelius savo infrastruktūroje, laikydamos duomenis vietoje ir laikydamosi ES teisės.

Atvirojo kodo DI kaip naujas strateginis išteklius

Ne tik dujos ir nafta: DI modeliai kaip infrastruktūra

Iki šiol geopolitikoje daugiausia kalbėta apie energijos išteklius, retuosius metalus ar puslaidininkius. 2020–2030 m. dešimtmetis prideda naują sluoksnį – DI modelius ir duomenis kaip strateginę infrastruktūrą.

Valstybės ir blokai (JAV, ES, Kinija, Indija, Persijos įlankos šalys) vis dažniau klausia:

  • Ar turime savo didelius, konkurencingus DI modelius?
  • Ar galime juos paleisti savo duomenų centruose?
  • Ar mūsų kalbos ir kultūros yra tinkamai atspindėtos šiuose modeliuose?
  • Ar priklausome nuo vienos šalies debesijos tiekėjų?

Atvirojo kodo modeliai leidžia į šiuos klausimus atsakyti pozityviau, bet kartu kelia ir naujų rizikų – nuo kibernetinio saugumo iki dezinformacijos.

GPU, debesija ir energija: nematoma DI geopolitikos pusė

Net atviriausias modelis be skaičiavimo galios yra tik failas diske. Todėl DI geopolitika neatsiejama nuo trijų infrastruktūrinių sluoksnių:

  1. GPU ir lustai – „NVIDIA“ dominuoja rinkoje, o pažangiausių lustų eksportas į Kiniją ir kitas šalis ribojamas. Tai tiesiogiai veikia, kas gali treniruoti didžiausius modelius.
  2. Debesijos ekosistemos – „AWS“, „Azure“, „Google Cloud“, „Alibaba Cloud“, regioniniai tiekėjai. Kas valdo debesiją, tas dažnai valdo ir DI paslaugų sluoksnį.
  3. Energija ir aušinimas – dideli DI klasteriai reikalauja milžiniškų energijos ir vandens kiekių, todėl valstybės ima planuoti DI parkus šalia atsinaujinančios energetikos šaltinių.

Atvirojo kodo modeliai šiek tiek „demokratizuoja“ prieigą, nes leidžia naudoti efektyvesnius, mažesnius modelius vietiniuose serveriuose. Tačiau geopolitinė priklausomybė nuo GPU tiekimo ir debesijos lieka.

Reguliavimo mūšiai: kaip valdžios žiūri į atvirą DI

ES AI Act ir atvirų modelių dilema

Priimant ES DI aktą (AI Act), vienas karščiausių klausimų buvo – kaip reguliuoti atvirojo kodo modelius. Per griežtas reguliavimas galėtų nužudyti inovacijas, per švelnus – atverti duris piktnaudžiavimui.

Galiausiai priimtas kompromisas:

  • Labiausiai rizikingos DI sistemos (pvz., biometrinis stebėjimas) reguliuojamos griežčiau, nepriklausomai nuo to, ar jos paremtos atvirais, ar uždarais modeliais.
  • Atviriems modeliams numatytos švelnesnės, bet vis tiek egzistuojančios pareigos – skaidrumo, dokumentacijos, saugumo testų srityse, ypač jei tai „bendrosios paskirties“ dideli modeliai.

ES bando išlaikyti pusiausvyrą: nepalikti Europos priklausomos nuo uždarų JAV ar Kinijos modelių, bet kartu apsaugoti piliečius ir rinką nuo laukinio DI naudojimo.

JAV ir JK: savireguliacija ir pramonės paktai

JAV ir Jungtinė Karalystė kol kas renkasi lankstesnį kelią – savanoriški įsipareigojimai, „saugumo paktai“ su didžiosiomis DI įmonėmis, gairės viešajam sektoriui. Tačiau Kongrese ir parlamente daugėja balsų už griežtesnį reguliavimą.

Atvirų modelių atžvilgiu pozicija dažnai palankesnė: jie laikomi inovacijų varikliu ir būdu neleisti vienai ar kelioms korporacijoms užrakinti visos rinkos.

Kinija: kontrolė, cenzūra ir valstybinė priežiūra

Kinijoje DI reguliuojamas per turinio ir cenzūros prizmę. Modeliai turi laikytis „socialistinių vertybių“, o tiekėjai atsako už generuojamą turinį. Atviri modeliai dažnai ribojami licencijomis ar techniniais barjerais, kad būtų galima išlaikyti kontrolę.

Geopolitiškai tai reiškia, kad kiniški atviri modeliai, eksportuojami į užsienį, gali būti mažiau atviri nei atrodo – su integruotomis turinio kontrolės ar sekimo priemonėmis, kas kelia papildomų rizikų šalims, norinčioms juos naudoti.

Ką tai reiškia mažesnėms šalims ir Lietuvai?

Galimybė šokti į „aukštesnį lygį“

Mažesnės valstybės, įskaitant Lietuvą ir kitas Baltijos šalis, iki šiol retai galėjo konkuruoti kuriant pasaulinio lygio platformas. Atvirojo kodo DI leidžia:

  • Kurti lokalius modelius, gerai suprantančius lietuvių kalbą ir regioninį kontekstą.
  • Diegti DI viešajame sektoriuje (e. paslaugos, sveikata, švietimas) be būtinybės visus duomenis siųsti už ES ribų.
  • Vystyti nišinius produktus (kibernetinis saugumas, fintech, logistikos optimizavimas), remiantis atvirais pagrindiniais modeliais.

Praktinis pavyzdys: vietos universitetai ir tyrimų centrai gali imti „Llama 3“, „Mistral“ ar „Gemma“ modelius, juos papildomai išmokyti lietuviškais duomenimis ir sukurti specializuotus modelius viešajam administravimui, teisei, medicinai.

Suverenitetas ir saugumas: ne tik techninis, bet ir politinis klausimas

Naudojant atvirą DI, mažesnės šalys gali:

  • Laikyti kritinius duomenis savo duomenų centruose.
  • Pačios tikrinti modelių šališkumus, saugumo spragas, galimus manipuliacijos kanalus.
  • Vengti situacijos, kai vienas užsienio tiekėjas tampa „vieninteliu DI vartais“ į valstybės infrastruktūrą.

Tačiau tam reikia investicijų į vietinę infrastruktūrą (GPU klasteriai, energija), talentus ir aiškią nacionalinę DI strategiją, suderintą su ES politika.

Verslui ir kūrėjams: praktinės pasekmės

Atviri modeliai prieš uždarus: nebe „ar“, o „kaip derinti“

2024 m. situacija tokia, kad daugeliui įmonių klausimas nebe „ar naudoti atvirą, ar uždarą modelį“, o:

  • Kokias užduotis atlikti su atvirais modeliais (vidiniai įrankiai, lokalūs asistentai, prototipai).
  • Kada verta rinktis uždarus modelius (itin sudėtingos užduotys, kur svarbus geriausias įmanomas našumas, integracijos su debesijos paslaugomis).
  • Kaip hibridiškai derinti abu požiūrius, kad būtų balansas tarp kainos, kokybės, saugumo ir suvereniteto.

Atviri modeliai dažnai laimi kainos, lankstumo ir duomenų kontrolės prasme. Uždari – kokybės „ant ribos“ ir patogumo (API, įrankiai, palaikymas) prasme.

Talentų rinka: nauji įgūdžiai ir karjeros kryptys

Atvirojo kodo DI banga keičia ir darbo rinką. Vis labiau vertinami specialistai, kurie moka:

  • Dirbti su atvirų modelių ekosistemomis („Hugging Face“, „Ollama“, „LangChain“, „vLLM“ ir pan.).
  • Optimizuoti modelius vietinei infrastruktūrai (kvantizacija, distiliacija, pritaikymas konkrečioms užduotims).
  • Sujungti teisinį, saugumo ir technologinį matymą – ypač ES reguliavimo kontekste.

Šalys, kurios investuos į tokių talentų ugdymą (per universitetus, perkvalifikavimo programas, viešojo sektoriaus projektus), turės aiškų pranašumą naujoje technologinėje geopolitikoje.

Scenarijai iki 2030 m.: kur gali nuvesti atviras DI

1 scenarijus: „Atviras, bet suskaldytas pasaulis“

Pasaulis pasidalija į kelias DI sferas:

  • JAV ekosistema (Llama, Gemma, amerikietiški debesų tiekėjai).
  • Kinijos ekosistema (Qwen ir kiti modeliai, kiniška debesija).
  • Europos ir sąjungininkų ekosistema (Mistral, regioniniai modeliai, ES reguliavimo standartai).

Modeliai išlieka atviri, bet licencijos, standartai ir politiniai blokai sukuria „DI sienas“, panašias į dabartinį interneto susiskaldymą.

2 scenarijus: „Reguliacinis užveržimas“

Dėl saugumo incidentų, dezinformacijos ar kibernetinių atakų vyriausybės pradeda griežtai riboti didelių atvirų modelių platinimą. Atviras DI lieka, bet labiau lokaliuose, specializuotuose scenarijuose, o pagrindinė galia grįžta prie kelių licencijuotų tiekėjų.

3 scenarijus: „Tikra DI demokratizacija“

Atvirojo kodo modeliai toliau gerėja, o įrankiai juos naudoti darosi paprastesni. Atsiranda tūkstančiai lokalių, kalbinių ir sektorinių modelių, kuriuos valdo universitetai, miestai, NVO, vidutinio dydžio įmonės.

Geopolitinė galia persiskirsto: ne tik valstybės, bet ir miestai bei regionai tampa reikšmingais DI žaidėjais. Tačiau tam būtina protinga, inovacijas palaikanti, o ne vien represyvi reguliacinė aplinka.

Išvados: kaip pasiruošti naujai DI geopolitikai

Atvirojo kodo DI modelių „sprogimas“ – tai ne laikina mada, o esminis technologinės geopolitikos posūkis. Valstybės, verslai ir visuomenės, kurios tai supras ir veiks strategiškai, laimės daugiau nei tie, kurie liks tik pasyviais vartotojais.

Keli praktiniai žingsniai, kuriuos verta svarstyti jau dabar:

  • Investuoti į vietinius, atvirais modeliais paremtus projektus (ypač viešajame sektoriuje ir švietime).
  • Kurti nacionalinius ir regioninius DI centrus, jungiančius akademiją, verslą ir valstybę.
  • Aktyviai dalyvauti ES DI politikos formavime, kad taisyklės atitiktų realius poreikius.
  • Ugdyti talentus, kurie supranta tiek technologiją, tiek teisę ir etiką.

DI ateitis nebus vien juoda ar balta – nei visiškai atvira, nei visiškai uždara. Tačiau atvirojo kodo modeliai jau dabar suteikia unikalią galimybę mažesnėms šalims ir žaidėjams ne tik prisitaikyti, bet ir formuoti naują technologinės galios pusiausvyrą.

DUK: dažniausiai užduodami klausimai

Ar atvirojo kodo DI modeliai yra saugesni už uždarus?

Ne visada. Atviri modeliai yra skaidresni – bendruomenė gali juos analizuoti, testuoti ir taisyti. Tačiau tuo pačiu juos gali laisviau naudoti ir piktavališki veikėjai. Saugumas priklauso nuo to, kaip modelis diegiamas: ar ribojama prieiga, ar taikomi filtrai, ar atliekami saugumo testai. Uždari modeliai dažnai turi stipresnes įmontuotas apsaugas, bet jų veikimo negalima nepriklausomai patikrinti.

Ar mažos įmonės turėtų rinktis atvirą ar uždarą DI?

Daugeliu atvejų verta rinktis hibridinį požiūrį. Atviri modeliai tinka vidiniams įrankiams, prototipams, jautriems duomenims, kai norite viską laikyti savo infrastruktūroje. Uždari modeliai naudingi, kai reikia geriausio įmanomo našumo, integracijų su debesijos paslaugomis ar kai nenorite patys valdyti infrastruktūros. Svarbiausia – įvertinti duomenų jautrumą, biudžetą ir ilgalaikę priklausomybę nuo tiekėjų.

Kaip Lietuva gali pasinaudoti atvirojo kodo DI geopolitinėmis tendencijomis?

Lietuva gali sutelkti dėmesį į kelias kryptis: kurti lietuvių kalbai pritaikytus modelius, diegti atviru DI paremtus sprendimus viešajame sektoriuje, investuoti į regioninius DI centrus ir superkompiuterinę infrastruktūrą, aktyviai dalyvauti ES DI politikos formavime. Taip pat svarbu remti startuolius ir mokslinius tyrimus, kurie naudoja atvirus modelius nišinėms, bet globaliai aktualioms problemoms spręsti.