Atvirojo kodo „foundation“ AI modelių bumas: kas vyksta dabar

Per pastaruosius metus dirbtinio intelekto pasaulis apsivertė aukštyn kojomis. Jei anksčiau viską diktavo keli uždari milžinai, šiandien vis didesnę įtaką įgauna atvirojo kodo foundation AI modeliai – universalūs, didelio masto modeliai, kuriuos galima pritaikyti šimtams skirtingų užduočių.

2024–2025 m. matome tikrą bumą: „Meta“ Llama 3.1, „Google“ Gemma, Mistral modelių šeima, „xAI“ Grok atvirojo kodo iniciatyvos, sparčiai auganti bendruomenė „Hugging Face“ platformoje ir šimtai specializuotų versijų – nuo kodavimo iki medicininių santraukų.

Kas yra foundation AI modeliai ir kuo jie ypatingi?

Foundation modeliai – tai dideli, iš anksto apmokyti modeliai, galintys atlikti platų užduočių spektrą:

  • generuoti tekstą ir kodą,
  • apdoroti ir analizuoti dokumentus,
  • dirbti su keliomis kalbomis ir modalumais (tekstai, vaizdai, garsas),
  • būti pagrindu siauresniems, konkrečiai sričiai pritaikytiems modeliams.

Jie vadinami „foundation“, nes veikia kaip pamatas (angl. foundation) visai DI ekosistemai: ant jų statomi chatbotai, paieškos sistemos, analizės įrankiai, kūrybinės platformos ir vidiniai įmonių asistentai.

Atvirojo kodo bumas: kas pasikeitė 2024–2025 m.?

Atvirojo kodo DI modeliai egzistuoja jau seniai, tačiau bumas prasidėjo tada, kai jų kokybė priartėjo – o kai kuriais atvejais ir priėjo – prie komercinių gigantų lygio. 2024–2025 m. išryškėjo keli lūžio taškai:

1. Llama 3 ir 3.1: „Meta“ spyris visai rinkai

„Meta“ Llama šeima tapo de facto standartu atvirojo kodo ekosistemoje. Naujausios iteracijos – Llama 3 ir 3.1 – pateikiamos kelių dydžių (nuo mažesnių, telpančių į vieną galingą GPU, iki didelių, reikalaujančių klasterių) ir siūlo:

  • labai konkurencingus rezultatus anglų ir kitomis didžiosiomis kalbomis,
  • pagerintą konteksto langą (didesnės apimties tekstų supratimą),
  • draugiškas licencijas daugeliui komercinių scenarijų.

Llama 3.1 išleidimas 2024 m. vasarą dar labiau paspartino bumo tempą: atsirado šimtai fine-tune versijų specifinėms užduotims – nuo teisinių dokumentų analizės iki lokalizuotų chatbotų konkrečioms šalims.

2. Mistral ir „lengvų, bet galingų“ modelių era

Prancūzijos startuolis „Mistral AI“ išpopuliarino idėją, kad atvirojo kodo modeliai gali būti ne tik atviri, bet ir itin efektyvūs:

  • orientacija į mažesnius, bet protingai sukonstruotus modelius,
  • fokusas į našumą ir mažesnes išlaidas,
  • aktyvi bendruomenė, kuri greitai kuria patobulintas versijas.

Dėl to Mistral modeliai tapo mėgstamu pasirinkimu startuoliams ir įmonėms, norinčioms DI paleisti savo infrastruktūroje (on-premise) ar pigesniuose debesų sprendimuose.

3. Gemma ir kitų gigantų „atsivėrimas“

„Google“ su Gemma serija ir kiti technologijų gigantai pradėjo siūlyti vis daugiau atvirų arba „atvirai licencijuotų“ modelių. Nors licencijos kartais riboja tam tikrą komercinį naudojimą, pats faktas, kad tokios kompanijos dalijasi aukštos kokybės modeliais, rodo rinkos poslinkį:

  • DI tyrimai tampa labiau skaidrūs,
  • mažėja priklausomybė nuo vieno tiekėjo,
  • greičiau gimsta nauji produktai ir nišiniai sprendimai.

Pagrindiniai atvirojo kodo foundation modelių privalumai

Kontrolė ir lankstumas

Atvirojo kodo modeliai suteikia įmonėms ir kūrėjams tai, ko ilgai trūko – visapusišką kontrolę:

  • galimybę diegti modelį savo serveryje ar privačiame debesyje,
  • pilną prieigą prie architektūros ir svorių,
  • laisvę derinti modelį pagal specifinius duomenis ir taisykles.

Tai ypač svarbu sektoriuose, kuriuose galioja griežti reguliavimai: finansai, sveikatos apsauga, viešasis sektorius, gamyba.

Duomenų privatumas ir atitiktis

Naudojant uždarus debesų DI sprendimus, duomenys dažnai palieka organizacijos ribas. Atvirojo kodo foundation modeliai leidžia:

  • apdoroti jautrius duomenis lokaliai,
  • geriau atitikti GDPR ir kitų jurisdikcijų reikalavimus,
  • sukurti aiškesnes duomenų srauto ir laikymo schemas.

Europos įmonėms tai tampa kritiniu argumentu, ypač po to, kai įsigaliojo EU AI Act ir prasidėjo intensyvesnės diskusijos apie didžiųjų technologijų kontrolę.

Kaštai ir mastelio keitimas

Nors foundation modelių apmokymas kainuoja milijonus, jų naudojimas – ypač, kai modelis jau paruoštas – tampa vis pigesnis:

  • galima rinktis mažesnį modelį, kuris gerai tinka konkrečiai užduočiai,
  • naudoti kvantizaciją ir optimizacijas, kad modelis veiktų pigesnėje įrangoje,
  • išvengti aukštų API kainų, mokant tik už savo infrastruktūrą.

Dėl to atvirojo kodo DI tampa prieinamas ne tik korporacijoms, bet ir mažoms komandoms ar net pavieniams kūrėjams.

Kur šiandien realiai naudojami atvirojo kodo foundation modeliai?

1. Vidiniai įmonių asistentai

Vis daugiau organizacijų kuria savo „ChatGPT analogus“, bet paremtus atvirojo kodo modeliais ir prijungtus prie vidinių dokumentų, žinių bazių, CRM ir kitų sistemų. Tipinės užduotys:

  • darbuotojų klausimų atsakymai apie vidines taisykles ir procesus,
  • automatinis ataskaitų ir santraukų generavimas,
  • pagalba rengiant pasiūlymus, sutartis, laiškus.

2. Kodo generavimas ir DevOps

Atvirojo kodo modeliai, derinti su kodų saugyklomis (Git), tampa tikrais pagalbininkais programuotojams:

  • siūlo kodo fragmentus ir testus,
  • aiškina klaidas ir logiką,
  • automatizuoja dokumentacijos rašymą.

Įmonės renkasi atvirojo kodo sprendimus, kad jautrus kodas neliktų trečiųjų šalių serveriuose ir kad būtų galima integruoti DI tiesiai į vidinius CI/CD procesus.

3. Specializuoti modeliai nišiniams sektoriams

Foundation modeliai tampa baze specializuotiems DI sprendimams:

  • medicinai – klinikinių užrašų, tyrimų santraukos, anamnezių analizė,
  • teisės sričiai – sutarčių analizė, rizikų išryškinimas, teismų praktikos paieška,
  • logistikai ir gamybai – tiekimo grandinių duomenų analizė, prognozės, incidentų santraukos.

Čia atvirojo kodo modeliai ypač vertingi, nes juos galima derinti su labai specifiniais, neretai konfidencialiais duomenimis.

Technologinės tendencijos: kur juda atvirojo kodo foundation AI?

Didesni konteksto langai ir ilgų dokumentų supratimas

Viena karščiausių krypčių – modelių gebėjimas dirbti su ilgu kontekstu: šimtais puslapių dokumentų, didelėmis duomenų ištraukomis, ištisomis pokalbių istorijomis. Naujos architektūros ir triukai (pvz., RoPE patobulinimai, efektyvūs dėmesio mechanizmai) leidžia atvirojo kodo modeliams:

  • apdoroti daugiau informacijos vienu metu,
  • mažiau „pamiršti“ ankstesnę pokalbio dalį,
  • tiksliau atsakyti į klausimus apie didelius dokumentų rinkinius.

Multimodalumas: tekstas, vaizdas, garsas viename modelyje

Vis daugiau atvirojo kodo projektų siekia multimodalumo – gebėjimo dirbti ne tik su tekstu, bet ir su vaizdais, garsu, video. Tai atveria naujas sritis:

  • automatizuota dokumentų su diagramomis ir paveikslėliais analizė,
  • video santraukos ir paieška pagal turinį,
  • balso asistentai, veikiantys visiškai lokaliai.

Nors uždari modeliai šioje srityje vis dar pirmauja, atvirojo kodo ekosistema sparčiai vejasi, kurdama kombinuotas architektūras (pavyzdžiui, tekstinis foundation modelis + atskiras vaizdo encoderis).

Įrankių ir agentų ekosistema

Foundation modeliai vis dažniau naudojami kaip „smegenys“, kurios valdo įrankius ir procesus. Atsiranda vadinamieji DI agentai, kurie gali:

  • skaityti el. laiškus ir užduotis,
  • kviesti API, tikrinti duomenų bazes,
  • priimti sprendimus pagal iš anksto nustatytas taisykles.

Atvirojo kodo modeliai čia itin patrauklūs, nes leidžia:

  • skaidriai aprašyti, kokius veiksmus agentas gali atlikti,
  • audituoti ir riboti rizikingas funkcijas,
  • keisti ir plėsti agentų elgseną be licencinių apribojimų.

Iššūkiai ir rizikos: ne viskas rožėmis klota

Kokybės ir saugumo užtikrinimas

Atvirojo kodo foundation modeliai suteikia laisvę, bet kartu perkelia atsakomybę naudotojui:

  • reikia pačiam testuoti modelio šališkumus ir klaidas,
  • užtikrinti, kad modelis neatskleidžia jautrios informacijos,
  • valdyti „halucinacijų“ (neteisingų atsakymų) riziką.

Didžiosios uždaros platformos dažnai turi įdiegtas saugumo ir moderavimo sistemas. Naudojant atvirojo kodo modelius, tokias apsaugas tenka kurti pačiam – tai reikalauja kompetencijų ir resursų.

Infrastruktūra ir kompetencijos

Net ir optimizuoti foundation modeliai nėra „lengvi žaislai“. Norint juos paleisti ir efektyviai naudoti, reikia:

  • pakankamai galingos GPU ar CPU infrastruktūros,
  • ML inžinierių ir MLOps specialistų,
  • aiškios priežiūros, atnaujinimų ir monitoringo strategijos.

Dėl to dalis įmonių renkasi hibridinį kelią: naudoja atvirojo kodo modelius, bet diegia juos per valdomas platformas ar specializuotus tiekėjus.

Licencijos ir teisinė atsakomybė

Ne visi „atvirojo kodo“ modeliai yra vienodai atviri. Licencijos gali riboti:

  • komercinį naudojimą tam tikruose sektoriuose,
  • modelio perpardavimą ar API teikimą tretiesiems asmenims,
  • naudojimą konkurenciniams DI produktams kurti.

Prieš diegiant foundation modelį į kritinius verslo procesus, būtina įvertinti licenciją ir teisinę riziką – ypač, jei planuojama paslaugą siūlyti klientams.

Kaip įmonėms protingai įsitraukti į atvirojo kodo foundation AI bumą?

1. Pradėti nuo aiškios verslo problemos, o ne nuo technologijos

Vietoj klausimo „kokį modelį pasirinkti?“ verta pradėti nuo „kokį procesą norime pagerinti?“:

  • klientų aptarnavimas ir atsakymų automatizavimas,
  • vidinių dokumentų paieška ir santraukos,
  • pardavimų ir rinkodaros turinio generavimas,
  • programavimo ir IT palaikymo efektyvinimas.

2. Rinktis modelį pagal dydį ir paskirtį

Didžiausias modelis ne visada geriausias. Dažnai verta rinktis:

  • mažesnį, bet greitesnį modelį paprastoms užduotims,
  • specializuotą fine-tune versiją konkrečiai sričiai,
  • hibridinį sprendimą: mažas modelis kasdienėms užklausoms, didesnis – sudėtingiems atvejams.

3. Investuoti į duomenų kokybę ir valdymą

Foundation modelis – tik pusė sėkmės. Kita pusė – jūsų duomenys:

  • tvarkingi, struktūruoti dokumentai ir žinių bazės,
  • aiškiai apibrėžti prieigos lygiai ir teisės,
  • nuolatinis atnaujinimas ir klaidų taisymas.

Derinant atvirojo kodo modelį su kokybiškais vidiniais duomenimis, atsiranda reali konkurencinė persvara – ypač rinkose, kur daug kas vis dar remiasi tik uždaromis, bendro pobūdžio DI paslaugomis.

Kas toliau? Galimi scenarijai iki 2026 m.

Žvelgiant į dabartinį tempą, galima numatyti kelias kryptis, kurias greičiausiai matysime iki 2026 m.:

  • Daugiau atvirų modelių iš didžiųjų žaidėjų – konkurencija vers milžinus siūlyti vis daugiau atvirų ar pusiau atvirų modelių.
  • Stipresnė Europos DI ekosistema – dėl reguliavimo ir privatumo reikalavimų Europa natūraliai linksta į atvirojo kodo ir on-premise sprendimus.
  • Standartai ir gerosios praktikos – atsiras daugiau gairių, kaip saugiai ir atsakingai naudoti foundation modelius, ypač atvirojo kodo.
  • Modelių „komponentizacija“ – vietoje vieno monolitinio modelio dažniau bus naudojami keli specializuoti modeliai, sujungti į vieną sistemą.

Viena aišku: atvirojo kodo foundation AI modelių bumas nėra laikina mada. Tai struktūrinis pokytis, kuris per artimiausius metus nulems, kas kontroliuos DI ekosistemą – keli uždari gigantai ar platesnė, atviresnė bendruomenė.

Išvados

Atvirojo kodo foundation AI modeliai iš nišinio reiškinio virto rimta alternatyva uždariems DI sprendimams. Jie suteikia daugiau kontrolės, lankstumo ir galimybių kurti individualizuotus sprendimus, tačiau kartu reikalauja atsakomybės – nuo saugumo iki infrastruktūros valdymo.

Įmonėms, kurios nori ne tik naudotis DI, bet ir formuoti savo ilgalaikę strategiją, dabar – tinkamiausias metas eksperimentuoti, kurti pilotinius projektus ir kaupti kompetencijas. Būtent atvirojo kodo foundation modeliai dažniausiai tampa pirmu žingsniu į brandžią, tvarią DI ekosistemą organizacijos viduje.

DUK apie atvirojo kodo foundation AI modelių bumą

Ar atvirojo kodo foundation modeliai tikrai gali konkuruoti su uždarais?

Taip, daugeliu užduočių naujausios Llama, Mistral, Gemma ir kitų projektų versijos pasiekia arba priartėja prie komercinių modelių lygio. Kai kuriose nišose (pvz., specifinė kalba ar sritis) tinkamai priderintas atvirojo kodo modelis net gali juos aplenkti, nes naudoja jūsų pačių duomenis ir žinias.

Ar verta diegti foundation modelį savo infrastruktūroje, o ne naudoti API?

Verta, jei dirbate su jautriais duomenimis, norite sumažinti priklausomybę nuo vieno tiekėjo arba tikitės intensyvaus naudojimo, kai API sąskaitos išauga. Tačiau reikia įvertinti infrastruktūros ir kompetencijų kaštus – mažesnėms komandoms kartais racionaliau pradėti nuo valdomų paslaugų ir tik vėliau pereiti prie savo diegimų.

Kaip pasirinkti tinkamą atvirojo kodo foundation modelį verslui?

Pirmiausia aiškiai apibrėžkite užduotį ir kalbas, su kuriomis dirbsite. Tuomet įvertinkite: modelio dydį ir resursų poreikį, licencijos sąlygas, bendruomenės aktyvumą ir palaikymą, jau egzistuojančius fine-tune variantus jūsų sričiai. Dažnai verta išbandyti 2–3 kandidatus pilotiniame projekte ir palyginti rezultatus realiomis užklausomis.