Dirbtinio intelekto lustai: naujoji kova dėl skaičiavimo galios

Per kelerius metus dirbtinio intelekto (DI) lustai iš nišinės technologijos virto geopolitinės galios įrankiu. Skaičiavimo galia šiandien tampa tokia pat strategiškai svarbi, kaip nafta XX amžiuje – be jos neįmanomas nei generatyvinis AI, nei autonominiai automobiliai, nei moderni gynyba.

Kodėl DI lustai tapo „naująja nafta“

Generatyvinio DI proveržis, kurį išpopuliarino tokie modeliai kaip „ChatGPT“, „Claude“, „Gemini“ ar „Midjourney“, atskleidė paprastą tiesą: pažangiausiems modeliams reikia milžiniškos skaičiavimo galios. Kiekvienas modelio mokymas – tai tūkstančiai GPU metų, sunaudojantys milžiniškus elektros kiekius ir reikalaujantys labai specializuotų lustų.

Šiandien DI lustai yra kritinė infrastruktūra:

  • Valstybėms – nacionalinio saugumo, kibernetinės gynybos ir technologinės nepriklausomybės garantas.
  • Didžiosioms IT kompanijoms – konkurencinio pranašumo pagrindas AI lenktynėse.
  • Verslui – raktas į efektyvesnę automatizaciją, analitiką ir naujus produktus.

Pasaulinė DI lustų rinka: kas valdo žaidimą?

2024–2025 m. DI lustų rinka auga dviženkliu tempu. Analitikai prognozuoja, kad iki 2030 m. ji gali viršyti šimtus milijardų dolerių, o didelė dalis šios vertės teks specializuotiems AI procesoriams.

Nvidia hegemonija ir jos iššūkiai

Šiuo metu DI skaičiavimo galios sinonimas – Nvidia. Jos GPU (pavyzdžiui, H100, H200, B100 ir naujesni Grace Blackwell kartos lustai) tapo aukso standartu dideliems modeliams mokyti ir vykdyti duomenų centruose.

Kodėl Nvidia tokia stipri:

  • Cuda ekosistema – programavimo įrankių ir bibliotekų rinkinys, prie kurio pririšta didžioji dalis AI tyrimų ir pramoninių sprendimų.
  • Optimizuotas „stackas“ – ne tik lustai, bet ir programinė įranga, tvarkyklės, tinklo sprendimai, serverių dizainas.
  • Ilgalaikis fokusas į AI – Nvidia į DI investavo dar tada, kai tai atrodė nišinis žaidimas.

Tačiau Nvidia monopolį vis aktyviau bando laužyti konkurentai.

AMD, Intel ir naujieji žaidėjai

AMD sparčiai artėja, siūlydama MI300 ir kitus AI akseleratorius, kurie kai kuriose užduotyse jau konkuruoja su Nvidia. AMD vilioja debesų paslaugų tiekėjus lankstesne kainodara ir atviresne ekosistema.

Intel mėgina sugrįžti į aukštos klasės duomenų centrų žaidimą, derindama CPU, GPU ir specializuotus AI akseleratorius (pvz., Gaudi šeimą), taip pat investuodama į savo gamyklų atnaujinimą JAV ir Europoje.

Be tradicinių milžinų, atsiranda ir naujų žaidėjų:

  • Google TPU – specializuoti lustai, optimizuoti „Google“ vidiniams DI darbo krūviams ir „Google Cloud“ klientams.
  • Amazon Trainium/Inferentia – AWS klientams skirti lustai, mažinantys priklausomybę nuo Nvidia.
  • Microsoft ir Meta – kuria nuosavus AI akseleratorius, kad sumažintų GPU sąnaudas ir užsitikrintų ilgalaikę skaičiavimo nepriklausomybę.

Kinijos lustų ekosistema ir sankcijų spaudimas

Kinija agresyviai siekia technologinės savarankiškumo puslaidininkių srityje. JAV eksporto kontrolė apribojo naujausių Nvidia ir kitų Vakarų gamintojų DI lustų tiekimą Kinijos įmonėms, todėl šalis spartina vietinių alternatyvų kūrimą.

Kinijos žaidėjai, tokie kaip Huawei, Biren ir kitos puslaidininkių įmonės, kuria AI akseleratorius, kurie, nors ir dar atsilieka nuo naujausių Vakarų lustų, sparčiai progresuoja. Be to, Kinija investuoja į visą vertės grandinę – nuo projektavimo (EDA įrankių) iki gamybos ir pakavimo.

Gamybos grandinė: kodėl visi žiūri į Taivaną

Didžioji dalis pažangiausių DI lustų gaminama ne JAV ar Europoje, o Taivane, TSMC (Taiwan Semiconductor Manufacturing Company) gamyklose. Tai sukuria milžinišką geopolitinę riziką – bet koks konfliktas regione galėtų sustabdyti pasaulinę DI plėtrą.

TSMC, Samsung ir kiti gamybos milžinai

Šiandien pažangiausių technologinių procesų (pvz., 3 nm ir dar žemesnių) srityje dominuoja:

  • TSMC – gamina Nvidia, Apple, AMD ir daugelio kitų lyderių lustus.
  • Samsung – investuoja į pažangius procesus ir siekia atkovoti rinkos dalį aukščiausio lygio lustų segmente.

Europa ir JAV suprato, kad priklausomybė nuo vieno regiono – pavojinga. Todėl prasidėjo nauja „gamyklių statybų“ banga.

JAV CHIPS Act ir Europos lustų iniciatyvos

JAV priėmė CHIPS and Science Act – milžinišką subsidijų paketą, skirtą pritraukti puslaidininkių gamyklas į šalį. Tuo pasinaudojo TSMC, Intel ir kiti gamintojai, statydami naujas gamyklas Arizonoje ir kituose regionuose.

Europos Sąjunga savo ruožtu inicijavo EU Chips Act, kurio tikslas – padvigubinti ES dalį pasaulinėje lustų rinkoje ir pritraukti strateginių gamyklų. Vokietija, Prancūzija, Italija ir kitos šalys konkuruoja dėl investicijų, siūlydamos mokesčių lengvatas ir subsidijas.

Lietuvai, nors ir neturinčiai savo TSMC lygio gamyklų, atsiveria nišos aukštos pridėtinės vertės inžinerijoje, dizaino įrankiuose ir specializuotuose AI sprendimuose, kurie veikia ant šių lustų.

Skaičiavimo galios bumas: duomenų centrai ir energijos troškulys

DI lustai – tik pusė istorijos. Kita pusė – duomenų centrai, kuriuose šie lustai dirba 24/7. Didieji debesų tiekėjai (AWS, Microsoft Azure, Google Cloud, Oracle, Alibaba Cloud ir kt.) šiuo metu investuoja dešimtis milijardų į naujus AI duomenų centrus.

Energijos ir aušinimo iššūkiai

Kiekvienas AI lustų „rackas“ sunaudoja milžinišką kiekį energijos ir reikalauja pažangios aušinimo infrastruktūros. Todėl:

  • Didėja žaliųjų duomenų centrų paklausa – šalia hidroelektrinių, vėjo ir saulės parkų.
  • Plinta skysčiu aušinamos sistemos, kurios efektyviau išsklaido šilumą nei tradiciniai oro kondicionieriai.
  • Valstybės ima riboti naujų duomenų centrų plėtrą ten, kur elektros tinklai jau arti ribos.

Skaičiavimo galia tampa ne tik technologiniu, bet ir energetiniu klausimu – tai ypač aktualu žaliąją transformaciją siekiančiai Europai.

DI lustų architektūros: nuo GPU iki specializuotų akseleratorių

Ne visi DI lustai vienodi. Kuriama vis daugiau specializuotų architektūrų, pritaikytų konkrečioms užduotims.

GPU: universalūs DI darbo arkliai

GPU (grafiniai procesoriai) istoriškai skirti grafikai, bet dėl tūkstančių lygiagrečių branduolių jie puikiai tinka neuroninių tinklų skaičiavimams. Dėl to jie tapo pagrindiniu pasirinkimu DI modelių mokymui.

Pagrindiniai GPU privalumai:

  • Universalumas – tinka įvairioms DI architektūroms.
  • Brandžios programinės bibliotekos ir įrankiai.
  • Plati bendruomenė ir dokumentacija.

TPU, NPU ir kiti specializuoti akseleratoriai

Didėjant DI sprendimų mastui, vis daugiau dėmesio skiriama specializuotiems akseleratoriams:

  • TPU (Tensor Processing Unit) – „Google“ sukurti lustai, optimizuoti tensoriniams skaičiavimams.
  • NPU (Neural Processing Unit) – neuroniniams skaičiavimams skirti blokai, vis dažniau integruojami į telefonus, nešiojamus kompiuterius ir kraštinius įrenginius.
  • ASIC – labai siaurai užduočiai optimizuoti lustai, kurie gali būti itin efektyvūs konkrečiose AI darbo apkrovose.

Specializuoti akseleratoriai leidžia pasiekti didesnį našumą ir mažesnes energijos sąnaudas, bet dažnai yra mažiau lankstūs nei GPU.

Varžybos dėl skaičiavimo galios: kas laimės?

Skaičiavimo galios varžybos vyksta keliais lygiais vienu metu.

Valstybių lygis: JAV, Kinija, Europa

  • JAV siekia išlaikyti technologinį pranašumą, ribodamos pažangiausių lustų eksportą ir skatindamos vidaus gamybą.
  • Kinija siekia sumažinti priklausomybę nuo Vakarų ir kuria savo DI bei puslaidininkių ekosistemą.
  • Europa bando išvengti priklausomybės tiek nuo JAV, tiek nuo Azijos, investuodama į gamybą, tyrimus ir talentus.

Klausimas ne tik kas turės daugiau lustų, bet ir kas valdys visą vertės grandinę – nuo projektavimo ir gamybos iki debesų infrastruktūros ir programinės įrangos.

Technologijų milžinai: „hiperskaleriai“ prieš visus

Didžiausi debesų tiekėjai – „Microsoft“, „Amazon“, „Google“, „Meta“, „Apple“ – šiandien tampa ir lustų kūrėjais. Jie nebesitenkina vien pirkdami GPU iš Nvidia ar AMD, bet ir projektuoja savo AI akseleratorius, kuriuos gamina TSMC ar kiti foundry.

Jų tikslai:

  • Sumažinti priklausomybę nuo vieno tiekėjo.
  • Optimizuoti lustus pagal savo DI darbo krūvius.
  • Ilgainiui sumažinti vieno skaičiavimo vieneto kainą ir taip pasiūlyti patrauklesnes AI paslaugas klientams.

Startuoliai ir atvirojo kodo bendruomenė

Greta milžinų auga ir nauja banga startuolių, kuriančių alternatyvius AI akseleratorius, RISC-V pagrindu veikiančius lustus ar atviras programines AI „stacko“ alternatyvas. Atvirojo kodo projektai (pvz., „PyTorch“, „JAX“, įvairūs atviri modeliai) suteikia galimybę mažesnėms komandoms eksperimentuoti ir optimizuoti sprendimus skirtingai aparatūrai.

Ką tai reiškia verslui ir kūrėjams Lietuvoje?

Lietuvos įmonės ir kūrėjai, norintys išnaudoti DI galimybes, neišvengiamai susiduria su skaičiavimo galios klausimu. Tačiau tai nebūtinai reiškia milijonines investicijas į savo GPU parką.

Praktiniai žingsniai verslui

  • Debesų paslaugos – naudoti AWS, Azure, Google Cloud ar kitus regioninius tiekėjus, kurie jau turi DI optimizuotus duomenų centrus.
  • Hibridinis modelis – jautrius duomenis apdoroti savo infrastruktūroje, o sunkius mokymus atlikti debesyje.
  • Modelių pasirinkimas – įvertinti, ar būtina mokyti savo modelį nuo nulio, ar pakanka adaptuoti jau parengtą (fine-tuning).
  • Optimizacija – naudoti kvantizaciją, distiliaciją ir kitus metodus, mažinančius skaičiavimo sąnaudas.

Galimybės Lietuvos ekosistemai

Lietuva gali laimėti ne bandydama statyti savo TSMC, o kurdama aukštos pridėtinės vertės sprendimus ant esamos infrastruktūros:

  • Nišiniai DI produktai (finansai, logistika, gamyba, sveikata).
  • Optimizavimo, MLOps ir saugumo įrankiai DI sistemoms.
  • Specializuotos konsultacijos ir integracijos paslaugos regiono verslui.

Talentas ir gebėjimas greitai prisitaikyti čia svarbiau už nuosavas gamyklas.

Ateities tendencijos: kur juda DI lustų pasaulis?

Per artimiausius metus DI lustų lenktynės dar labiau įkais. Kelios aiškios kryptys jau dabar ryškios.

Mažesni, bet protingesni modeliai

Nors dideli „milijardų parametrų“ modeliai išliks, vis daugiau dėmesio skiriama kompaktiškiems, efektyviems modeliams, kurie gali veikti kraštiniuose įrenginiuose – telefonuose, automobiliuose, IoT sensoriuose. Tai skatina NPU integraciją į kasdienę elektroniką.

Atviros ekosistemos ir standartai

Rinka spaudžia pereiti nuo uždarų, vieno tiekėjo dominuojamų ekosistemų prie atviresnių standartų: MLIR, ONNX, atviros RISC-V architektūros ir pan. Tai turėtų palengvinti modelių perkėlimą tarp skirtingų lustų ir debesų platformų.

Reguliavimas ir saugumas

Augant DI galiai, auga ir reguliavimo spaudimas. ES AI aktas, JAV ir kitų šalių iniciatyvos siekia nustatyti ribas, kaip ir kur gali būti naudojami aukštos galios modeliai. Tai netiesiogiai veiks ir DI lustų rinką – nuo eksporto kontrolės iki sertifikavimo ir atsakomybės standartų.

Išvada: skaičiavimo galia kaip naujas geopolitinis matas

Dirbtinio intelekto lustai tapo daugiau nei tik technologija – tai naujas geopolitinis ir ekonominis matas. Kurios šalys ir įmonės valdys skaičiavimo galios infrastruktūrą, tos diktuos DI raidą, standartus ir net žaidimo taisykles.

Verslui ir kūrėjams svarbiausia – ne atsilikti. Stebėti lustų ir debesų rinkos pokyčius, rinktis lanksčius sprendimus ir planuoti ilgalaikę DI strategiją. Skaičiavimo galios lenktynės jau vyksta, o dalyvauti jose gali ne tik supervalstybės, bet ir mažos, bet greitos ekosistemos – tokios kaip Baltijos šalys.

DUK: dažniausiai užduodami klausimai

Ar verslui būtina pirkti savo DI lustus, kad naudotų AI?

Nebūtinai. Daugeliui įmonių pakanka debesų paslaugų, kuriose DI lustai jau integruoti. Nuosava infrastruktūra atsiperka tik labai didelio masto projektams arba itin jautriems duomenims, kai debesies naudoti negalima dėl saugumo ar reguliavimo.

Kuo skiriasi GPU nuo specializuotų AI akseleratorių?

GPU yra universalūs ir tinka daugeliui DI užduočių, turi brandžią ekosistemą. Specializuoti akseleratoriai (TPU, NPU, ASIC) dažnai efektyvesni konkrečiose užduotyse ir sunaudoja mažiau energijos, bet yra mažiau lankstūs ir reikalauja labiau specifinio programavimo.

Ar mažos šalys, tokios kaip Lietuva, gali laimėti DI lustų lenktynėse?

Laimėti gamybos lenktynes – sunku, bet galima laimėti naudojimo ir sprendimų kūrimo lenktynes. Lietuva gali specializuotis nišiniuose DI produktuose, MLOps, saugume ir integracijose, pasinaudodama globalia skaičiavimo galia per debesų paslaugas.