AI-ის გამოთვლითი სიმძლავრე — რა არის ეს და რატომ არ ყოფნის?

AI-ის გამოთვლითი სიმძლავრე გულისხმობს სპეციალიზებულ გამომთვლელ ტექნიკას — პირველ რიგში გრაფიკულ პროცესორებს (GPU) და სპეციალიზებულ AI ჩიპებს — რომლებიც საჭიროა თანამედროვე AI მოდელების ასასწავლად და სამუშაოდ. ამ ინფრასტრუქტურაზე მოთხოვნა ბევრად სწრაფად მატულობს, ვიდრე მსოფლიო მის მიწოდებას ახერხებს, და ყველაზე დიდი ტექნოლოგიური კომპანიებიც კი AI-ის სიმძლავრეზე წვდომის განაწილებას ახდენენ.

რა ნიშნავს “კომპიუტინგი” AI-ის კონტექსტში

ყოველდღიური გაგებით, “გამოთვლითი სიმძლავრე” ნიშნავს იმ მათემატიკური ოპერაციების რაოდენობას, რომელსაც მანქანა წამში ასრულებს. AI მოდელებს — განსაკუთრებით ენობრივ მოდელებს (LLM), რომლებიც ChatGPT-ს, Gemini-ს და Claude-ს საფუძვლად უდევს — ამ ოპერაციების გასაოცარი რაოდენობა სჭირდება. ერთი ფრონტული მოდელის ასწავლელად ათასობით ჩიპს შეიძლება კვირობით ან თვობით მუდმივ რეჟიმში მოუხდეს მუშაობა.

GPU არის AI-ის გამოთვლის მთავარი ძრავა. თავდაპირველად ვიდეოთამაშების გრაფიკისთვის შექმნილი GPU-ები ახლა სწორედ AI-ის სასწავლო გამოთვლებს ამუშავებენ, რადგან ისინი ათასობით ოპერაციას პარალელურად ასრულებენ. Nvidia-ს H100 და H200 ჩიპები ინდუსტრიის სტანდარტი გახდა — 8 H100-ის ერთი სერვერული სერვი დაახლოებით 300 000 დოლარი ღირს.

რატომ სჭირდება AI-ს ამდენი სიმძლავრე

მასშტაბი თითქმის გაუგებარია. მკვლევარები AI-ის სასწავლო სამუშაოს FLOPs-ებით ზომავენ — მცოცავ-მძიმიანი ოპერაციებით. AlexNet, 2012 წლის ეტაპობრივი სურათის ამოსაცნობი მოდელი, ასწავლელად საჭიროებდა დაახლოებით 10¹⁸ FLOPs. Google-ის Gemini Ultra-ს (2023) სავარაუდოდ 10²⁶ FLOPs დასჭირდა — ეს ასი მილიონჯერ მეტია, ათ წელზე ნაკლებ დროში.

ეს კოლოსალური ხარჯებად ითარგმნება. GPT-4-ის ასწავლელად სავარაუდოდ 78–100 მილიონი დოლარი დახარჯეს მხოლოდ გამოთვლებში. Meta-ს Llama 3.1 70B მოდელის ასწავლელად 2 მილიონი GPU-საათი დახარჯეს — დაახლოებით 6 მილიონი დოლარი. ყველაზე დიდი ფრონტული სისტემები ერთ ტრენინგ-სესიაზე რამდენიმე ასეულ მილიონ დოლარამდე ღირს.

გაწვრთნილი მოდელის გაშვება (ეგრეთ წოდებული “ინფერენსი”) ასევე ბევრ სიმძლავრეს მოიხმარს: ყველა შეტყობინება, რომელსაც მომხმარებელი AI-ს უგზავნის, მილიარდობით პარამეტრის გავლით მუშავდება. ასობით მილიონ მომხმარებელზე გამრავლებული — ინფრასტრუქტურის ხარჯი ასტრონომიულ ციფრებამდე მაღლდება.

ნაკლებობის მიზეზები

სამი ურთიერთდაკავშირებული სასიძო ერთდროულად შეიქმნა.

ჩიპების პაკეტირება. Nvidia-ს ყველაზე ძლიერი AI ჩიპები საჭიროებს CoWoS (“Chip on Wafer on Substrate”) სახელწოდების მოწინავე წარმოების ტექნიკას, რომელიც GPU-ს და მაღალი სიჩქარის მეხსიერებას (HBM) ერთ კომპაქტურ პაკეტში აერთიანებს. ამ ტექნოლოგიით TSMC — ტაივანური ქარხანა, რომელიც მსოფლიოს ყველაზე მოწინავე ჩიპების უმეტეს ნაწილს აწარმოებს — ფლობს საკმარის სიმძლავრეს. TSMC სწრაფ ტემპში ფართოვდება, მაგრამ მისი ხელმძღვანელობა გვაფრთხილებს, რომ ნაკლებობა 2027 წლამდე ან შემდეგაც გაგრძელდება.

მეხსიერება. AI ჩიპებს სჭირდება მაღალი სიჩქარის მეხსიერება (HBM) — სპეციალიზებული, შეჩხერილი RAM, რომელიც მონაცემებს განუსაზღვრელი სისწრაფით გადასცემს. HBM-ის მთავარი მომწოდებელი SK Hynix ამ ტემპს ვერ ყოფნის. სრული სისტემების მიწოდება 36–52 კვირამდე შეიძლება მოითხოვდეს.

მონაცემთა ცენტრების ინფრასტრუქტურა. ჩიპების არსებობის შემთხვევაშიც კი, ახალი მონაცემთა ცენტრის მშენებლობა წლებს მოითხოვს და უზარმაზარ ელექტრო ენერგიას ხმარობს. დიდი AI მონაცემთა ცენტრი 100 მეგავატიდან 1 გიგავატამდე სიმძლავრეს მოიხმარს — პატარა ქალაქის ენერგოხარჯის ეკვივალენტი. 2026 წელს დაგეგმილი ამერიკული მონაცემთა ცენტრების დაახლოებით ნახევარი დაგვიანებული ან გაუქმებულია — არა ჩიპების, არამედ ელექტრო ქსელების, ტრანსფორმატორებისა და მიმდებარე ინფრასტრუქტურის ნაკლებობის გამო.

ყოველი ამის შედეგად, Microsoft, Google, Meta და Amazon 2025 წელს Nvidia-ს Blackwell თაობის ჩიპებზე წინასწარ გიგანტური შეკვეთები შეიტანეს, 2027 წლამდე ხელმისაწვდომი მარაგი ფაქტობრივად გაიტაცეს. მცირე კომპანიებს ხშირად ერთ წელზე მეტი ლოდინი უხდებათ.

როდის შემსუბუქდება ნაკლებობა?

ნელ-ნელა. Samsung და Micron HBM-ის წარმოებას ზრდიან, რაც 2026 წლის ბოლომდე მეხსიერების პრობლემას შეამსუბუქებს. TSMC-ის გაფართოებაც დაეხმარება, მაგრამ ახალი სიმძლავრის დიდი ნაწილი შემდეგი თაობის ჩიპებზე უკვე დაჯავშნულია. ინდუსტრიის ანალიტიკოსები და TSMC-ის ხელმძღვანელობა 2027 წლის დასაწყისს ასახელებენ, როგორც ყველაზე ადრეულ შესაძლო მომენტს გამოკეთებისთვის.

ამასობაში AI კომპანიები ალტერნატივებს ეძებენ: საკუთარ ჩიპებს ქმნიან (Google-ის TPU-ები, Amazon-ის Trainium), პატარა, ეფექტური მოდელებს ეყრდნობიან მოდელის დისტილაციის ტექნიკით, და სამუშაოს იმ რეგიონებში ანაწილებენ, სადაც ელექტრო ინფრასტრუქტურა ხელმისაწვდომია.

სიახლეებში

Google-ის გადაწყვეტილება — Meta-სთვის Gemini-ს სიმძლავრეზე წვდომა შეეზღუდა — ყველაზე მაღალ დონეზე გვიჩვენებს, რას ნიშნავს ეს კრიზისი პრაქტიკაში. Google-მაც კი — რომელიც 2026 წელს 180 მილიარდ დოლარზე მეტს ხარჯავს ინფრასტრუქტურაში — Meta-ს გამოთვლითი სიმძლავრის მოთხოვნა ვერ შეასრულა, რამაც Meta-ს AI-ის გამოყენების შეზღუდვა და საკუთარი მოდელების დაჩქარებული შემუშავება მოუხდა. ეს ეპიზოდი ადასტურებს: კომპიუტინგის კრიზისი მხოლოდ სტარტაპების პრობლემა არ არის — ის ცვლის იმ გზებს, რომლითაც მსოფლიოს უდიდესი კომპანიები AI სერვისებს გეგმავენ, ფასებს ადგენენ და პრიორიტეტებს ანიჭებენ.

→ Google-მ Meta-ს Gemini AI-ზე წვდომა შეზღუდა — გამოთვლის სიმძლავრის კრიზისი ინდუსტრიას ეხება

ხშირად დასმული კითხვები

რა არის GPU და რატომ სჭირდება AI-ს?
GPU (გრაფიკული პროცესორი) არის ჩიპი, რომელიც პარალელური გამოთვლებისთვის არის შექმნილი — ათასობით პატარა გამოთვლა ერთდროულად. ეს მას AI-ის სასწავლო მატრიცული ოპერაციებისთვის იდეალურს ხდის, სადაც სწორედ ამგვარი მასიური პარალელიზმია საჭირო.

ეს იგივე კრიზისია, რაც 2021 წლის ჩიპების ნაკლებობა?
არა. 2021 წლის ნაკლებობა ფართო სამომხმარებლო სეგმენტს ეხებოდა — მანქანებს, კონსოლებს, ტელეფონებს. ახლანდელი AI კომპიუტინგის კრიზისი უფრო ვიწრო, მაგრამ სტრუქტურული ხასიათისაა: ის მოწინავე AI ჩიპებსა და მათ სპეციალიზებულ მეხსიერებაზე ფოკუსირებულია, და პანდემიის ჯაჭვური დარღვევებით კი არ გამოიწვია, არამედ ასტრონომიული მოთხოვნით.

მცირე კომპანიებს კვლავ შეუძლიათ AI-ის სიმძლავრეზე წვდომა?
შეუძლიათ, მაგრამ უფრო ძვირად და შეზღუდულად. Cloud პლატფორმები GPU-ის ინსტანციებს სთავაზობენ; სპეციალიზებული პროვაიდერები — CoreWeave, Lambda Labs — სამიზნე კლასტერებს ქირაობენ. ყველაზე ძლიერ ჩიპებზე ლოდინის სიები არსებობს. ალტერნატივა — პატარა, გამარტივებული მოდელების გამოყენება, რომლებიც ნაკლებ ტექნიკაზე ეფექტურად მუშაობს.

AI-ი გაიაფდება, როცა მიწოდება გაიზრდება?
დიდი ალბათობით, დროთა განმავლობაში — კი. ისტორიულად, გამოთვლის ღირებულება მცირდება წარმოების მასშტაბებთან ერთად. მაგრამ მოთხოვნა ასე სწრაფად იზრდება, რომ AI-ის ინფრასტრუქტურაზე საერთო ხარჯები სავარაუდოდ კვლავ გაიზრდება, მაშინაც კი, თუ ერთი ჩიპი გაიაფდება.

წყაროები: სასწავლო ხარჯები — AI Superior, Galileo AI. FLOPs მონაცემები — Our World in Data. TSMC-ის ვადები — TechMarketer. Google/Meta ისტორია — CNBC.