რა არის HBM (მაღალი სიჩქარის მეხსიერება) — და რატომ სჭირდება AI-ს იგი?

HBM (High Bandwidth Memory — მაღალი სიჩქარის მეხსიერება) სპეციალური ტიპის DRAM-ია, რომელიც მეხსიერების ჩიპებს ვერტიკალურად ახვამს ერთმანეთზე და ასე მონაცემთა გადაცემის სიჩქარეს ჩვეულებრივ მეხსიერებასთან შედარებით 10–20-ჯერ ზრდის. სწორედ ეს ტექნოლოგია უდევს საფუძვლად თანამედროვე AI ჩიპებს — NVIDIA-ს, AMD-სა და სხვათა — რომლებიც დიდ ენობრივ მოდელებს ამუშავებენ.

როგორ განსხვავდება HBM ჩვეულებრივი მეხსიერებისგან

ჩვეულებრივი DDR5 მეხსიერება, რომელიც კომპიუტერებსა და სერვერებში გამოიყენება, 64-ბიტიანი ინტერფეისით გადასცემს მონაცემებს. HBM სრულიად განსხვავებულ მიდგომას იყენებს: 16 მეხსიერების ჩიპი ვერტიკალურად ახვამს ერთმანეთზე, მათ ათასობით პატარა არხით (TSV — through-silicon via) აკავშირებს და 1 024-ბიტიანი ფართო ინტერფეისით ერთდროულად გადასცემს მონაცემებს.

შედეგი: HBM3E — დღეს ყველაზე გავრცელებული თაობა — ერთ სტეკზე 1,2 ტერაბაიტ/წამამდე სიჩქარეს უზრუნველყოფს. DDR5 მეხსიერება კი ერთ მოდულზე დაახლოებით 50–100 გბ/წამს გვაძლევს. გარდა ამისა, HBM პროცესორის გვერდით, ერთ სუბსტრატზე თავსდება — ეს მონაცემთა გზას ამოკლებს და ენერგიის მოხმარებას ამცირებს.

რატომ სჭირდება AI ჩიპებს მეხსიერების მეტი სიჩქარე

დიდი ენობრივი მოდელების ტრენინგი და ინფერენსი (შედეგების გამომუშავება) მოითხოვს უზარმაზარი მოცულობის მონაცემების გადაადგილებას: მოდელის წონები, შუალედური შედეგები და, ინფერენსის დროს, KV ქეში (key-value cache), რომელიც საუბრის გახანგრძლივებასთან ერთად სულ უფრო იზრდება.

GPU-ების გამოთვლითი ბირთვები ბევრად სწრაფია, ვიდრე მეხსიერება მათთვის მონაცემებს მიაწვდის. პრაქტიკაში LLM ინფერენსის დროს GPU 30–50%-ზე მუშაობს — არა ნელი გამოთვლების, არამედ მომდევნო მონაცემების ლოდინის გამო.

ეს „მეხსიერების სიჩქარის კედელია” (memory bandwidth wall). ტოკენ-ტოკენ გენერაციის ფაზაში, ყოველი ახალი ტოკენის შექმნისთვის, მოდელის მთელი წონები ხელახლა იკითხება მეხსიერებიდან. 70-მილიარდი პარამეტრის მქონე მოდელისთვის ეს ყოველ ტოკენზე ~140 გბ-ის კითხვას ნიშნავს.

HBM ამ ბარიერს პირდაპირ ეჯახება: მეხსიერებას პროცესორის გვერდით ათავსებს და მას ტერაბაიტ/წამი სიჩქარის ინტერფეისს უქმნის. ეს უზრუნველყოფს ბირთვების სრულ დატვირთვას, გრძელი კონტექსტის ეფექტიანი დამუშავების საშუალებას და სწრაფ ტრენინგს.

HBM-ის თაობები: HBM1-დან HBM4-მდე

სტანდარტი 2013 წელს შეიქმნა — Samsung-ის, AMD-სა და SK Hynix-ის ერთობლივი ძალისხმევით — და სწრაფად განვითარდა:

თაობა	სიჩქარე სტეკზე	მაგალითი
HBM1 (2013)	~128 გბ/წამ	AMD Fiji
HBM2 (2016)	~256 გბ/წამ	NVIDIA V100
HBM2E (2017)	~384 გბ/წამ	NVIDIA A100
HBM3 (2022)	~819 გბ/წამ	NVIDIA H100
HBM3E (2023)	~1 229 გბ/წამ	NVIDIA H200, B200; AMD MI300X
HBM4 (2025)	~2 048 გბ/წამ	მომდევნო თაობა

HBM4 ინტერფეისს 2 048 ბიტამდე ორმაგდება. SK Hynix-მა HBM4-ის შემუშავება 2025 წელს დაასრულა; 2026 წლის AI ამაჩქარებლებში გამოჩნდება.

ვინ აწარმოებს HBM-ს — და რომელ ჩიპებში გამოიყენება

HBM-ს დღეს მხოლოდ სამი კომპანია აწარმოებს: SK Hynix, Samsung და Micron. SK Hynix ბაზრის დაახლოებით ნახევარს ფლობს და HBM3E-ის მასობრივ წარმოებაში პირველი შევიდა.

ყველა მსხვილი AI ამაჩქარებელი HBM-ზეა დამოკიდებული:

NVIDIA H100: 80 გბ HBM3, 3,35 ტბ/წამ
NVIDIA H200: 141 გბ HBM3E, 4,8 ტბ/წამ
NVIDIA B200: 180 გბ HBM3E, 7,7 ტბ/წამ
AMD MI300X: 192 გბ HBM3, 5,3 ტბ/წამ

ვინაიდან HBM-ის წარმოება მსოფლიოში მხოლოდ რამდენიმე ქარხანშია კონცენტრირებული და AI-ის მოთხოვნა მიწოდებას სჭარბობს, HBM სტრატეგიულ რესურსად იქცა — გავლენას ახდენს GPU-ების ფასზე, მიწოდების ჯაჭვებზე და ნახევარგამტარების საერთაშორისო კონკურენციაზე.

სიახლეებში

SK Hynix-მა, HBM-ის მსოფლიოს უმსხვილესმა მწარმოებელმა, 2026 წლის ივნისში Nasdaq-ზე $29 მილიარდის ოდენობის განთავსება გამოაცხადა AI მეხსიერების წარმოების გასაფართოებლად — ეს ნაბიჯი კარგად ასახავს HBM-ის სტრატეგიულ მნიშვნელობას.

ხშირად დასმული კითხვები

AI მოდელები HBM-ის გარეშეც მუშაობს?
დიახ — მცირე მოდელები ჩვეულებრივ LPDDR ან GDDR მეხსიერებაზე მუშაობს, და მომხმარებლის მრავალი AI პროდუქტი ასეც მუშაობს. თუმცა ფრონტიერ მოდელების (ასობით მილიარდი პარამეტრი) ტრენინგი და ინფერენსი მხოლოდ HBM-ის სიჩქარეზეა შესაძლებელი.

რატომ არ გამოიყენება HBM ყველა კომპიუტერში?
HBM-ის წარმოება ძვირია და სპეციალური შეფუთვის ტექნოლოგიას საჭიროებს, რომელიც მეხსიერებასა და პროცესორს ერთ სუბსტრატზე ათავსებს. ჩვეულებრივი კომპიუტინგისთვის DDR მეხსიერება ბევრად ეკონომიურია.

რა არის HBM4 და როდის გამოჩნდება?
HBM4 ინტერფეისს 2 048 ბიტამდე ორმაგდება და ~2 ტბ/წამ სიჩქარეს უზრუნველყოფს — HBM3E-ზე თითქმის ორჯერ მეტი. SK Hynix-მა HBM4 2025 წელს შეიმუშავა; 2026 წლის AI ჩიპებში გამოჩნდება.

რა ღირს HBM?
ფასი მოცულობასა და კონტრაქტის პირობებზეა დამოკიდებული. 2026 წლის შუა პერიოდის მდგომარეობით, HBM3E-ის სავარაუდო ღირებულება ~$8–10/გბ-ს შეადგენს, რაც HBM-ს AI ამაჩქარებლების ყველაზე ძვირ კომპონენტებს შორის აქცევს. დეტალებისთვის იხ. SK Hynix-ის პროდუქტის გვერდი.

წყაროები: High Bandwidth Memory — Wikipedia; SK Hynix-ის პროდუქტის დოკუმენტაცია; NVIDIA H100/H200/B200 სპეციფიკაციები; AMD MI300X სპეციფიკაციები.