Fine-tuning (ქართულად: მოდელის ადაპტაცია) ნიშნავს შემდეგს: ავიღოთ უკვე გამწვრთნელი AI მოდელი — ისეთი, რომელიც ინტერნეტის, წიგნებისა და სხვა ტექსტების უზარმაზარ მასივებზეა დამუშავებული — და ის განვამწვრთნოთ დამატებით, გაცილებით პატარა, სპეციალიზებულ მონაცემთა ბაზაზე. შედეგად მივიღებთ მოდელს, რომელიც კარგად ესმის ჩვენს სფეროს: ჩვენი კომპანიის ენას, ფორმატს და მომხმარებლის კონკრეტულ კითხვებს. ეს გაცილებით იაფია, ვიდრე ნულიდან მოდელის შექმნა — პროცესი, რომელიც მილიონობით დოლარი და თვეები ღირს და მხოლოდ ყველაზე მსხვილ ტექნოლოგიურ კომპანიებს ძალუძთ.

Fine-tuning, prompting და RAG — რით განსხვავდებიან?

სამივე მიდგომა AI-ის მოდელის ქცევის მორგებას ახდენს, თუმცა განსხვავებულ სიღრმეზე.

პრომფტ-ინჟინერია ყოველ კითხვასთან ერთად, მოთხოვნის ტექსტის დახმარებით, მოდელის გამოსავალს მართავს. ეს ყველაზე იაფი ვარიანტია და ყოველთვის ჯობია ამით დაიწყოთ. თუ კარგ პრომფტს სასურველ შედეგამდე მიჰყავხართ, fine-tuning ჭარბი ხარჯია.

RAG (Retrieval-Augmented Generation) მოდელს გარე ცოდნის ბაზასთან აკავშირებს, საიდანაც პასუხამდე ინფორმაციას ეძებს. RAG კარგია მაშინ, როცა საჭიროა ხშირად განახლებადი ან საკუთრებაში არსებული დოკუმენტებიდან ფაქტების მოძიება — ის მოდელს რას წაიკითხოს უჩვენებს, მაგრამ როგორ იფიქროს — არა.

Fine-tuning მოდელის შიდა პარამეტრებს ცვლის, ისე რომ სასურველი ქცევა ჩაბეჭდილი ხდება მოდელის მეხსიერებაში. ეს სწორია, როდესაც გჭირდებათ სტაბილური სტილი, ტონი ან ფორმატი, რომელსაც პრომფტ-ინჟინერია სანდოდ ვერ უზრუნველყოფს, ან კონტექსტის ფანჯარაში მოუთავსებელი სფეროული ცოდნა სჭირდება.

როგორ მუშაობს fine-tuning?

დღეს საწარმოო გარემოში ყველაზე გავრცელებული ტექნიკაა LoRA (Low-Rank Adaptation). LoRA ბაზისური მოდელის ყველა პარამეტრის სწავლის ნაცვლად, მას მცირე „ადაპტერ-ფენებს” უმატებს და მხოლოდ მათ ასწავლის. ბაზისური მოდელი ხელუხლებელი რჩება, რაც გამოთვლის ღირებულებასაც და ადრინდელი შესაძლებლობების დაკარგვის რისკსაც მკვეთრად ამცირებს. 7 მილიარდი პარამეტრის მქონე მოდელის სრული fine-tuning 100 GB-ზე მეტ GPU-ს მეხსიერებას მოითხოვს; LoRA-ს შემთხვევაში ეს ერთ მაღალი კლასის სამომხმარებლო ვიდეობარათად ჯდება.

სასწავლო მასალა, ჩვეულებრივ, „კითხვა–პასუხის” წყვილებია — მაგალითები იმ კითხვებისა, რასაც მომხმარებლები სვამენ, და იდეალური პასუხები. პრაქტიკული პროექტების უმრავლესობისთვის 500-დან 2 000-მდე ფრთხილად გადამოწმებული მაგალითი საკმარისია. ხარისხი რაოდენობაზე გაცილებით მნიშვნელოვანია: 500 ზუსტი, მრავალფეროვანი მაგალითი 5 000 საშუალო ხარისხის მაგალითს სჯობს.

იმ ორგანიზაციებისთვის, ვინც მოდელის ღირებულებებს ასწავლის — მაგ., მავნე გამოსავლის შემცირება — RLHF (Reinforcement Learning from Human Feedback) ტექნიკა უფრო ღრმა ადაპტაციას ახდენს. ის უფრო ძვირი და ექსპერტიზის მოთხოვნილია; ბიზნეს-პრაქტიკის უმეტეს შემთხვევაში მარტივი „ინსტრუქციული fine-tuning” საკმარისია.

როდის იყენებს ბიზნესი fine-tuning-ს?

Fine-tuning მაშინ ამართლებს, როდესაც ამოცანა კარგად განსაზღვრულია, განმეორებადია და სფეროული ექსპერტიზის სტაბილური გამოყენება სჭირდება:

  • მომხმარებელთა მომსახურება — მოდელი, გამწვრთნელი თქვენი პროდუქტის კატალოგსა და პოლიტიკაზე, კითხვებს ბრენდის ტონით პასუხობს, რასაც ზოგადი AI ვერ ახერხებს.
  • სპეციალიზებული კოდის გენერირება — მოდელს შეუძლია ისწავლოს შიდა API-ები, კოდირების სტანდარტები და არქიტექტურული შაბლონები, რაც ინჟინრებს მნიშვნელოვნად ზრდის პროდუქტიულობას.
  • სამართლებრივი, სამედიცინო და ფინანსური დოკუმენტები — სფეროული ტერმინოლოგია, ფორმატის მოთხოვნები და სიზუსტის კრიტიკული მნიშვნელობა ამ სფეროებს fine-tuning-ისთვის ყველაზე შესაფერის შემთხვევებად აქცევს.
  • სტაბილური სტილის კონტენტი — გამომცემლები და მარკეტინგის გუნდები fine-tuning-ს იყენებენ, რომ ტექსტი კონკრეტული ავტორის ან ბრენდის სტილში, და არა ზოგადი AI-ის მიხედვით, შეიქმნას.

სად დაიწყოთ

Fine-tuning-მდე სცადეთ პრომფტ-ინჟინერია. ამოცანათა დიდ ნაწილს კარგი სისტემური პრომფტი წყვეტს, რაც პრაქტიკულად უფასოა.

თუ დაადგინეთ, რომ fine-tuning გჭირდებათ, Hugging Face AutoTrain ყველაზე ხელმისაწვდომი საწყისი წერტილია — კოდის გარეშე, ყველაზე პოპულარული ღია მოდელების მხარდაჭერით, საკუთარ ტექნიკაზე კი — უფასოა. ღრუბლოვანი fine-tuning-ისთვის Google Vertex AI Gemini 2.0 Flash-ისთვის მილიონ სასწავლო ტოკენზე $3-ს ითხოვს (2025 წლის ივლისის მდგომარეობით). Amazon Bedrock-ი Anthropic-ის Claude Haiku-ს fine-tuning-ს სთავაზობს, თუმცა ფასები AWS-თან პირდაპირ კონტაქტით ირკვევა.

GPU-ს გარეშე ორგანიზაციებისთვის ყველაზე ხელმისაწვდომი გზაა ღია წონების მოდელის — მაგ. Meta-ს Llama ან Mistral-ის — fine-tuning ღრუბლოვანი GPU-ს სერვერზე რამდენიმე საათის განმავლობაში. ტიპიური პროექტი გამოთვლის ხარჯებში $100–500 ღირს; ხარჯების ძირითადი ნაწილი სასწავლო მონაცემების მომზადებაში მიდის.

რაზე ფხიზლად უნდა იყოთ

კატასტროფული დავიწყება (Catastrophic Forgetting) ყველაზე გავრცელებული პრობლემაა: მოდელი ახალ ამოცანაში ძლიერდება, მაგრამ ადრინდელ შესაძლებლობებს კარგავს. LoRA ამ პრობლემას ძირითადად ხსნის, რადგან ბაზისური მოდელის პარამეტრებს ხელუხლებლად ტოვებს. გადამეტებული ადაპტაცია (Overfitting) — სასწავლო მაგალითების დამახსოვრება ნიმუშების ნაცვლად — სასწავლო მასალის მრავალფეროვნებითა და ადრეული გაჩერებით (early stopping) მოგვარდება. ყველაზე ძვირი შეცდომა კი fine-tuning-ის გამოყენებაა მაშინ, როდესაც ამოცანა კარგი პრომფტით გვარდებოდა — ამიტომ ჯერ ყოველთვის პრომფტ-ინჟინერია სცადეთ.

რას მოუტანს საქართველოს

საქართველოს მთავრობამ ახლახანს AI-ის კვლევისთვის 18,4 მილიონი დოლარი გამოყო. ამ ინვესტიციის ერთ-ერთი ყველაზე პრაქტიკული გამოყენება სწორედ ღია წონების მოდელების fine-tuning იქნება ქართულ ენობრივ მონაცემებზე. ქართული ენისთვის ძლიერი, ნატიფი AI მოდელი ჯერ კიდევ არ არსებობს; მრავალენოვანი ბაზისური მოდელის ქართულ ტექსტსა და სფეროულ მაგალითებზე ადაპტაცია კი — საჯარო სექტორის ჩათბოტებიდან ადგილობრივენოვანი დოკუმენტების დამუშავებამდე — ამ ხარვეზის შევსების ყველაზე ხელმისაწვდომი გზაა.

სიახლეებში

Meituan-მა ახლახანს გამოაქვეყნა LongCat-2.0 — ფრონტიერ-კლასის კოდირების მოდელი, ჩინური ჩიპებით დამზადებული. სწორედ ასეთი ღია კოდის მოდელები არიან ის საფუძველი, რომელზეც ბიზნესები და მკვლევარები fine-tuning-ს ახდენენ სფეროსპეციფიკური AI სისტემების შესაქმნელად.

ხშირი კითხვები

რამდენი მაგალითი სჭირდება AI მოდელის fine-tuning-ს?
პრაქტიკული პროექტების უმრავლესობა 500-დან 2 000-მდე მაღალი ხარისხის კითხვა-პასუხის წყვილებით მუშაობს. ვიწრო, თანმიმდევრული ამოცანებისთვის ნაკლებიც გამოდგება; ფართო სფეროულ გაშუქებას მეტი სჭირდება.

Fine-tuning იგივეა, რაც AI მოდელის გამოწვრთნა?
არა. გამოწვრთნა ნულიდან აყალიბებს მოდელს — ეს პროცესი მილიონობით დოლარი ღირს. Fine-tuning კი უკვე გამოწვრთნელ მოდელს ეყრდნობა და გაცილებით პატარა მონაცემთა ბაზაზე ახდენს ადაპტაციას.

რა არის LoRA?
LoRA (Low-Rank Adaptation) fine-tuning-ის ყველაზე გავრცელებული ტექნიკაა. ის მოდელს მცირე სასწავლო „ადაპტერ-ფენებს” უმატებს, ბაზისური პარამეტრებს კი ხელუხლებლად ტოვებს. ამით მეხსიერების მოთხოვნა სრულ fine-tuning-თან შედარებით 80–90%-ით მცირდება.

შეიძლება Claude-ს fine-tuning?
Anthropic Claude Haiku-ს fine-tuning-ს Amazon Bedrock-ის საშუალებით სთავაზობს. Claude-ის სხვა მოდელები ამ მომენტში self-serve fine-tuning-ისთვის ხელმისაწვდომი არ არის.