კვლევა: განლაგებული AI აგენტების 83%-ს უსაფრთხოების შეფასება გამოქვეყნებული არ აქვს

MIT-ის, სტენფორდის, ჰარვარდის სამართლის სკოლისა და მრავალი სხვა ინსტიტუტის მკვლევართა ჯგუფმა ახალ ნაშრომში ცხადყო, რომ კომერციულად განლაგებული AI აგენტების შთამბეჭდავი უმეტესობა უსაფრთხოების შეფასების შედეგებს საჯაროდ არ ავრცელებს. 2025 წლის AI Agent Index ამ კვირაში წარადგინეს ACM FAccT 2026 კონფერენციაზე — სამართლიანობის, ანგარიშვალდებულებისა და გამჭვირვალობის საკითხებისადმი მიძღვნილ ერთ-ერთ ყველაზე გავლენიან სამეცნიერო ფორუმზე.

კვლევაში განხილულია 30 ცნობილი AI აგენტი სამ კატეგორიაში: 12 სასაუბრო ასისტენტი, 5 ბრაუზერ-აგენტი და 13 ენტერფრაიზ ხელსაწყო. მკვლევარებმა 1,350 მონაცემთა ველი გაანალიზეს საჯარო წყაროებისა და შემქმნელებთან კომუნიკაციის საფუძველზე.

სისტემური ხარვეზი გამჭვირვალობაში

ძირითადი დასკვნა გამაოგნებელია: 30-დან 25 აგენტი შიდა უსაფრთხოების შეფასების შედეგებს საჯაროდ არ ავრცელებს, ხოლო 23-ს გარე, დამოუკიდებელი ტესტირება საერთოდ არ გაუვლია. 1,350 ველიდან 227-ში ინფორმაცია ვერ მოიძებნა. უსაფრთხოების სფეროს ველები განსაკუთრებით ხარვეზიანია — 240-დან 135 მათგანი (56%) ცარიელია. ენტერფრაიზ აგენტებისთვის ეს მაჩვენებელი 66%-ია, ბრაუზერ-აგენტებისთვის — 60%.

ის ოთხი აგენტი, რომელმაც კონკრეტული უსაფრთხოების მონაცემები გამოაქვეყნა, არის ChatGPT Agent, OpenAI Codex, Claude Code და Gemini 2.5 Computer Use — ყველა მათგანი სამი კომპანიის პროდუქტია, რომელთა საფუძვლური მოდელები ინდექსში შემავალი სხვა თითქმის ყველა აგენტის საძირკველია.

შესაძლებლობები — ღიად, რისკები — ნაკლებად

მკვლევარები ასახელებენ მნიშვნელოვან დისბალანსს: 30-დან 9 აგენტი ბენჩმარკ-ტესტების შედეგებს (კოდირება, ინტერფეისის გამოყენება) ავრცელებს, მაგრამ იშვიათად ურთავს შესაბამის საფრთხის შეფასებას. 30-დან 15-ს გამოქვეყნებული AI-ის უსაფრთხოების ჩარჩო-დოკუმენტი ერთხელ მაინც ჰქონდა; 10-ს — არც ეს. AI-გენერირებული კონტენტის წყლის ნიშნის (watermarking) ტექნოლოგიას მხოლოდ 3 აგენტი ემხრობა.

კონცენტრირებული, ძნელად გასაანალიზებელი ეკოსისტემა

კვლევა ასახელებს სტრუქტურულ საფრთხეს: 30 აგენტის თითქმის ყველა GPT, Claude ან Gemini-ის საფუძვლურ მოდელს ეყრდნობა. ამ სამი მოდელ-ოჯახიდან ნებისმიერის ხარვეზი შეიძლება მთელ განლაგებულ ეკოსისტემაში ერთდროულად გავრცელდეს. ასევე გართულებულია ანგარიშვალდებულების განსაზღვრა: მოდელ-შემქმნელები, პლატფორმ-შემქმნელები და ენტერფრაიზ-ოპერატორები ერთ ჯაჭვს ქმნიან, სადაც ვინ რაზეა პასუხისმგებელი — ხშირად გაურკვეველია.

რატომ არის ეს მნიშვნელოვანი სწორედ ახლა

ეს კვლევა ვლინდება მაშინ, როდესაც AI აგენტები სწრაფად ინტეგრირდება იურიდიულ კვლევებში, ჯანდაცვის სისტემებში, კორპორაციულ პროგრამულ უზრუნველყოფასა და სახელმწიფო სტრუქტურებში — ავტონომიის ისეთ დონეზე, სადაც სისტემამ შეიძლება ბრონირება გააკეთოს, კოდი შეასრულოს ან ელ-წერილი გაგზავნოს ყოველ ნაბიჯზე ადამიანის თანხმობის გარეშე.

ნაშრომის ავტორები მოუწოდებენ სტანდარტიზებული გამჟღავნების მოთხოვნების შემოღებისკენ — ფარმაცევტული ან ფინანსური პროდუქტების ანალოგიური სტანდარტებით — და ამტკიცებენ, რომ ნებაყოფლობითი მიდგომა მომხმარებლებს, ორგანიზაციებს და მარეგულირებლებს ამ სისტემების დანერგვასთან დაკავშირებული რისკის ობიექტური შეფასების შესაძლებლობას ართმევს.

სრული ინდექსი ხელმისაწვდომია aiagentindex.mit.edu-ზე.