ჩინური ტექნოლოგიური კომპანია Meituan, რომელიც ძირითადად კვების მიწოდებითა და ადგილობრივი კომერციით არის ცნობილი, 30 ივნისს გამოაქვეყნა LongCat-2.0 — 1,6 ტრილიონი პარამეტრის Mixture-of-Experts არქიტექტურის მოდელი MIT ლიცენზიით.

ჩინური ჩიპებით, დასავლური ტექნოლოგიის გარეშე

მოდელი გავარჯიშდა 50 000-ზე მეტ ჩინურ ASIC-ზე (სპეციალიზებულ ინტეგრალურ სქემებზე) — Nvidia-ს GPU-ებისა და სხვა დასავლური ნახევარგამტარული ტექნოლოგიის გარეშე. სავარჯიშო კორპუსი 35 ტრილიონ ტოკენს გადაჭარბებდა. ეს მნიშვნელოვანი ნაბიჯია ჩინეთის ფრონტიერ AI-ის დასავლური ნახევარგამტარული ჯაჭვისგან დამოუკიდებელი განვითარების კუთხით.

ფრონტიერთან ახლოს

LongCat-2.0-მა SWE-bench Pro ტესტზე 59,5 ქულა მოაგროვა და GPT-5.5-ის 58,6-ს გაუსწრო. Terminal-Bench 2.1-ზე — 70,8, SWE-bench Multilingual-ზე — 77,3, ხოლო FORTE-ზე — 73,2.

მოდელი ასევე მხარს უჭერს 1 მილიონი ტოკენის კონტექსტის ფანჯარას, რაც მთელი კოდბაზების ან გრძელი დოკუმენტების სრულ ანალიზს სიჭრელის გარეშე შესაძლებელს ხდის. არქიტექტურულად გამოიყენება LongCat Sparse Attention, N-gram Embedding და Zero-Compute Experts ჩარჩო.

“Owl Alpha”-დან ღია კოდამდე

საჯარო გამოქვეყნებამდე LongCat-2.0 ფარულად იყო ხელმისაწვდომი OpenRouter-ზე “Owl Alpha” სახელით, სადაც გლობალური სიის სამ ყველაზე გამოყენებად მოდელს შორის მოხვდა. დეველოპერები ფართოდ ხმარობდნენ მას ვიდრე Meituan-მა მისი ვინაობა გაამჟღავნებდა — ამ ხნის განმავლობაში კომპანიამ რეალური სამეწარმეო გარემოდან მონაცემები შეგროვა.

კომერციული გამოყენება

MIT ლიცენზია ნებას რთავს მოდელი კომერციულ პროდუქტებში გამოიყენონ და გაავრცელონ წარმოებული ნაშრომის ღია კოდად გასახელების ვალდებულების გარეშე — ეს ამ მასშტაბის მოდელის ერთ-ერთი ყველაზე ლიბერალური ლიცენზიაა. წონები ხელმისაწვდომია Hugging Face-სა და ModelScope-ზე; API წვდომა — Meituan-ის პლატფორმაზე longcat.ai-ზე.