Liquid AI-მ 2026 წლის 25 ივნისს გამოუშვა LFM2.5-230M — 230 მილიონ-პარამეტრიანი ღია წვდომის მოდელი, რომელიც AI ამოცანებს ასრულებს პირდაპირ მოწყობილობებზე: სმარტფონებზე, ერთ-დაფიან კომპიუტერებსა და რობოტებზე, ინტერნეტთან კავშირის გარეშე.

რას ასრულებს

Samsung Galaxy S25 Ultra-ზე მოდელი 213 ტოკენს ამუშავებს წამში, Raspberry Pi 5-ზე — 42-ს. მეხსიერება 375 მეგაბაიტს არ სცილდება. სერვერის კლასის H100 GPU-ზე პასუხის დრო 50 მილიწამზე ნაკლებია.

კომპაქტური ზომის მიუხედავად, LFM2.5-230M ჯობს ბევრ მოდელს, რომლებიც მასზე ორჯერ და მეტია. ინსტრუქციების შესრულებაში (IFEval) მოდელი 71.71 ქულას იღებს — Google-ის Gemma 3 1B-ის 63.49-ის წინააღმდეგ. სტრუქტურირებული მონაცემების ამოღებაში (CaseReportBench) მაჩვენებელია 22.51, IBM-ის Granite 4.0-350M-ის 0.84-თან შედარებით.

არქიტექტურა და ვარჯიში

მოდელი Liquid AI-ის LFM2 არქიტექტურაზეა აგებული — ეს ტრანსფორმერებისგან განსხვავებული მიდგომაა, რომელიც ყურადღების მექანიზმის ნაცვლად სახელმწიფო-სივრცულ (state-space) და სითხური ნეირონული ქსელის ფორმულირებებს იყენებს. სწორედ ეს ანიჭებს მას სიჩქარის უპირატესობას შეზღუდული რესურსების მქონე მოწყობილობებზე. წინასწარი ვარჯიში 19 ტრილიონ ტოკენზე ჩატარდა; კონტექსტის ფანჯარა 32 000 ტოკენს შეადგენს.

ფაინ-თიუნინგი სამ ეტაპად მიმდინარეობდა: კონტროლირებადი ვარჯიში დისტილაციით, პირდაპირი პრეფერენციების ოპტიმიზაცია და მრავალ-დომენური გაძლიერება.

გამოყენება და შეზღუდვები

Liquid AI-ი LFM2.5-230M-ს ათავსებს მონაცემთა ამოღების, მსუბუქი ონ-დივაის ამოცანებისა და ინსტრუმენტის გამოყენების სფეროში — IoT სენსორებზე, ავტომობილებსა და რობოტებზე. კომპანია პირდაპირ აცხადებს, რომ მოდელი არ ითვალისწინება რთული მათემატიკის, კოდის გენერაციის ან გრძელი შემოქმედებითი ტექსტების შედგენისთვის.

ორივე ვერსია — LFM2.5-230M-Base და ფაინ-თიუნინგ ვარსიო — ხელმისაწვდომია Hugging Face-ზე. მოდელი მუშაობს llama.cpp, MLX, vLLM, SGLang და ONNX გარემოებში — Apple, AMD, Qualcomm და NVIDIA აპარატურაზე.