Google-მ Gemini Omni Flash გამოუშვა — ვიდეოს საუბრისმიერი რედაქტირების პირველი მოდელი

Google DeepMind-მა 30 ივნისს ორი ახალი გენერაციული AI მოდელი გამოუშვა, რომლებიც სურათებისა და ვიდეოს შექმნას დეველოპერებისთვის უფრო სწრაფ და ხელმისაწვდომ ფასად ხდის: Gemini Omni Flash ვიდეოს შესაქმნელად და Nano Banana 2 Lite — სწრაფი სურათის გენერაციისთვის.

ვიდეოს საუბრისმიერი რედაქტირება

Gemini Omni Flash (gemini-omni-flash-preview) მულტიმოდალური მოდელია, რომელიც 720p გარჩევადობით 10-წამამდე ვიდეოებს ქმნის ტექსტური აღწერებიდან, სტატიკური სურათებიდან ან არსებული ვიდეო-კლიპებიდან. მოდელის მთავარი თვისება საუბრისმიერი რედაქტირებაა: ტაიმლაინის ხელით ჭრის ნაცვლად, მომხმარებლები ბუნებრივ ენაზე აღწერენ სასურველ ცვლილებებს, ხოლო მოდელი ასრულებს მათ — ტექსტ-მოქმედებების სინქრონიზაციის შენარჩუნებით და სცენების კონტექსტუალიზაციისთვის რეალური ცოდნის გამოყენებით.

Gemini Omni Flash-ის ფასია $0.10 ვიდეოს ყოველ გამოშვებულ წამზე. ის ხელმისაწვდომია Google AI Studio-ს, Gemini API-ის, Gemini-ის აპლიკაციისა და Google Flow-ს მეშვეობით. Google-ი ასახელებს ამჟამინდელ შეზღუდვებს: ხმის მითითების მხარდაჭერა არ არსებობს, ვიდეოს მაქსიმალური ხანგრძლივობა 10 წამია და სხვადასხვა სცენაში პერსონაჟების კონსისტენტობა ჯერ კიდევ სუსტია. უფრო გრძელი ვიდეოები და სცენის გაფართოების ფუნქცია მომავალ განახლებებში დაემატება.

სწრაფი და ეკონომიური სურათის გენერაცია

Nano Banana 2 Lite (gemini-3.1-flash-lite-image) ახლა ზოგადად ხელმისაწვდომია და Google-ის ყველაზე სწრაფ და ეკონომიურ სურათ-გენერაციის მოდელად პოზიციონირდება. Google-ის მიხედვით, ის სურათს დაახლოებით ოთხ წამში ქმნის — 1,000 სურათზე $0.034 ღირებულებით — პრომფტის ზუსტი შესრულებისა და სურათში ტექსტის ამოკითხვადობის შენარჩუნებით.

მოდელი ხელმისაწვდომია Google AI Studio-ზე, Gemini API-ზე და Gemini Enterprise Agent Platform-ზე. AI Mode Search-ში, Google Photos-ში, NotebookLM-სა და Google Ads-ში გაშვება მიმდინარეობს.

Google DeepMind-ის პროდუქტ-მენეჯერები ალისა ფორთინი და ანიშ ნანგია ორ მოდელს ურთიერთმამვსებელ ინსტრუმენტებად ასახელებენ: დეველოპერებს შეუძლიათ სწრაფ სურათ-გენერაციას Omni Flash-ის ვიდეო-ანიმაცია დაუკავშირონ და სრული მულტიმედიური ვორქფლოუ ააწყონ.