Veo 3 zaprezentowany podczas I/O 2025 stanowi bezpośrednią odpowiedź na OpenAI Sora. Początkowo dostępny w 70 krajach, obecnie działa już w 140 regionach świata. W porównaniu z poprzednią wersją, oferuje lepszą kontrolę kreatywną, obsługę wyższych rozdzielczości, bardziej realistyczną fizykę i precyzyjniejsze odwzorowanie promptów tekstowych.
Czytaj też: Google w końcu gra w otwarte karty. Oto wszystkie limity dla Gemini
Publiczny podgląd płatnej wersji Veo 3 dla Gemini API i Vertex AI uruchomiono w lipcu tego roku. Obecne ogłoszenie stabilności modeli sygnalizuje gotowość do szerszej komercjalizacji. Nowa polityka cenowa i funkcjonalna sugeruje, że Google poważnie traktuje konkurencję w tym dynamicznie rozwijającym się segmencie. Firmy już testują możliwości Veo 3 w praktyce. Invisible Studio wykorzystuje model do przyspieszenia produkcji krótkich form, Saga łączy go z Imagen 4 do transformacji scenariuszy w materiały wizualne, a Mosaic generuje spójne filmy do 64 sekund z natywnym dźwiękiem.
Czytaj też: Gemini w Dysku Google może teraz jeszcze więcej
Teraz natomiast firma poinformowała, że oba narzędzia — Veo 3 i Veo 3 Fast — wyszły już z fazy testów i są gotowe do pełnego wdrożenia w Gemini API.
Jakie zmiany Google przygotował dla Veo 3?
Najbardziej odczuwalną zmianą są drastyczne cięcia cenowe dla obu wariantów Veo. Standardowy model Veo 3 kosztuje teraz 0,40 dolara (około 1,45 zł) za sekundę generowanego materiału, co stanowi spadek z poprzednich 0,75 dolara (około 2,71 zł). Jeszcze bardziej atrakcyjnie prezentuje się Veo 3 Fast, którego cena spadła do zaledwie 0,15 dolara (około 54 grosze) za sekundę.
Taka polityka cenowa wyraźnie wskazuje na chęć dotarcia do mniejszych firm i indywidualnych twórców. Przy nowych stawkach, minutowy materiał wideo generowany standardowym modelem kosztuje około 9 dolarów (około 33 zł), podczas gdy wersja Fast to wydatek niecałych 3 dolarów (około 11 zł). Google potwierdza, że oba modele osiągnęły stabilność konieczną do produkcyjnego wdrożenia przez Gemini API.
Czytaj też: Koniec z LinkedIn? OpenAI tworzy własną platformę do rekrutacji wspieraną przez AI
To nie wszystko, ponieważ pojawiła się również obsługa nowego formatu 9:16, co jest odpowiedzią na rosnącą popularność treści mobilnych. Ta funkcja pozwala na generowanie materiałów idealnie dopasowanych do TikToka, Instagram Reels czy YouTube Shorts, co może znacząco ułatwić życie twórcom skupionym na tych platformach. Drugą istotną nowością jest możliwość generowania w rozdzielczości 1080p HD. Wcześniejsze implementacje w Gemini API ograniczały się do 720p, choć model teoretycznie obsługiwał nawet 4K. Na razie wyższa rozdzielczość działa wyłącznie dla tradycyjnego formatu 16:9, ale i tak stanowi wyraźny postęp w jakości outputu.
Czytaj też: DeepSeek wprowadza obowiązkowe oznakowanie treści AI. To może wiele zmienić
Technologia Veo 3 już zasila różne aplikacje w ekosystemie Google. Wykorzystują ją Gemini do ośmiosekundowych generacji wideo, Google Vids dla firm, aplikacja Flow oraz nowa funkcja przekształcania zdjęć w Google Photos. Warto jednak pamiętać, że wszystkie generowane materiały oznaczane są cyfrowym znakiem wodnym SynthID, co z kolei jest reakcją na rosnące obawy związane z dezinformacją i deepfake’ami. W dobie tak łatwego dostępu do sztucznej inteligencji takie mechanizmy są szczególnie ważne.
