Nazwa tego modelu SI to oczywiście nawiązanie do braci Lumiere, którym zawdzięczamy rozwój kinematografii. I muszę przyznać, że została dobrana bardzo adekwatnie, ponieważ dzięki tej SI każdy będzie mógł być reżyserem, a co więcej – również twórcą postaci występujących w danym nagraniu.
Lumiere czyli wideo z tekstu lub grafiki
Technologia generowania obrazów rozwinęła się błyskawicznie, dając podstawę do tworzenia bardziej zaawansowanych modeli SI. Było tylko kwestią czasu, kiedy pojawią się wyspecjalizowane w tworzeniu ruchomych obrazków, czyli filmów i nagrań wideo. Mieliśmy już kilka prób, jednak Lumiere wyznacza nowe standardy. Model stworzony przez Google’a potrafi stworzyć realistyczne, różnorodne i działające płynnie animacje zarówno z promptów tekstowych, jak i grafik. Co więcej – w przypadku statycznych grafik może dodać animację tylko do wybranego obszaru, tworząc bardzo ciekawe efekty.
Jak to działa? W prosty sposób – piszesz, co chcesz zobaczyć lub w jaki sposób ma zostać przerobiona podsunięta przez Ciebie grafika i gotowe. Lumiere wykorzystuje architekturę nazwaną mało chwytliwie “Space-Time U-Net”, która syntetyzuje poszczególne ramki obrazu i łączy je w płynną całość. Umożliwia również stylizacje i tworzenie wideo w rozmaitych stylach. A jako że obraz wart więcej niż tysiąc słów, obejrzyj poniższą demonstrację możliwości Lumiere.
Czytaj też: Apple nie chce być gorsze i pracuje nad swoim SI. Idzie jednak inną drogą niż konkurencja
Jak podaje Google, póki co możliwe jest tworzenie materiałów wideo w niskich rozdzielczościach, maksymalnie 1024×1024 px i nie dłuższych niż 5 sekund. Oczywiście możemy spodziewać się zmian na lepsze w bliżej nieokreślonej przyszłości. Lumiere szkolony na potężnym zbiorze 30 milionów klipów wideo, z których wszystkie zostały opisane tekstowo. Aczkolwiek ich pochodzenie jest nieznane, a więc można podejrzewać, że nie do końca były przestrzegane prawa autorskie.
Google przewiduje, że udostępnienie SI generujących materiały wideo będzie miało wpływ na społeczeństwo. Z pewnością, aczkolwiek czy zły, czy dobry – tego nie podano. Udostępnienie takiego narzędzie otwiera bardzo liczne możliwości, a jak skorzystają z niego ludzie, to już temat na obszerny esej.