OpenAI ogłasza GPT-4o. Czyli głos, obraz i tekst na jeszcze lepszym poziomie

OpenAI cały czas trenuje swoje modele językowe, a najnowszy to oczywiście ulepszenia w stosunku do poprzednika. Największą zmianą na lepsze jest znaczne podniesienie możliwości głosowych, czyli komunikacji tym sposobem pomiędzy SI a użytkownikiem. A więc GPT-4o to najbardziej jak dotąd rozgadany model.
GPT-4o
GPT-4o

Wcześniej ograniczony do płatnych subskrypcji, teraz GPT-4o oferuje użytkownikom bezpłatny dostęp do takich funkcji, jak analiza danych i kodu, narzędzi do przetwarzania obrazu oraz tłumaczeń językowe w czasie rzeczywistym. OpenAI ujawniło także dedykowaną aplikację desktopową.

GPT-4o to nowe funkcje bezpłatnej i płatnej wersji

Kluczową cechą GPT-4o jest ulepszona funkcjonalność mowy na żywo. W przeciwieństwie do wcześniejszych modeli, GPT-4o może bezpośrednio przetwarzać wprowadzaną mowę. Pozwala to na bardziej naturalne i interaktywne rozmowy z AI. Dzięki temu będzie można np. zażądać analizy danych i stworzenia wykresu lub słownego podsumowania najważniejszych elementów. Albo pokazać zdjęcie menu w innym języku i nakazać SI przetłumaczenie, dowiedzieć się o historii danej potrawy oraz rekomendacjach do jej spożycia (np. duża ilość białka).

Płatna subskrypcja (czyli ChatGPT Plus) nadal oferuje korzyści. Płatni użytkownicy otrzymują pięciokrotny wzrost dziennej liczby żądań GPT-4o, mogą także przyspieszyć przetwarzanie i uzyskać szybszy dostęp do przyszłych, zaawansowanych funkcji. Jak podaje OpenAI, GPT-4o wykracza poza rozmowę, demonstrując możliwości rozwiązywania problemów i analizy. Model może rozwiązywać problemy matematyczne krok po kroku, analizować kod, interpretować wykresy i tłumaczyć języki w czasie rzeczywistym. Dodatkowo może generować różne style wokalne.

GPT-4o

Czytaj też: GPT-5 w drodze. Co przyniesie nam nowa wersja chatbota od OpenAI?

Aplikacja desktopowa umożliwia korzystanie z GPT-4o na komputerach z systemami Windows i macOS. Jej zastosowanie umożliwia m.in. stworzenie systemu przepływu dokumentów oraz danych, usprawniając pracę oraz działania prywatne. A OpenAI zapowiada kolejne możliwości związane z dźwiękiem w bliskiej przyszłości.