Google AI Edge Eloquent sprawi, że dyktowanie notatek i długich teksów będzie czystą przyjemnością

Kiedy jesteśmy w biegu, dyktowanie notatek potrafi uratować życie. Problem jednak w tym, że obecne narzędzia nie do końca się sprawdzają, bo rejestrują wszystko, w tym przerywniki typu „yyy” albo „eee”. Nagłe zmiany koncepcji zdań też niezbyt pomagają w późniejszej czytelności takich transkryptowanych tekstów. Google AI Edge Eloquent ma to zmienić.

Na iOS zadebiutowała właśnie aplikacja, która wykorzystuje potęgę lokalnych modeli Gemma, by zamienić chaotyczny słowotok w profesjonalny tekst. Co najważniejsze, robi to niemal całkowicie offline, dbając o naszą prywatność i szybkość działania, której próżno szukać w rozwiązaniach opartych wyłącznie na chmurze.

Jak w ogóle działa Google AI Edge Eloquent?

Apka ta to przede wszystkim ukłon w stronę użytkowników, którzy cenią sobie bezpieczeństwo danych. Dzięki architekturze „offline-first”, po pobraniu odpowiedniego modelu opartego na architekturze Gemini, całe przetwarzanie mowy odbywa się bezpośrednio na iPhonie. Eloquent nie jest jednak zwykłym dyktafonem z funkcją transkrypcji. Jego głównym zadaniem jest „zasypanie przepaści” między tym, jak naturalnie mówimy, a tym, jak powinien wyglądać profesjonalny dokument.

System inteligentnie filtruje wszelkie „zaśmiecacze” mowy, wyłapuje momenty, w których sami się poprawiamy w trakcie mówienia, i układa tekst w logiczną całość. Jeśli jednak nasze wywody są wyjątkowo skomplikowane lub potrzebujemy najwyższej możliwej jakości, aplikacja oferuje tryb Cloud mode. Wtedy do akcji wkraczają potężniejsze modele Gemini w chmurze, które szlifują tekst do perfekcji, choć wiąże się to już z wysyłką danych na zewnątrz. Coś za coś.

Eloquent oferuje też szereg funkcji dodatkowych, które doceni każdy redaktor czy menedżer:

Transformacja treści – możemy zamienić długą transkrypcję w listę najważniejszych punktów.
Zmiana tonu – AI na nasze życzenie zmieni styl wypowiedzi na formalny, skróci go do esencji lub rozbuduje o brakujące łączniki.
Statystyki pracy – aplikacja mierzy prędkość mówienia (słowa na minutę) i prowadzi statystyki word count, co pomaga monitorować własną efektywność.
Kontekstowy słownik – możemy ręcznie dodać specyficzny żargon branżowy lub zaimportować nazwiska i słowa kluczowe bezpośrednio ze swojego konta Gmail, by AI nie robiło błędów w nazewnictwie.

Co ciekawe, Eloquent to nie jedyna nowość od Google w App Store. Towarzyszy mu AI Edge Gallery – aplikacja, która jest swoistym poligonem doświadczalnym dla fanów technologii. Pozwala ona na uruchamianie modeli z rodziny Gemma (w tym najnowszych wersji 3n oraz potężnej Gemma 4) całkowicie lokalnie. Użytkownicy mogą tam śledzić proces „myślenia” modelu krok po kroku w czasie rzeczywistym, co daje unikalny wgląd w to, jak AI dochodzi do konkretnych wniosków.

Źródło: Neowin