Na iOS zadebiutowała właśnie aplikacja, która wykorzystuje potęgę lokalnych modeli Gemma, by zamienić chaotyczny słowotok w profesjonalny tekst. Co najważniejsze, robi to niemal całkowicie offline, dbając o naszą prywatność i szybkość działania, której próżno szukać w rozwiązaniach opartych wyłącznie na chmurze.
Jak w ogóle działa Google AI Edge Eloquent?
Apka ta to przede wszystkim ukłon w stronę użytkowników, którzy cenią sobie bezpieczeństwo danych. Dzięki architekturze „offline-first”, po pobraniu odpowiedniego modelu opartego na architekturze Gemini, całe przetwarzanie mowy odbywa się bezpośrednio na iPhonie. Eloquent nie jest jednak zwykłym dyktafonem z funkcją transkrypcji. Jego głównym zadaniem jest „zasypanie przepaści” między tym, jak naturalnie mówimy, a tym, jak powinien wyglądać profesjonalny dokument.

System inteligentnie filtruje wszelkie „zaśmiecacze” mowy, wyłapuje momenty, w których sami się poprawiamy w trakcie mówienia, i układa tekst w logiczną całość. Jeśli jednak nasze wywody są wyjątkowo skomplikowane lub potrzebujemy najwyższej możliwej jakości, aplikacja oferuje tryb Cloud mode. Wtedy do akcji wkraczają potężniejsze modele Gemini w chmurze, które szlifują tekst do perfekcji, choć wiąże się to już z wysyłką danych na zewnątrz. Coś za coś.
Eloquent oferuje też szereg funkcji dodatkowych, które doceni każdy redaktor czy menedżer:
- Transformacja treści – możemy zamienić długą transkrypcję w listę najważniejszych punktów.
- Zmiana tonu – AI na nasze życzenie zmieni styl wypowiedzi na formalny, skróci go do esencji lub rozbuduje o brakujące łączniki.
- Statystyki pracy – aplikacja mierzy prędkość mówienia (słowa na minutę) i prowadzi statystyki word count, co pomaga monitorować własną efektywność.
- Kontekstowy słownik – możemy ręcznie dodać specyficzny żargon branżowy lub zaimportować nazwiska i słowa kluczowe bezpośrednio ze swojego konta Gmail, by AI nie robiło błędów w nazewnictwie.
Co ciekawe, Eloquent to nie jedyna nowość od Google w App Store. Towarzyszy mu AI Edge Gallery – aplikacja, która jest swoistym poligonem doświadczalnym dla fanów technologii. Pozwala ona na uruchamianie modeli z rodziny Gemma (w tym najnowszych wersji 3n oraz potężnej Gemma 4) całkowicie lokalnie. Użytkownicy mogą tam śledzić proces „myślenia” modelu krok po kroku w czasie rzeczywistym, co daje unikalny wgląd w to, jak AI dochodzi do konkretnych wniosków.
Źródło: Neowin
