Kolejnym aspektem wartym uwagi jest strategiczne podejście firmy. Microsoft inwestuje w pięcioletni plan, który ma zapewnić pełną kontrolę nad rozwojem technologii AI. Stawka jest niebagatelna, bo chodzi o dominację w branży wartej setki miliardów dolarów. To nie jest przypadkowa decyzja, ale przemyślana strategia długoterminowa.
Przechodząc do konkretów, MAI-Voice-1 to pierwszy model generowania mowy naturalnej opracowany wyłącznie przez zespoły Microsoftu. Co ciekawe, system potrafi wygenerować minutę audio w mniej niż sekundę, działając na pojedynczym procesorze graficznym. To całkiem imponujące osiągnięcie, zwłaszcza że większość konkurencyjnych rozwiązań wymaga znacznie większych mocy obliczeniowych. Model jest już dostępny do testów w funkcjach Copilot Daily i Podcast, a także w eksperymentalnym środowisku Copilot Labs.
Równie istotne jest to, że MAI-1-preview to pierwszy kompleksowo szkolony model fundacyjny typu mixture-of-experts, który ma konkurować z najlepszymi rozwiązaniami tekstowymi na rynku. Publiczne testy rozpoczęły się na platformie LMArena, gdzie każdy może sprawdzić możliwości modelu. W nadchodzących tygodniach Microsoft planuje wprowadzić go do wybranych zastosowań Copilot, a zaufani testerzy mają już dostęp do API.
Najbardziej interesującym aspektem nowych modeli wydaje się podejście Microsoftu do optymalizacji zasobów. MAI-1-preview był szkolony na około 15 000 procesorów graficznych Nvidia H-100, podczas gdy konkurencyjne rozwiązania wymagają znacznie większej mocy obliczeniowej. Dla porównania, model Grok firmy xAI potrzebował ponad 100 000 takich chipów do szkolenia. Ta różnica wynika ze strategii polegającej na precyzyjnym doborze danych treningowych zamiast stosowania metody brute force. Microsoft eliminuje niepotrzebne tokeny, które nie wnoszą wartości do procesu uczenia, co pozwala tworzyć modele oferujące wysoką jakość przy mniejszych kosztach.
Firma inwestuje również w infrastrukturę nowej generacji, włączając w to operacyjne klastry GB200 i prace nad własnymi chipami AI. To wszystko ma zapewnić jeszcze większą efektywność w przyszłości i uniezależnienie się od zewnętrznych dostawców. Pojawienie się własnych modeli Microsoftu to wyraźny sygnał strategicznej zmiany. Mustafa Suleyman, szef działu AI Microsoftu, nie ukrywa ambicji – jedna z największych firm na świecie musi mieć wewnętrzną ekspertyzę w tworzeniu najsilniejszych modeli.
Pięcioletni plan działania zakłada systematyczne inwestycje kwartał po kwartale, co jest odpowiedzią na rosnące obawy o możliwą bańkę spekulacyjną na rynku AI. Suleyman bagatelizuje potencjalne napięcia z OpenAI, mówiąc o pogłębianiu partnerstwa, ale w praktyce wprowadzenie własnych modeli wysokiej klasy może stworzyć dodatkową konkurencję między dotychczasowymi partnerami. Microsoft wyraźnie chce kontrolować swoje własne losy w wyścigu AI, a nie być zależny od decyzji zewnętrznych firm.
Czytaj też: ChatGPT pomógł wskrzesić stary sprzęt
Nowe modele to dopiero początek większej ofensywy. Microsoft AI ma ambitne plany dotyczące dalszych postępów i orkiestracji wyspecjalizowanych modeli. Firma pracuje nad rozwiązaniami, które będą działać optymalnie na własnych chipach, co może zapewnić dodatkową przewagę konkurencyjną. To strategia długoterminowa, której pierwsze efekty już obserwujemy. Trzeba przyznać, że Microsoft gra ostrożnie, ale konsekwentnie – unika spektakularnych obietnic, skupiając się na realnych, mierzalnych postępach. To podejście budzi pewien sceptycyzm, ale też szacunek dla metodycznego, przemyślanego działania w tak dynamicznie rozwijającej się dziedzinie.
