Oprogramowanie

Google pokazuje TurboQuant. Na papierze wygląda to jak rewolucja

Szybsze działania, mniejsze wymagania co do mocy obliczeniowej i... taka sama dokładność. Brzmi to wręcz zbyt dobrze, a więcej dowiemy się już w kwietniu.

PRZEMYSłAW BANASIAK (YOKAI) 25 MAR 2026

Google pokazuje TurboQuant. Na papierze wygląda to jak rewolucja

Dodaj do ulubionych źródeł w Google

Google pochwaliło się nową techniką kompresji dla dużych modeli językowych. Algorytm TurboQuant ma pozwalać na mocne zmniejszenie zużycia pamięci przez tzw. KV cache, a przy tym nie pogarszać jakości działania modelu. Według zaprezentowanych wyników rozwiązanie potrafi sprowadzić zapis tych danych nawet do 3 bitów bez straty dokładności.

Dalsza część tekstu pod wideo

TurboQuant sprawdza się również w wyszukiwaniu wektorowym

KV cache to jeden z kluczowych elementów LLM-ów. To właśnie tam trafiają wcześniej wyliczone dane, co oszczędza moc obliczeniową przy generowaniu kolejnych tokenów. Problem w tym, że wraz ze wzrostem długości kontekstu taka pamięć zaczyna coraz mocniej obciążać sprzęt. Dotychczasowe metody kompresji pomagały tylko częściowo, bo oprócz samych skompresowanych danych trzeba było przechowywać jeszcze dodatkowe stałe kwantyzacji, które z czasem także zaczynały istotnie zwiększać narzut.

Wybrane okazje dla Ciebie

Reklama

Komputer GMKTEC M6 Ultra R5-7640HS 16GB RAM 512GB SSD Wi-Fi Windows 11 Professional

0 zł

~~2699.99 zł~~ - najniższa cena

Kup teraz 2699.99 zł

Komputer GMKTEC NucBox K17 Ultra 5-226V 16GB RAM 1TB SSD Wi-Fi Windows 11 Professional

0 zł

~~3499 zł~~ - najniższa cena

Kup teraz 3499 zł

Komputer ACER Revo Box RB102-KRK AI R5-340 16GB RAM 512GB SSD Wi-Fi

0 zł

~~3099.99 zł~~ - najniższa cena

Kup teraz 3099.99 zł

TurboQuant ma ten problem omijać. Google zastosowało tu dwuetapowe podejście. Pierwszy krok to PolarQuant, która zamienie klasyczny zapis wektorów w układzie kartezjańskim na współrzędne biegunowe. Pozwala to oddzielić informację o długości wektora od informacji o jego kierunku. Dzięki temu algorytm może pominąć kosztowny etap normalizacji bloków, a jednocześnie uniknąć dodatkowego narzutu pamięciowego wynikającego z przechowywania stałych kwantyzacji.

Drugi etap to 1-bitowa warstwa korekcji oparta na algorytmie Quantized Johnson-Lindenstrauss. Jej zadaniem jest ograniczenie błędu resztkowego powstającego podczas kwantyzacji i zminimalizowanie systematycznych przekłamań w wyliczaniu wyników. Google przekonuje, że dodatkowy koszt działania tej warstwy jest pomijalny, a efekt końcowy pozwala zachować pełną jakość działania modeli nawet przy bardzo agresywnej kompresji.

Firma sprawdziła nowe rozwiązanie na szeregu benchmarków dla długiego kontekstu. Testy prowadzono na modelach Gemma i Mistral. W Needle In A Haystack TurboQuant miał utrzymać idealne wyniki przy co najmniej sześciokrotnym zmniejszeniu zapotrzebowania na pamięć KV. Z kolei w pakiecie LongBench, obejmującym m.in. pytania i odpowiedzi, generowanie kodu oraz streszczanie, nowy algorytm miał dorównywać lub przewyższać bazową metodę KIVI we wszystkich zadaniach.

Google twierdzi też, że TurboQuant dobrze sprawdza się nie tylko w inferencji modeli językowych, ale również w wyszukiwaniu wektorowym. Dodatkową zaletą ma być brak potrzeby trenowania czy dostrajania algorytmu, co otwiera drogę do wdrożeń w środowiskach produkcyjnych. Pełne opracowanie współautorstwa Amira Zandieha i Vahaba Mirrokniego ma zostać zaprezentowany podczas ICLR 2026 w przyszłym miesiącu.

AI Google sztuczna inteligencja Google TurboQuant

Źródła zdjęć: Shutterstock, Google

Źródła tekstu: Google, Tom's Hardware, Oprac. własne

Zobacz więcej

Oprogramowanie 07 LIP 2026

W Action za 64,95 zł. Do tego z ANC i znanego producenta

Przed puszczeniem przelewu, sprawdź jedną rzecz. Wiele osób tego nie robi

Masz taki router? Każdy może się na niego zalogować

Atak na pieniądze Polaków. W tle InPost

Wystarczy 1600 zł i masz telefon marzeń. Z realme 16 5G to możliwe

Soundcore Space 2 – testuję następcę rynkowego hitu. Czy warto wydać 499 zł?

Biznes w XXI wieku: firma notuje wielkie straty, kurs akcji rośnie

Opakowania objęte kaucją można oddać kurierowi. To działa

W mBanku teraz można zyskać do 1000 zł. I to do końca sierpnia

mBank ostrzega. Wysłał do klientów pilną wiadomość

Rząd wyda darmową aplikację. Ułatwi życie Polakom

Bank wydał pilny komunikat. Ważna usługa przestanie działać

To koniec. Apple TV wyemituje finałowy odcinek hitu w tym tygodniu

Fani czekają na ten hitowy serial. Jest nowe zdjęcie kultowej postaci

Netflix szykuje dużą zmianę. To już nie będą tylko filmy i seriale

Polsat Box Go dopieszcza kibiców. Lato będzie pełne emocji

Google pokazuje TurboQuant. Na papierze wygląda to jak rewolucja

TurboQuant sprawdza się również w wyszukiwaniu wektorowym

Zobacz więcej

Android Auto irytuje kierowców. Mają powód

Zmęczony udowadnianiem, że nie jesteś robotem? Google ma na to pomysł

Masowo zwalniano ludzi przez AI. Teraz przyzno, że coś poszło nie tak

Wyszukiwarka

Menu

Nasze strony