Oprogramowanie

Sprawdzili, które AI najbardziej zmyśla. Różnice są diametralne

Nie jest tajemnicą, że wszystkie modele AI do pewnego stopnia zmyślają, co jest określane mianem halucynacji. Który radzi sobie z tym najgorzej? Postanowiono to sprawdzić.

DAMIAN JAROSZEWSKI (NER1O) 25 KWI 2026

Sprawdzili, które AI najbardziej zmyśla. Różnice są diametralne

Dodaj do ulubionych źródeł w Google

Halucynacje sztucznej inteligencji to doskonale znany mechanizm. AI potrafi zmyślać lub przedstawiać błędne informacje i jest przy tym bardzo przekonująca. Firma Legal Guardian Digital postanowiła sprawdzić, które modele radzą sobie pod tym względem najlepiej i najgorzej.

Dalsza część tekstu pod wideo

AI zmyśla na potęgę

Wyniki okazały się zaskakujące. Okazało się, że najczęściej zmyśla Google Gemini. Model ten podawał błędne informacje w aż 32 proc. przypadków, czyli przy co trzecim zapytaniu. NIeco lepiej radzą sobie ChaGPT (30 proc.), Kimi i Microsoft Copilot (27 proc.) oraz Meta AI (25 proc.). Zdecydowanie najlepiej wypadają Perplexity (13 proc.), DeepSeek (14 proc.) oraz Grok (15 proc.).

Wybrane okazje dla Ciebie

Reklama

Smartfon ULEFONE Armor Mini 20T Pro 5G 8/256GB 4.7" 90Hz Czarny

0 zł

~~1799 zł~~ - najniższa cena

Kup teraz 1799 zł

Smartfon ULEFONE Armor 21 8/256GB 6.58" 120Hz Czarny UF-A21 NC/BK

-100 zł

~~1199 zł~~ - najniższa cena

Kup teraz 1099 zł

0 zł

~~289 zł~~ - najniższa cena

Kup teraz 289 zł

Zbadano też spójność i jakość odpowiedzi dużych modeli językowych. Tutaj najlepiej poradził sobie Kimi (4,3 na 5 pkt.). Na kolejnych miejscach znalazły się: Google Gemini (4), Microsoft Copilot (4) oraz ChatGPT (4). Najgorzej wypadły: Meta AI (3,4) oraz Perplexity, Grok, Claude i DeepSeek (wszystkie po 3,5 pkt).

W ogólnym zestawieniu, w którym wzięto pod uwagę procent halucynacji, spójność odpowiedzi, niezawodność działania oraz oceny użytkowników, najlepszym AI okazało się Perplexity z wynikiem 85 pkt na 100 możliwych. Pełne zestawienie to:

Perplexity - 85/100
Grok - 79/100
DeepSeek - 76/100
Kimi - 60/100
Microsoft Copilot - 53/100
ChatGPT - 50/100
Claude - 45/100
Google Gemini - 41/100
Meta AI - 37/100

sztuczna inteligencja ChatGPT duże modele językowe Microsoft Copilot Grok Google Gemini halucynacje AI Meta AI DeepSeek perplexity claude Kimi

Źródła zdjęć: Shutterstock.com

Źródła tekstu: PhoneArena

Zobacz więcej

Oprogramowanie 17 CZE 2026

Spaliła mu się karta graficzna. Sklep umywa ręce

Holandia zaprzecza. Amerykanie opowiadają banialuki

Intel znalazł człowieka od zadań specjalnych. Stawką są miliardy

Valve ma problem. Gracze muszą czekać do 2027 roku

Weekend na działce? Nie rezygnuj ze sportowych emocji

iRobot Roomba - prezentacja nowości na 2026 rok

Olej kaucje. Jimmy ma zestawy wymykające się ustawie

Nie wystarcza Ci zwykły laptop? ASUS ma dla Ciebie rozwiązanie

KNF miażdży mBank. Milionowe kary i poważne zarzuty wobec giganta

PKO BP od dziś z nową opcją. Wystarczy kilka sekund

Przelew zatrzymany w ostatniej chwili. To była decyzja banku

Bank Millennium rozdaje kasę. Na klientów czeka bonus do 700 zł

Dziś największa premiera tygodnia. Apple TV wyciąga niezły hit

Netflix szykuje niezłe fantasy. Łowca duchów czy koreański Wiedźmin?

Play ułatwia telewizję. Nagrywanie serii i logowanie SMS w nowym wydaniu

Disney+ traci ważne funkcje. Płać tyle samo za mniej

Sprawdzili, które AI najbardziej zmyśla. Różnice są diametralne

AI zmyśla na potęgę

Zobacz więcej

Twój smartwatch dostaje nowe życie. Google sypie genialnymi nowościami

Android 17 rusza na Pixelach. Oto najciekawsze nowości

Zaspałeś przez iPhone'a. Apple wreszcie naprawia irytujący błąd

Wyszukiwarka

Menu

Nasze strony