OpenAI kontratakuje. Nowy model miażdży konkurencję

Firma OpenAI odkryła karty i oficjalnie zaprezentowała światu model GPT-5.2. Nowa sztuczna inteligencja ma być odpowiedzią na rosnącą konkurencję i prawdziwym przełomem w pracy zawodowej.

Marian Szutiak (msnet)
0
Udostępnij na fb
Udostępnij na X
OpenAI kontratakuje. Nowy model miażdży konkurencję

Debiutuje model językowy GPT-5.2

Wyścig zbrojeń w świecie AI nie zwalnia ani na chwilę. OpenAI pokazał właśnie model GPT-5.2, który ma zostawić rywali w tyle. Twórcy rozwiązania ChatGPT obiecują, że ich nowe dziecko poradzi sobie z zadaniami, które do tej pory wymagały sztabu ludzi.

Dalsza część tekstu pod wideo

Myśli jak ekspert

Sercem nowej aktualizacji jest wariant GPT-5.2 Thinking. OpenAI chwali się, że to pierwszy model, który w testach dorównuje ludzkim ekspertom lub ich przewyższa. Firma oparła te twierdzenia na nowym benchmarku o nazwie GDPval. Sprawdza on zdolności AI w 44 różnych zawodach.

  GPT‑5.2 Thinking GPT‑5.1 Thinking
GDPval (wygrane lub remisy)
Zadania związane z pracą opartą na wiedzy
70,9% 38,8% (GPT‑5)
SWE-Bench Pro (public)
Inżynieria oprogramowania
55,6% 50,8%
SWE-bench Verified
Inżynieria oprogramowania
80,0% 76,3%
GPQA Diamond (bez narzędzi)
Pytania naukowe
92,4% 88,1%
Rozumowanie CharXiv (z Python)
Pytania dotyczące wykresów naukowych
88,7% 80,3%
HMMT (luty 2025)
Turniej matematyczny
99,4% 96,3%
FrontierMath (Poziom 1–3)
Zaawansowana matematyka
40,3% 31,0%
ARC-AGI-1 (Verified)
Abstrakcyjne rozumowanie
86,2% 72,8%
ARC-AGI-2 (Verified)
Abstrakcyjne rozumowanie
52,9% 17,6%
Pokaż więcej

Wyniki robią wrażenie. GPT-5.2 Thinking wygrywa lub remisuje z czołowymi specjalistami w aż 70,9% przypadków. Nie chodzi tu tylko o pisanie wierszy. Model ma świetnie radzić sobie z tworzeniem skomplikowanych prezentacji, arkuszy kalkulacyjnych i zarządzaniem wieloetapowymi projektami. To narzędzie ma realnie zarabiać na siebie w firmach.

Programista na pełen etat

Dobre wieści płyną też dla programistów. GPT-5.2 znacznie lepiej radzi sobie z kodowaniem niż jego poprzednicy. W teście SWE-Bench Pro, który symuluje prawdziwą inżynierię oprogramowania, model osiągnął wynik 55,6%. To nowy rekord w branży.

OpenAI kontratakuje. Nowy model miażdży konkurencję

Szczególnie duży skok jakościowy widać w tworzeniu interfejsów (front-end). Nowy GPT potrafi budować złożone UI, w tym elementy 3D. Testerzy chwalą go za to, że staje się wreszcie użytecznym partnerem w codziennej pracy nad kodem, a nie tylko generatorem prostych skryptów.

Trzy wersje dla każdego

OpenAI nie ogranicza się do jednego modelu. Do użytkowników trafiają trzy warianty:

  • GPT-5.2 Instant – szybki i lekki, do prostych zadań,
  • GPT-5.2 Thinking – potężny model do głębokiej analizy i "myślenia",
  • GPT-5.2 Pro – najbardziej zaawansowana wersja dla wymagających.

Nowe modele są już wdrażane do ChatGPT dla użytkowników płatnych planów. Programiści mogą też korzystać z nich poprzez API.

Wygląda na to, że OpenAI chce szybko odzyskać palmę pierwszeństwa i pokazać firmie Google, kto tu rządzi. Więcej informacji o GPT-5.2 znajdziesz pod tym adresem.