Predkosc.pl Artykuły Dlaczego ChatGPT nie umie liczyć? Tajemnice matematycznych potknięć ujawnione

Dlaczego ChatGPT nie umie liczyć? Tajemnice matematycznych potknięć ujawnione

Sztuczna inteligencja pisze wiersze, ale boryka się z matematyką. Dlaczego ChatGPT i inni chatboty nie radzą sobie nawet z podstawowymi obliczeniami? Ujawniamy przyczyny matematycznych potknięć AI, od tokenizacji, która rozbija liczby na niezrozumiałe fragmenty, po statystyczne podejście do nauki, które zawodzi w matematyce.

Dlaczego ChatGPT nie umie liczyć? Tajemnice matematycznych potknięć ujawnione

Sztuczna inteligencja, w tym ChatGPT, potrafi pisać wiersze, komponować muzykę i tłumaczyć teksty. Mimo to często zatrzymuje się na prostych zadaniach matematycznych. Dlaczego chatbot, który radzi sobie z kompleksowymi zadaniami językowymi, nie może poradzić sobie z matematyką na poziomie szkoły podstawowej?

Tokenizacja: Kiedy liczby rozpadają się na części

Jednym z kluczowych problemów jest tokenizacja. Ten proces dzieli dane na mniejsze części, tzw. tokeny. Wyobraź sobie to jak układanie puzzli, gdzie słowa są rozbijane na sylaby. Tokenizator, model sztucznej inteligencji odpowiedzialny za ten proces, jednak nie rozumie znaczenia liczb.

Może się zdarzyć, że liczba 380 będzie postrzegana jako jeden token, podczas gdy 381 jako dwa (38 i 1). Tym samym relacje między cyframi zostają zakłócone, a obliczenie się komplikuje.

Statystyczna maszyna borykająca się z liczbami

Innym powodem matematycznych trudności ChatGPT jest jego statystyczna natura. Chatbot uczy się na podstawie ogromnej ilości przykładów i szuka w nich wzorców. Na przykład nauczy się, że fraza „Szanowny Panie” jest często następowana frazą „zwracamy się do Pana”.

W matematyce jednak to podejście napotyka na problemy. ChatGPT może oszacować, że iloczyn liczb kończących się na 2 będzie kończył się na 4, ale nie radzi sobie z wynikami pośrednimi. Mówiąc prościej, model ChatGPT próbuje zgadnąć wynik na podstawie nauczonych wzorców zamiast przeprowadzić dokładne obliczenie.

Wyzwanie zwane mnożeniem

Badanie przeprowadzone przez Yuntiana Denga z University of Waterloo wykazało, że ChatGPT ma problemy z mnożeniem liczb większych niż czterocyfrowe. Powodem jest fakt, że błąd na jakimkolwiek etapie obliczenia wpływa na wynik końcowy.

Wyobraź sobie to jak efekt domina – jeden błąd uruchamia reakcję łańcuchową i wynik jest zupełnie niepoprawny. Istnieje jednak nadzieja, że ChatGPT poprawi się w przyszłości. Deng i jego koledzy testowali również model o1 od OpenAI, który charakteryzuje się zdolnością do logicznego myślenia.

Ten model osiągnął znacznie lepsze wyniki niż standardowy GPT-4o i potrafił poprawnie rozwiązać nawet mnożenie dziewięciocyfrowych liczb. Model o1 bowiem myśli nad problemem krok po kroku, co pozwala mu osiągnąć dokładniejsze wyniki.

RoboMind to narzędzie edukacyjne, które służy do nauki podstaw programowania za pomocą wirtualnego robota. Wykorzystuje prosty język programowania Robo, który jest odpowiednią opcją dla początkujących. Studenci uczą się dzięki niemu myślenia algorytmicznego poprzez praktyczne zadania, takie jak nawigacja w labiryncie czy manipulacja obiektami.

Sam Altman, CEO OpenAI, ogłosił, że firma już wie, jak stworzyć ogólną sztuczną inteligencję i kieruje się ku rozwojowi superinteligencji. Według jego prognozy może to być rzeczywistością już za kilka lat. Pomimo że obecne systemy AI mają wciąż znaczące braki, Altman wierzy w ich szybkie pokonanie.

Minecraft: Education Edition łączy popularny świat gry z nauką. Dzieci mogą odkrywać programowanie, współpracować przy rozwiązywaniu problemów i uczyć się nowych umiejętności w znanym środowisku pełnym kreatywności. Jak to działa i nadaje się także dla mniejszych dzieci?

Alice to platforma edukacyjna, która umożliwia dzieciom i studentom zgłębianie świata programowania poprzez tworzenie animacji 3D, interaktywnych opowieści i prostych gier. Nadaje się zarówno dla uczniów, jak i studentów na studiach wyższych. Co oferuje i jak działa?

Rząd amerykański rozpoczął śledztwo dotyczące chińskiej firmy TP-Link, która kontroluje 65% rynku routerów. Powodem są obawy o bezpieczeństwo narodowe po ujawnieniu użycia ich urządzeń w atakach ransomware.

OpenAI zakończyła swoją świąteczną akcję „12 dni OpenAI” ogłoszeniem rewolucyjnego modelu o3 i jego mniejszej wersji o3-mini. Nowy model obiecuje znaczne ulepszenia w dziedzinie myślenia i rozwiązywania złożonych zadań. Na razie będzie dostępny tylko dla badaczy bezpieczeństwa.