ChatGPT, Gemini und andere KI-Chatbots haben einen Test für Achtklässler erhalten, sie alle scheiterten an einer Aufgabe

Ein User hat verschiedenen Chatbots einen Mathe-Test für Achtklässler vorgelegt. Alle verzweifelten an der gleichen Aufgabe.

Was sind Chatbots? Chatbots sind mittels künstlicher Intelligenz betriebene Sprachmodelle verschiedener Unternehmen, die entwickelt und trainiert wurden, um Aufgaben wie das Generieren von Texten oder die Beantwortung von Fragen zu erledigen. Sie sind darauf ausgelegt, mittels Text- oder Sprach-Chat menschenähnliche Unterhaltungen mit dem Nutzer zu führen.

Das von OpenAI betriebene Sprachmodell ChatGPT war sozusagen der Vorreiter des Chatbots. Inzwischen gibt es viele verschiedene KI-Modelle von unterschiedlichen Unternehmen, darunter Googles Gemini, DeepSeek, Claude oder Perplexitiy. Es gibt auch einige kostenlose Alternativen zu ChatGPT.

„Wir haben ein Monster geschaffen“ – Ein spanisches Model verdient bis zu 10.000 Euro im Monat, dabei ist sie nicht echt


Autoplay

Was war das für ein Test? Ein polnischer Reddit-Nutzer hat verschiedenen KI-Chatbots einen Mathe-Test für Achtklässler vorgelegt und die künstliche Intelligenz die einzelnen Aufgaben beantworten lassen (via Reddit).

Getestet wurden die Modelle OpenAI o3, Gemini 2.5 Pro und Claude Sonnet 4. Insgesamt sollten die Chatbots 15 Fragen lösen. Für die Lösung der Aufgaben erhielten sie von dem Nutzer allerdings keine weiteren Anweisungen oder Lösungsansätze.

Der Nutzer erklärte zudem, dass es sich bei den Aufgaben nicht um Fragen handele, die in der Vergangenheit bereits zum Lernen der KI-Modelle genutzt werden konnten, da diese Aufgaben erst vor Kurzem öffentlich gemacht wurden. Die genutzte Gemini-Version sei beispielsweise auf einem älteren Stand.

So lief der Test: Das Modell von OpenAI sowie das von Gemini beantworteten 14 von 15 Fragen richtig, scheiterten jedoch beide an Frage 12. Das Modell von Claude hatte sogar nur 12 von 15 Fragen richtig, aber der Nutzer betonte, dass er keinen Zugang zum stärksten Modell von Claude habe. Das stärkere Modell hätte gegebenenfalls besser abgeschnitten.

Mehr zum Thema

1
70 % aller Gamer auf Steam nutzen Grafikkarten eines bestimmten Herstellers, jetzt gelang dem Unternehmen etwas, das nicht mal Microsoft und Apple schafften

von Dariusz Müller

2
Ein Experte sagt: Steam hat dank kaufwütiger Gamer ein Problem gelöst, mit dem Netflix bis heute kämpft

von Christoph Waldboth

3
4-Tage-Woche statt Kündigungen: KI macht Unternehmen viel produktiver, Politiker fordert, dass Angestellte davon profitieren

von Karsten Scholz

Welche Frage beantworteten die Chatbots falsch? In der Aufgabenstellung ist eine Zahlenachse abgebildet, auf der die Punkte A, B und C markiert sind. Zudem ist die Strecke AC in 6 gleich große Teile geteilt.

Außerdem sehen die Schüler auf der Zahlenachse die Koordinaten 56 und 83. Anschließend müssen sie beurteilen, ob die 2 folgenden Aussagen richtig oder falsch sind:

Die Koordinate des Punktes C ist eine gerade Zahl.

Die Koordinate des Punktes B ist eine Zahl kleiner als 74.

Was war der Fehler? Für die Lösung der Aufgabe müssen die Schüler herausfinden, wie lang ein Abschnitt auf der Achse ist. Zwischen den Koordinaten 83 und 56 liegen drei Abschnitte. Die Gesamtstrecke zwischen 56 und 83 besteht aus 27 Einheiten. Daraus kann man schließen, dass jeder Abschnitt 9 Einheiten groß ist.

Anschließend lassen sich die Schnittpunkte der Achse sowie die Koordinaten des Punktes C berechnen. Die Lösung ist: Die erste Aussage ist falsch, da der Punkt C auf Koordinate 101 liegt und das eine ungerade Zahl ist, und die zweite Aussage ist richtig, weil Punkt B auf der Achse links von der Koordinate 74 ist.

Ein Screenshot des Reddit-Nutzers zeigt, dass ChatGPT annahm, der Punkt B sei auf der Koordinate 74, dieser liegt jedoch etwas versetzt links daneben. Es schlussfolgerte demnach falsch, dass der Punkt B nicht kleiner als 74 ist, sondern gleich groß. Wir haben testweise Gemini die Aufgabe vorgelegt und Gemini machte exakt den gleichen Fehler.

Der Beitrag ChatGPT, Gemini und andere KI-Chatbots haben einen Test für Achtklässler erhalten, sie alle scheiterten an einer Aufgabe erschien zuerst auf Mein-MMO.

Leave a Reply

Your email address will not be published. Required fields are marked *