LLMs arbeiten nicht mit Buchstaben, sondern mit Tokens. Theoretisch könnte man Token=Buchstabe definieren, das wäre aber sehr ineffizient, daher macht man das nicht. Praktisch sind Tokens eher Silben oder Wortteile, also zb „Donners““Tag“ wären dann zwei Tokens. Jeder Token wird durch eine Zahl repräsentiert und dann wird wild gerechnet.
Aber wegen der Tokengeschichte kann man da rechnen wie man will, die Buchstaben kennt das LLM nicht und kann daher damit auch nicht wirklich arbeiten. Daher wird halt ein plausibler Text generiert der halt in diesem Fall nichts mit der korrekten Antwort zu tun hat.
LLMs arbeiten nicht mit Buchstaben, sondern mit Tokens. Theoretisch könnte man Token=Buchstabe definieren, das wäre aber sehr ineffizient, daher macht man das nicht. Praktisch sind Tokens eher Silben oder Wortteile, also zb „Donners““Tag“ wären dann zwei Tokens. Jeder Token wird durch eine Zahl repräsentiert und dann wird wild gerechnet. Aber wegen der Tokengeschichte kann man da rechnen wie man will, die Buchstaben kennt das LLM nicht und kann daher damit auch nicht wirklich arbeiten. Daher wird halt ein plausibler Text generiert der halt in diesem Fall nichts mit der korrekten Antwort zu tun hat.