ich🦾🤖iel

stardustpathsofglory@lemmy.world · 2 months ago

ich🦾🤖iel

A_norny_mousse@piefed.zip · 2 months ago

😁

Und dann kommen immer wieder Leute die uns erklären warum LLMs Schwierigkeiten mit sowas haben, als wenn das dadurch besser würde.

aaaaaaaaargh@feddit.org · 2 months ago

Ist es definitiv. Wenn man weiß, wieso etwas nicht funktioniert, dann kann man es versuchen zu reparieren und das wird auch geschehen. KI nervt und ich hasse es, aber ich glaube, wir müssen uns damit leider abfinden.

SkavarSharraddas@gehirneimer.de · 2 months ago

Kommt drauf an ob prinzipbedingtes Problem ist oder nicht, bei ersteren kann man nur versuchen die “KI” zu überreden nicht die Antworten zu geben die man nicht haben will (“don’t talk about goblins”) oder für Einzelfälle die richtige Antwort vorgeben (jede virale falsche Antwort wie “how many r in strawberry” die dann richtig beantwortet wird, aber keine generelle Lösung für andere Fragen der gleichen Klasse bietet).

A_norny_mousse@piefed.zip · 2 months ago

🔔🔔🔔

Anivia@feddit.org · edit-2 1 month ago

oder für Einzelfälle die richtige Antwort vorgeben (jede virale falsche Antwort wie “how many r in strawberry” die dann richtig beantwortet wird, aber keine generelle Lösung für andere Fragen der gleichen Klasse bietet).

Ne, da hast du ein schlechtes Beispiel gewählt, denn das Problem taucht nur bei “gewöhnlichen” LLMs auf, nicht bei reasoning Modellen. Für das Beispiel muss man also nicht für den Einzelfall die Lösung vorgeben, reasoning Modelle haben mit der Frage keine Probleme

Auch OPs Beispiel wird nur von gewöhnlichen LLMs falsch beantwortet, reasoning Modelle beantworten die Frage richtig:

FUsername@feddit.org · 1 month ago

Na toll, ein Klugscheißer-LLM!

Randelung@lemmy.world · 2 months ago

Nein nein, du hast es nur falsch verwendet! Wenn du fünf weitere LLMs mit folgendem Satz als Workflow einstellst, sinkt die Chance eines Fehlers um 2%!

Wie Artikel von Effizienz sprechen, ist mir schleierhaft. Du brauchst ein ganzes Team der Bullshitmaschinerie in der Hoffnung, einer davon produziert Shakespeare.

fizzgig@feddit.org · 2 months ago

Jetzt will ich wissen, weshalb die damit Probleme haben! :D

jgjl@discuss.tchncs.de · 2 months ago

LLMs arbeiten nicht mit Buchstaben, sondern mit Tokens. Theoretisch könnte man Token=Buchstabe definieren, das wäre aber sehr ineffizient, daher macht man das nicht. Praktisch sind Tokens eher Silben oder Wortteile, also zb „Donners““Tag“ wären dann zwei Tokens. Jeder Token wird durch eine Zahl repräsentiert und dann wird wild gerechnet. Aber wegen der Tokengeschichte kann man da rechnen wie man will, die Buchstaben kennt das LLM nicht und kann daher damit auch nicht wirklich arbeiten. Daher wird halt ein plausibler Text generiert der halt in diesem Fall nichts mit der korrekten Antwort zu tun hat.

SkavarSharraddas@gehirneimer.de · 2 months ago

Was LLMs ausgeben ist nicht die Antwort auf die Frage “Welche Wochentage haben den Buchstaben T?” sondern “Wie könnte eine Antwort auf die Frage ‘Welche Wochentage haben den Buchstaben T?’ aussehen?”

Man kann dann noch Details rumerklären wie dass die mit Tokens arbeiten und keine Wörter oder Buchstaben kennen, aber das grundsätzliche Problem ist dass hinter der Ausgabe keine echte Intelligenz steckt, sondern Statistik¹ beruhend auf dem Trainingsmaterial die durch kompetent wirkende Sprachproduktion intelligent wirkt.

¹ Sehr komplexe Statistik, und mehr Ebenen von Komplexität drüber die versuchen die offensichtlichen Probleme zu kaschieren.

Randelung@lemmy.world · 2 months ago

deleted by creator