Medien & Phantastik > Multimedia - Software & Betriebsysteme

"I'm afraid I can't do that, Dave" - der LLM und KI Thread

<< < (16/18) > >>

gilborn:
Danke!

Ja, auf dem Trichter bin ich auch, die Gebühr kann man deutlich schlechter anlegen.

Ich werde einfach mal mit einem von den dreien anfangen...

Feuersänger:
Gemini mischt sich ja schon immer ungefragt bei jeder Google-Suche ein, und rotzt dabei auch regelmäßig einen so unGLAUBlichen HANEbüchenen SCHWACHsinn raus, dass ich nie und nimmer auf die Idee käme, diesen Bot gezielt zu irgendetwas zu befragen, gleich 100.000mal nicht wenn es um Geld geht. Ich kann da auch gerne mal ein paar Screenshots raussuchen, die ich mir von Extra-super-sonder-bekloppten Antworten gemacht habe.

Hier Beweisstück A:
selbsterklärend -- ich suchte nach Anagrammen zu Farbwörtern. "Silber ist ein Anagramm von Silber" hat zwar Lisa Simpson / Jeremy Irons Vibes, ist aber ansonsten noch das Einzige auf der Liste was irgendeinen Sinn macht.


(okay, ein paar davon ergeben auf Englisch Sinn, zB blue / lube, aber die KI sollte da auch selber merken, dass sie sowas nicht übersetzen kann.)

Beweisstück B:


Das hier war ein bewusster Foil -- ich habe Google nach der Bedeutung einer "Redewendung" befragt, die es in Wahrheit gar nicht gibt. Statt dies zu erkennen ("Das ist in keiner mir bekannten Sprache eine Redewendung") oder ihr Unwissen zuzugeben, halluziniert sie halt einfach irgendwas.
Viel Spaß dabei, dir auf Basis dieser Expertise ein Haus zu kaufen.  >;D

gilborn:
Na ja, wenn man Angebote vergleicht, kann man sich die Unterschiede anzeigen lassen, dann sollte man es natürlich verifizieren.
Dafür scheint es mir grundsätzlich ein geeinetes Werkzeug zu sein.

Ich lasse aber nicht die KI entscheiden, welches ich nehme...

sma:
Ich habe das Gefühl, Feuersänger, du willst KI einfach scheiße finden.

Gebe ich "Bitte zeig mir Anagramme für Farben." im KI-Modus von Google ein:

Die Klassiker:
Rot ➔ Tor (oder Ort)
Blau ➔ Laub
Braun ➔ Urban
Beige ➔ Biege (von biegen oder die Kurve)
Orange ➔ Organe (oder Onager, ein Wildesel/Wurfmaschine)
Magenta ➔ Magnate (Mehrzahl von Magnat)
Eisgrau ➔ Ausgeier (jemand, der etwas gierig betrachtet)
Rubin ➔ Unrib (seltenes Wort für "unreif" in regionalen Varianten)

sowie

Farbe ➔ Faber (lateinisch für „Schmied“ oder „Handwerker“, bekannt durch den Schreibwarenhersteller Faber-Castell)

Es sollte außerdem doch mittlerweile klar sein und niemanden verwundern, dass Halluzinationen normales Verhalten einer KI sind. Das sind KEINE Datenbanken. KIs sind NICHT-deterministische Assoziationsmaschinen. Deine Anklage ist ungefähr so schlüssig wie der Vorwurf "in meinem Brockhaus-Lexikon stehen gar nicht die aktuellen Nachrichten der Tagesschau, was für ein Scheißbuch".

Ich weiß auch nicht, was du mit deiner KI machst, weil du ja nie die Prompts nennt, aber wenn ich "Bitte erkläre mir das Sprichwort 'Juggling fish at full moon'" bei Gemini 3 Pro eingebe, kommt:

Das Sprichwort "Juggling fish at full moon" ist im Englischen oder Deutschen kein gängiges oder allgemein bekanntes Sprichwort. Es gibt keine direkten Entsprechungen oder Erklärungen dafür in den üblichen Sammlungen von Sprichwörtern und Redewendungen.

Danach diskutiert die KI noch was es bedeuten könnte, wenn es existieren würde und endet dann damit:

Im Wesentlichen würde es die Vorstellung vermitteln, etwas völlig Lächerliches und zum Scheitern Verurteiltes zu versuchen.

Und ich finde, dass beschreibt eigentlich recht gut, was du zu beweisen versuchst :)

PS: Auch GPT 5.2 Thinking erklärt mir, dass das Sprichwort nicht existiert, komm aber zu einer ähnlich vermuteten Bedeutung wie Gemini und weist mich anschließend darauf hin, dass es mit 水中捞月 / 海底捞月 ein ähnliches Sprichwort im Chinesischen gibt.


Texte zusammenzufassen ist übrigens ein anderes Anwendungsfeld als Q&A und das Risiko von Halluzinationen ist hier deutlich geringer, weil hier der Kontext größer ist. Ganz einfach (und ein bisschen falsch) ausgedrückt: Erstes ist eine Aufgabe des Weglassens, letztes eine Aufgabe des Hinzufügens. Und dabei sind Fehler wahrscheinlicher.

Feuersänger:

--- Zitat ---Ich habe das Gefühl, Feuersänger, du willst KI einfach scheiße finden.
--- Ende Zitat ---

Was soll denn jetzt diese schwachsinnige Unterstellung?

Der Prompt im ersten Fall war einfach "Anagramme für Farben", viel einfacher als das geht es wohl nicht, im zweiten halt die Frage nach der Bedeutung der vermeintlichen Redewendung, einfach um zu sehen ob sie erkennt dass es das nicht gibt. Kann ich ja auch nix dafür, dass es bei mir nur diesen Müll ausgegeben hat -- besser als mit diesen Screenshots kann ich es dir auch nicht beweisen, dass Gemini das ausgespuckt hat.

Übrigens hat Gemini auch in der Vergangenheit schon (nicht mir, aber dokumentiert) empfohlen, Nudeln in Benzin zu kochen und ähnliche Späße.



ChatGPT ist da übrigens insgesamt ein gutes Stück besser; da habe ich auch schon solche Foils ausprobiert, und meistens hat es diese erkannt. Und ja, ich teste das bewusst und gezielt, damit ich einen Eindruck davon bekomme, wie sehr ich mich auf Antworten verlassen kann wenn ich es mal nicht schon im vorhinein selber weiß.

cGPT verwende ich recht viel, insbesondere bei der Entwicklung meines Redshift-Settings, und diese Aufgaben kommen seinen Fähigkeiten meist ganz gut entgegen -- da, wo es um eine Kombination aus enzyklopädischem Wissen und Rechenarbeit geht. _Manchmal_ weist es mich auch tatsächlich (meist so ganz non-chalant und en-passant) auf Dinge hin, die mir bis dahin nicht bewusst waren.
Manchmal kommt cGPT auch ins Schwimmen, ohne zuzugeben dass es sich nicht mehr richtig auskennt, aber mittlerweile habe ich da ein ganz gutes Gespür dafür entwickelt, anhand der Formulierungen, Syntax und anderen Hinweisen zu erkennen wenn es soweit ist.

P.S.: und natürlich lernt die KI auch mit der Zeit aus ihren Fehlern. Ich hatte zB dieses Farbending vor einigen Wochen gefragt und das Fisch jonglieren noch früher; in der Zwischenzeit wurden diese Anfragen vermutlich ausgewertet und die Ausgaben daraufhin verbessert. Wenn du heute die Benzin-Frage stellst kriegst du auch nicht mehr den Vorschlag, Spaghetti darin zu kochen.

Navigation

[0] Themen-Index

[#] Nächste Seite

[*] Vorherige Sete

Zur normalen Ansicht wechseln