Autor Thema: "I'm afraid I can't do that, Dave" - der LLM und KI Thread  (Gelesen 4101 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

Offline KhornedBeef

  • Titan
  • *********
  • Beiträge: 12.653
  • Username: KhornedBeef
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #50 am: 19.05.2025 | 22:42 »
 In welchem Sinn machen Bezahlkunden das nicht mit?
"For a man with a hammer, all problems start to look like nails. For a man with a sword, there are no problems, only challenges to be met with steel and faith."
Firepower, B&C Forum

Ich vergeige, also bin ich.

"Und Rollenspiel ist wie Pizza: auch schlecht noch recht beliebt." FirstOrkos Rap

Wer Fehler findet...soll sie verdammt nochmal nicht behalten, sondern mir Bescheid sagen, damit ich lernen und es besser machen kann.

Online Maarzan

  • Mythos
  • ********
  • Beiträge: 9.362
  • Username: Maarzan
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #51 am: 19.05.2025 | 23:04 »
Die Interpretation dass die kostenlosen Accounts zum Upgrade auf einen Bezahlaccount einladen sollen, ist übrigens eine Fehleinschätzung. Die kostenlosen Zugänge verfolgen zwei Zwecke:

1. Nutzerzahlen hoch halten. Denn das ist gut fürs Marketing und für Investorenrunden.
2. Daten sammeln. Das machen Bezahlnutzer nämlich nicht mit. Und diese Interaktionsdaten sind halt für die Betreiber immens wertvoll. Und wiegen bei der Kosten/Nutzenabschätzung deutlich schwerer als die Chance, jemanden zum zahlenden Kunden zu machen.

Was sammeln die denn da bzw. was können die lernen, wenn hier z.B. jemand eine Hexkarte füllen lässt oder eien Abenteueridee haben will?
Storytellertraumatisiert und auf der Suche nach einer kuscheligen Selbsthilferunde ...

Offline Haukrinn

  • BÖRK-Ziege
  • Titan
  • *********
  • Jetzt auch mit Bart!
  • Beiträge: 12.157
  • Geschlecht: Männlich
  • Username: haukrinn
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #52 am: 20.05.2025 | 07:47 »
Daten wie Hexkarten aussehen. Deine Hexkarten. Was nützlich sein könnte, wenn mal wieder jemand ne Hexkarte anfordert.
What were you doing at a volcano? - Action geology!

Most people work long, hard hours at jobs they hate that enable them to buy things they don't need to impress people they don't like.

Offline Paßwächter

  • Experienced
  • ***
  • Beiträge: 189
  • Username: Paßwächter
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #53 am: 20.05.2025 | 08:41 »
Und: in welchem Textumfeld hat der Begriff "Hexkarten"(s)einen Platz? Welche Themen begleiten ihn? Welche Begriffe fallen direkt in der Nähe, welche eher in einigen hundert oder tausend "Token" Entfernung?

Online schneeland

  • Administrator
  • Titan
  • *****
  • Cogito ergo possum
  • Beiträge: 14.501
  • Username: schneeland
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #54 am: 25.06.2025 | 14:17 »
Die Diskussion um die Studie, wie sich LLMs auf Textverständnis und Kreativität auswirken habe ich mal in den entsprechenden Thread in Rollenspiel & Gesellschaft verschoben: Link. Bei Bedarf bitte zu diesem Thema dort weiterdiskutieren.
All good things come to those who wait! ... like dual flamethrowers and beer.

Offline Feuersänger

  • Orcjäger
  • Moderator
  • Titan
  • *****
  • Deadly and Absurdly Handsome
  • Beiträge: 35.415
  • Geschlecht: Männlich
  • Username: Feuersänger
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #55 am: 9.12.2025 | 12:27 »
Nach längerer Zeit hier mal wieder ein Bump.

Habe nämlich nach ebenfalls längerer Zeit mal wieder Claude befragt, und dabei ist mir ein signifikanter Unterschied zu cGPT aufgefallen:

Chatty mimt primär den hilfreichen Sekretär, bemüht sich, angeforderte Informationen zu liefern, und schließt seine Antworten meist mit einem weiteren Hilfsangebot ab: "Möchtest du, dass ich dies und das in einer Tabelle zusammenfasse?" oder dergleichen. Ansonsten bleibt es fast immer passiv, mal ganz davon abgesehen dass es generell zu fast allem Ja und Amen sagt was man als Statement hinwirft.

Claude hat zwar ebenfalls diesen Hang zur Speichelleckerei, aber macht eine Sache bedeutend anders: es stellt Rückfragen zur Sache und fragt den User nach dessen Meinung. Wenn es zum Beispiel zu einem diskutierten Problem einen Lösungsansatz liefert, fragt es "would this work? Or does [X] create a [Y] problem?"

Weiss nicht, ob das schon länger so ist, ist mir heute das erste mal aufgefallen.

--

Was wohl prinzipiell auch funktionieren kann: das LLM beauftragen, als Advocatus Diaboli zu agieren, und gezielt Haare in deiner Suppe zu suchen. Das habe ich aber noch nicht probiert. Bislang habe ich lediglich ChatGPT beauftragt, Spekulationen klar als solche zu kennzeichnen, also nicht zu halluzinieren - das klappt so halbwegs.
Was mir aber auch schon aufgefallen ist: zuweilen sitze ich so lange über dem Prompt brütend da, um so klar wie möglich zu fragen und Fehlinterpretationen des LLM auszuschließen, dass ich bei der ganzen Nachdenkerei das Problem schon selbst löse und das LLM gar nicht mehr zum Einsatz kommt.
Der :T:-Sprachführer: Rollenspieler-Jargon

Zitat von: ErikErikson
Thor lootet nicht.

"I blame WotC for brainwashing us into thinking that +2 damage per attack is acceptable for a fighter, while wizards can get away with stopping time and gating in solars."

Kleine Rechtschreibhilfe: Galerie, Standard, tolerant, "seit bei Zeit", tot/Tod, Stegreif, Rückgrat

Online Zed

  • Legend
  • *******
  • Sommerschwede
  • Beiträge: 5.053
  • Geschlecht: Männlich
  • Username: Zed
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #56 am: 9.12.2025 | 13:47 »
Bei Zusammenfassungen, Übersetzungen und Strukturierungen gefällt mir aktuell im Verständnis wie auch in den Ergebnissen Claude am besten von den LLMs, die ich regelmäßig parallel befrage (Gemini; Perplexity pro; DeekSeek; Claude).

Offline Feuersänger

  • Orcjäger
  • Moderator
  • Titan
  • *****
  • Deadly and Absurdly Handsome
  • Beiträge: 35.415
  • Geschlecht: Männlich
  • Username: Feuersänger
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #57 am: 9.12.2025 | 14:17 »
Der Nachteil bei Claude ist halt das sehr niedrige Token-Limit für Free User. Das ist so der Grund warum ich es eher selten verwende.

Gemini liefert schon in der Google-Suche regelmäßig nur kompletten Rotz, Perplexity kenn ich nicht, Deepseek nutze ich bewusst nicht.
Der :T:-Sprachführer: Rollenspieler-Jargon

Zitat von: ErikErikson
Thor lootet nicht.

"I blame WotC for brainwashing us into thinking that +2 damage per attack is acceptable for a fighter, while wizards can get away with stopping time and gating in solars."

Kleine Rechtschreibhilfe: Galerie, Standard, tolerant, "seit bei Zeit", tot/Tod, Stegreif, Rückgrat

Online Zed

  • Legend
  • *******
  • Sommerschwede
  • Beiträge: 5.053
  • Geschlecht: Männlich
  • Username: Zed
Re: "I'm afraid I can't do that, Dave" - der LLM und KI Thread
« Antwort #58 am: 9.12.2025 | 14:42 »
Der Nachteil bei Claude ist halt das sehr niedrige Token-Limit für Free User. Das ist so der Grund warum ich es eher selten verwende.

Gemini liefert schon in der Google-Suche regelmäßig nur kompletten Rotz, Perplexity kenn ich nicht, Deepseek nutze ich bewusst nicht.

Wenn Du Perplexity mit Deinem Paypal-Konto als Zahlungsart verknüpfst, dann erhältst Du Perplexity Pro für ein Jahr gratis - Gegenwert 240€, meine ich.

Du kannst dann außerdem den Comet-Browser von Perplexity nutzen, der einige nette Features hat wie Internetseiten zusammenfassen - gerade für Youtube-Videos sehr praktisch. Wenn man Comet für seine Mails freischaltet, dann soll er sehr hilfreich sein, wichtiges von unwichtigem zu unterscheiden, Subscriptions zu verwalten und Mailantworten vorzuschlagen, habe ich gehört. Das habe ich aber noch nicht gemacht, da habe ich noch eine Privatsphärehemmung...

Offline Feuersänger

  • Orcjäger
  • Moderator
  • Titan
  • *****
  • Deadly and Absurdly Handsome
  • Beiträge: 35.415
  • Geschlecht: Männlich
  • Username: Feuersänger
Es weht ein frischer Wind durch die LLM-Welt: bin auf das Deutsch-Französische Projekt Mistral.ai gestoßen und bin gerade dabei, es auszuprobieren. So auf Anhieb - erst wenige Prompts getestet - würde ich sagen, es funktioniert mindestens so gut wie ChatGPT. Der Chatbot "Le Chat" verspricht fundierte und durch Quellen belegbare Resultate. Man darf gespannt sein!
Vor allem kommt man damit gleich mal von dem ganzen amerikanischen und chinesischen Kram weg und kann europäische Lösungen unterstützen.

https://chat.mistral.ai/
Der :T:-Sprachführer: Rollenspieler-Jargon

Zitat von: ErikErikson
Thor lootet nicht.

"I blame WotC for brainwashing us into thinking that +2 damage per attack is acceptable for a fighter, while wizards can get away with stopping time and gating in solars."

Kleine Rechtschreibhilfe: Galerie, Standard, tolerant, "seit bei Zeit", tot/Tod, Stegreif, Rückgrat

Offline Mithras

  • Famous Hero
  • ******
  • Beiträge: 2.686
  • Geschlecht: Männlich
  • Username: Mithras
Ich nutze Mistral schon seit Anfang 2025 und bin sehr zufrieden, ich habe aber auch keinen Vergleich zu ChatGPT. Allerdings bin ich heilfroh das ich die Werbefalle von ChatGPT umgangen bin. (Kack US Produkt! Buy european!)
Ich habe mit Hârnmaster 1 auch Conan, Warhammer und OSR Abenteuer geleitet.

"Le jeu c'est sérieux!"

Tolkien ist stark überbewertet und seine Bücher nach Der kleine Hobbit furchtbar zäh und langatmig. Das beste was er zustande gebracht hat, war die Vorlage für die Drei besten Fantasyfilme zu liefern, die bisher gedreht wurden.

Ich spiele lieber AD&D statt Pathfinder und Cyberpunk 2020 statt Shadowrun.

Offline sma

  • Famous Hero
  • ******
  • a.k.a. eibaan
  • Beiträge: 2.004
  • Geschlecht: Männlich
  • Username: sma
Mistral gibt es schon lange. Aber auch ihr neustes Modell von diesem Monat ist den Flagship-Modellen hoffnungslos unterlegen. Vergleiche die Benchmarks von Artificial Analysis, die einen guten Überblick über die AI-Welt geben.

Und auch Mistral selbst sieht das. Daher fokussieren sie sich auf kleinere Modelle, die man selbst hosten kann und dann immer noch gut sind, wenn von Nvidia keine modernen KI-Chips (die Blackwell B200er) kaufen darf. Sich nicht von den in den USA gehosteten und von US-Konzernen entwickelten Modellen abhängig machen zu müssen, ist ja ein Wert – gerade auch wenn man sich wie Europa als ehemaliger Verbündeter nicht mehr auf die USA verlassen kann. Nur stehen sie damit natürlich mit chinesischen Openweight-Modellen in Konkurrenz und die sind leider auch fast alle besser.

Dennoch finde ich wichtig, dass das einzige europäische Unternehmen nicht aufgibt.

Witzigerweise sind die größten Anteilseigner von Mistral ASML und Nvidia. Letzteren wirft man ja vor, dass sie durch ihre Investition gerade auch in OpenAI die KI-Bubble am Leben halten, weil sie damit ja den Unternehmen das Geld geben, mit dem sie dann Nvidia-Chips kaufen und so die Aktienkurse künstlich hoch gehalten werden. ASML ist weltweit einzige Hersteller der Belichtungsmaschinen für die KI-Superchips. Während ASML aus den Niederlanden ist, sind die anderen Investoren US-Firmen (u.a. auch Microsoft und A16Z) sowie der Saudische Staatsfond, meine ich.

Wie auch immer, Mistral ist okay, aber kein Vergleich zu Claude Opus 4.5 oder OpenAI GPT 5.2-max.

Besondere beim kreativen Geschichtenschreiben ist es schlecht. Auffällig ist, dass das jedes mal eine Elara oder Elena vorkommt und nur so 3-5 Namen überhaupt. Auch sind Ideen wenig kreativ. Dafür ist Mistral eines der besten Modelle, wenn es um das OCRen von Dokumenten geht. Wenig Halluzinationen. Das neue Gemini 3 Flash im Gegensatz dazu, halluziniert mit 93% bei Dingen, die es nicht weiß. Das ist schlecht für Wissensabfragen! Aber gut für Geschichten. War es bei einem ersten Test allerdings nicht. Zu kurz angebunden. Wie auch immer.

Kimi K2 (von Moonshot AI, einem chinesischen Startup) wäre noch ein Tipp, was Texterzeugung angeht, und ist sogar mit MIT Lizenz noch freier als Mistral mit seiner Apache 2 Lizenz. Hier ein one-shot Beispiel. Es ist aber hauptsächlich auf Englisch und Chinesisch trainiert, nicht so sehr Deutsch.

(Klicke zum Anzeigen/Verstecken)

Übrigens, wenn es um die Privatsphäre geht, kommt es nur darauf an, wo das Modell betrieben wird, nicht wer es erstellt hat. Da sind chinesische Modelle kein Problem. Ein Mistral, das auf Azure läuft, weil Microsoft als Investor dabei ist, ist damit auch nicht besser als ein GPT-5.1, das auf Azure läuft, in beiden Fällen kann die US-Regierung weltweit die Daten abfließen lassen.

Gibt es überhaupt Modelle, die auf von europäischen Firmen auf europäischer Hardware betrieben werden und diese Dienste dann für andere anbieten? Auch der größte Dispatcher, openrouter.ai, ist ja ein US-Unternehmen. Ebenso die Infrastrukturprovider Groq und Cerebras.

(Klicke zum Anzeigen/Verstecken)