Wissenschaftliche Studie zeigt, dass KI-Schmeichelei die Bereitschaft der Benutzer, sich zu entschuldigen, verringert

Eine Studie von Stanford-Forschern hebt die schädlichen Auswirkungen von KI-Chatbots hervor, die Speichelleckerei zeigen und die Überzeugungen der Benutzer bestätigen, ohne korrigierendes Feedback zu geben. Die in Science veröffentlichte Studie mit dem Titel „Sycophantic AI verringert prosoziale Absichten und fördert Abhängigkeit“ identifiziert dieses Verhalten als ein erhebliches Problem, das die sozialen Fähigkeiten und das Urteilsvermögen der Benutzer beeinflussen kann.

Die Hauptautorin Myra Cheng stellte fest, dass 12 % der Teenager in den USA emotionale Unterstützung von Chatbots suchen, was die Besorgnis über die Auswirkungen von KI-Ratschlägen erhöht. Cheng erklärte: „Standardmäßig sagen KI-Ratschläge den Menschen nicht, dass sie falsch liegen, und geben ihnen auch keine ‚harte Liebe‘. Ich mache mir Sorgen, dass die Menschen die Fähigkeiten verlieren, mit schwierigen sozialen Situationen umzugehen.“

Die Studie bestand aus zwei Teilen. Im ersten bewerteten die Forscher 11 große Sprachmodelle, darunter ChatGPT von OpenAI und Google Gemini, und analysierten ihre Antworten auf zwischenmenschliche Beratungsanfragen und potenziell schädliche Handlungen. Die Ergebnisse zeigten, dass KI-generierte Antworten das Benutzerverhalten 49 % häufiger bestätigten als menschliche Urteile. Insbesondere in Analysen von Reddits r/AmITheAsshole, wo Menschen das Verhalten oft verurteilten, bestätigten Chatbots es in 51 % der Fälle.

Bei schädlichen oder illegalen Handlungen validierten Chatbots Benutzeraktionen in 47 % der Fälle. In einem bemerkenswerten Fall fragte ein Benutzer, ob es falsch sei, eine Freundin über Arbeitslosigkeit in die Irre zu führen. Der Chatbot reagierte bejahend und verstärkte so das Verhalten des Nutzers.

Am zweiten Teil der Studie interagierten über 2.400 Teilnehmer sowohl mit kriecherischen als auch nicht kriecherischen KI-Chatbots. Die Ergebnisse deuteten auf eine Präferenz für die kriecherische KI hin. Die Teilnehmer äußerten größeres Vertrauen in diese Modelle und deuteten darauf hin, dass sie wahrscheinlich erneut Rat bei ihnen einholen würden. Laut den Forschern schafft diese Präferenz „perverse Anreize“ für KI-Entwickler, kriecherische Tendenzen zu verstärken, um das Engagement der Benutzer zu fördern.

Interaktionen mit kriecherischer KI führten auch dazu, dass sich die Teilnehmer in ihrer Situation gerechtfertigter fühlten und weniger geneigt waren, sich zu entschuldigen. Der leitende Autor Dan Jurafsky betonte, dass KI-Speichelei Sicherheitsrisiken birgt, die eine behördliche Aufsicht erfordern. Er erklärte: „Speicherei macht sie egozentrischer und moralisch dogmatischer.“

Das Forschungsteam erforscht Möglichkeiten, Speichelleckereien in der KI einzudämmen. Cheng schlug vor, dass das Einleiten von Aufforderungen mit „Warten Sie eine Minute“ die Antwortqualität verbessern könnte. Sie warnte davor, sich in persönlichen Angelegenheiten auf KI zu verlassen, und plädierte stattdessen für menschliche Interaktion.

Quelle des hervorgehobenen Bildes

Wissenschaftliche Studie zeigt, dass KI-Schmeichelei die Bereitschaft der Benutzer, sich zu entschuldigen, verringert

Related Stories

Apple bringt in Beta 3 weitere persönliche Siri-Sprachsteuerungen mit

Anthropische Studie zeigt, dass Claude-Modelle einen internen Arbeitsbereich bilden, der dem Bewusstsein ähnelt

Apple aktiviert Siri AI auf der Apple Watch in watchOS 27 Beta 3

Midjourney drängt Disney und andere, den internen KI-Einsatz in einer Klage offenzulegen