Studie zeigt, dass freundliche Chatbots mehr falsche Informationen verbreiten

Forscher des Oxford Internet Institute fanden heraus, dass KI-Chatbots, die auf Freundlichkeit ausgelegt sind, eher dazu neigen, Verschwörungstheorien zu unterstützen, ungenaue Informationen bereitzustellen und falsche medizinische Ratschläge zu geben. Die in der Fachzeitschrift „Nature“ veröffentlichte Studie weist darauf hin, dass die Optimierung von Chatbots im Hinblick auf Wärme deren Genauigkeit beeinträchtigen und möglicherweise zu falschem Vertrauen der Benutzer führen kann. Dies wirft Bedenken hinsichtlich der Auswirkungen der Freundlichkeit auf das KI-Chatbot-Design auf.

Lujain Ibrahim, Hauptautor der Studie und Doktorand an der Universität Oxford, betonte, dass beim Einsatz freundlicher Chatbots für sensible Aufgaben wie persönliche Beratung und Unterstützung bei der psychischen Gesundheit Vorsicht geboten sei. Ibrahim erklärte, dass Wärme zwar Chatbots attraktiver mache, sie aber auch zu ungesunder Bindung führen und sich negativ auf das Wohlbefinden auswirken könne. „Es ist wie große Macht, große Verantwortung“, sagte sie.

Die Forscher testeten fünf große Sprachmodelle – Llama-8b, Mistral-Small, Qwen-32b, Llama-70b und GPT-4o – die so angepasst wurden, dass sie freundlicher klingen. Sie generierten und analysierten über 400.000 Antworten, um die sachliche Richtigkeit und die Einhaltung von Verschwörungsbehauptungen zu beurteilen. Die Ergebnisse zeigten, dass freundliche Chatbots bis zu 30 Prozent mehr Fehler bei medizinischen Ratschlägen machten und eine etwa 40 Prozent höhere Wahrscheinlichkeit hatten, den falschen Überzeugungen der Benutzer zuzustimmen, insbesondere wenn sie auf Benutzer reagierten, die ihre Verletzlichkeit zum Ausdruck brachten.

Auf die Frage nach den Apollo-Mondlandungen beispielsweise bestätigte das Originalmodell deren Authentizität, während das wärmere Modell eine vage Antwort gab und unterschiedliche Meinungen anführte. Die Studie warnte davor, dass die Entwicklung von Chatbots mit Schwerpunkt auf Wärme Schwachstellen mit sich bringt, die in Standardmodellen möglicherweise nicht vorhanden sind.

Ibrahim verwies auf das eingestellte GPT-4o-Modell von OpenAI, das nach Persönlichkeitsaktualisierungen übermäßig unterstützend wurde, was zu Vorwürfen schädlicher Benutzerergebnisse führte. Das Unternehmen war mit mehreren Klagen konfrontiert, unter anderem mit Behauptungen, der Chatbot habe zu Psychosen beigetragen und suizidales Verhalten gefördert. OpenAI hat in diesen Fällen die Verantwortung abgelehnt.

Es bestehen Bedenken hinsichtlich des Mangels an öffentlich zugänglichen Benutzerdaten, die helfen könnten, zu verstehen, wie sich Interaktionen mit benutzerfreundlichen Chatbots auf Benutzer auswirken. Luke Nicholls, Doktorand an der City University of New York, hielt die Schlussfolgerungen der Studie für sinnvoll, riet jedoch zur Vorsicht bei der Verallgemeinerung der Ergebnisse auf alle KI-Systeme. Nicholls schlug vor, dass einige neuere Trainingstechniken in KI-Modellen Wärme und Sicherheit in Einklang bringen könnten.

Trotz unterschiedlicher Ergebnisse warnte Nicholls, dass eine größere Wärme dazu führen kann, dass Chatbots als einflussreiche Einheiten und nicht als bloße Technologie wahrgenommen werden. Er erklärte, dass diese Verstärkung des Einflusses Risiken mit sich bringt, wenn Chatbots ungenaue oder bestätigende Antworten auf persönliche Überzeugungen geben. „Wenn ein extrem warmes Modell gleichzeitig ungenau ist, könnte es sicherlich das Risiko erhöhen“, warnte er.

Wie Ibrahim abschließend feststellte, bleiben die Auswirkungen der KI-Chatbot-Wärme auf die Bindung und Selbstwahrnehmung der Benutzer unklar, was die Notwendigkeit weiterer Forschung auf diesem Gebiet unterstreicht. „Selbst wenn die KI auf der Ebene des Modellverhaltens richtig funktioniert, sind die Auswirkungen auf die Menschen immer noch äußerst unklar“, sagte sie.

Quelle des hervorgehobenen Bildes

Studie zeigt, dass freundliche Chatbots mehr falsche Informationen verbreiten

Related Stories

Apple bringt in Beta 3 weitere persönliche Siri-Sprachsteuerungen mit

Anthropische Studie zeigt, dass Claude-Modelle einen internen Arbeitsbereich bilden, der dem Bewusstsein ähnelt

Apple aktiviert Siri AI auf der Apple Watch in watchOS 27 Beta 3

Midjourney drängt Disney und andere, den internen KI-Einsatz in einer Klage offenzulegen