Das Facebook-Team kündigte signifikante Verbesserungen der KI an, mit der auf der Plattform veröffentlichte Fotos beschrieben werden, eine Technologie, die für sehbehinderte Benutzer entwickelt wurde.
Dieses 2016 von Facebook entwickelte System wurde verbessert, um eine schnellere und genauere Dynamik zu erzielen. Das neueste Update geht jedoch noch einen Schritt weiter, da es detailliertere Beschreibungen der Fotos bieten kann.
Facebook verbessert seine KI, um sehbehinderten Nutzern zu helfen
Für jedes auf Facebook veröffentlichte Bild generiert die künstliche Intelligenz automatisch einen Untertitel, der versucht, die Szene zu beschreiben. Facebook möchte nicht, dass dieses Projekt nur einzelne Elemente des Bildes beschreibt, sondern die gesamte Szene vermittelt, damit Benutzer den Kontext verstehen und den Beitrag genießen können.
Ein Ziel, das in dieser neuen Version der KI vorhanden ist, kann bereits viel mehr Elemente erkennen und eine detailliertere Beschreibung der Szene bieten. Es kann nicht nur unterscheiden, ob es Menschen oder Tiere gibt, sondern es kann auch verschiedene Arten von Aktivitäten, Orten und sogar die Position der Elemente erkennen.
Im obigen Bild konnte die künstliche Intelligenz beispielsweise erkennen, dass 5 Personen Hüte tragen und Schlagzeug spielen. Aber nicht nur das, es kann auch beschreiben, wie die Szene aufgebaut ist und welche Elemente wichtig sind. Wie Sie auf dem Foto sehen können, werden alle Informationen so klassifiziert, dass der gesamte Kontext der Szene verstanden werden kann.
All diese Informationen helfen sehbehinderten Menschen zu verstehen, was ihre Freunde auf ihren Fotos teilen. Natürlich möchten sie diese Informationen möglicherweise nicht für jedes Foto erhalten, das in ihrem Feed angezeigt wird. Facebook ermöglicht ihnen daher zu wählen, wann sie eine detailliertere Beschreibung erhalten möchten.