Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading…
Transcript

Schlussfolgerung und zukünftige Arbeit

Schlussfolgerung:

• Zeitliche, kontextspezifische Muster in Gesichtsmerkmalen, insbesondere Gesichtsmuskelkonfigurationen (FAUs), sind effektiv zur Vorhersage von Empathie.

• XGBoost-Modell zeigte hohe Genauigkeit (69%) und AUC (72%) bei der Empathieerkennung.

Zukünftige Arbeit:

• Erforschung von Aufmerksamkeitsmechanismen, um kontextspezifische Merkmale automatisch zu lernen und zu nutzen.

• Erweiterung der Analyse auf mehrere Modalitäten des menschlichen Verhaltens, nicht nur visuelle Daten.

• Motivierung zukünftiger Empathieforschung in vielfältigen und groß angelegten Mensch-Maschine-Interaktionsszenarien.

Analyse der Feature-Beiträge

Einleitung

  • Interaktionen mit Maschinen können menschliches Wohlbefinden fördern

  • Roboter-Geschichtenerzähler haben das Potenzial, Empathie bei menschlichen Zuhörern hervorzurufen

  • Erkennen von Benutzerempathie, die durch einen Roboter-Geschichtenerzähler hervorgerufen wird, basierend auf visuellen Merkmalen des Benutzers

  • Erkenntnisse zu Modellierungsansätzen und visuellen Merkmalen für die automatische Empathieerkennung

Erkenntnisse und Potenzial

• FAU 14 („Dimpler“):

• Signifikant höher bei empathischen Interaktionen.

• Intensität von FAU 14 bei empathischen Interaktionen: 0,23

• Intensität bei weniger empathischen Interaktionen: 0,11

• Weitere wichtige FAUs:

• FAU 23 („Lip Tightener“)

• FAU 12 („Lippenwinkelzieher“)

• FAU 6 („Wangenheber“)

• FAU 10 („Oberlippenheber“)

Potenzial:

• Nutzung von Gesichtsmustern zur Vorhersage von Empathie in Mensch-Maschine-Interaktionen.

• Feste Position des Roboters beeinflusst Blickrichtungsdaten.

Maschinen können kontextspezifische Verhaltensmuster erkennen und Empathie wahrnehmen.

Methoden und Design

Analyse der Feature-Beiträge

Modeling User Empathy Elicited by a Robot Storyteller

  • zwei Erzählstimmebedingungen und drei Geschichten
  • Erzählstimme in der 1. und in der 3. Person
  • Geschichten wurden hinsichtlich Stil und der Länge normalisiert

  • 42 Versuchspersonen

  • experimentelle Studie mit einer Sitzung

  • Sitzungen wurden aufgezeichnet
  • 122 Videos wurden für Analyse und Modellierung verwendet

  • Empathie mittels Fragebogen bewerten

Identifikation der wichtigsten Merkmale für Empathieerkennung

Wichtigste Merkmale:

• 19 FAU-Funktionen (Gesichtsmuskelkonfigurationen)

• 3 PDM-Merkmale (Gesichtsposition und -bewegung)

• 2 Merkmale der Augenregion

• 1 Blickrichtungsmerkmal

• Höchste Genauigkeit: XGBoost auf FAU-Merkmale (65%)

• Andere Teilmengen:

• PDM-Merkmale: 61%

• Gesichtsmerkmale: 59%

• Kopfhaltung: 58%

• Blickrichtung: 51%

Muster in Gesichtsbewegungen sind entscheidend für die Empathieerkennung.

Vergleich der Modellierungsansätze

Ablauf

Vergleich der Modellierungsansätze

Automatisierte Empathieerkennung

  • Roboter stellt sich vor und stellt Fragen zu den Versuchspersonen

  • Roboter erzählt per Zufallsprinzip eine der drei Geschichten; verwendet entsprechende Erzählerstimme

  • Vpn füllen Fragebogen aus, der den Grad der Empathie gegenpber den Charakteren der Geschichte bewertet

  • Vorgehen wir mit den beiden weiteren Geschichten wiederholt

  • Videos in "empathic" und "less-empathic" einteilen

Teilnehmer in 1,2-2,1m Entfernung zum Roboter

Aufzeichnung via im Roboter integrierter RGB-D-Kamera und einer externen Kamera

Erfassung folgender zeitlicher Muster (visuelle Merkmalsextraktion):

  • Blickrichtungen

  • Intensität und Präsenz von 17 Gesichtsaktionseinheiten (FAUs)

  • Gesichtsmerkmale

  • Kopfhaltungskoordinaten

  • Parameter des Punktverteilungsmodell (PDM) für Gesichtsposition, -skalierung, -rotation und -deformation

  • XGBoost als leistungsstärkstes Modell

  • Ensemble-Modell, Nutzung von Gradient Boosting für Klassifizierung

  • Genauigkeit von 69% und AUC von 72%

  • Klassische lineare maschinelle Lernmodelle und klassische nichtlineare maschinelle Lernmodelle haben das Potenzial, eine vergleichbare Leistung wie Deep LSTM-Netzwerke bei der Vorhersage von Empathie in dieser Art von Kontext zu erbringen

  • Geringe Grösse des Datensatzes
Learn more about creating dynamic, engaging presentations with Prezi