Oma in Alexa

(Di Marco Rottigni)
07/07/22

Persönlich bin ich fasziniert von künstlicher Intelligenz, Technologie und wie sie sich allmählich, aber unaufhaltsam in unser Leben einschleicht.

Indem wir sie natürlich verbessern, manchmal auf sehr störende Weise, wie ... Emotionen wiederbeleben, die mit Menschen verbunden sind, die nicht mehr da sind.

In diesen Fällen ist kritisches Denken wichtig: Dieser Gedanke führt uns dazu, diese Auswirkungen zu bewerten, zu entscheiden, ob wir daran teilhaben wollen, und auch die potenziellen negativen Aspekte abzuwägen. Das erklärt die Faszination, die Technik auf mich ausübt, als Grund für häufige Offenbarungen und kathartische Momente.

Einer dieser Momente ist mir vor ein paar Tagen nach dem Re-Event passiert: MARS 2022. Eine Kirmes über künstliche Intelligenz, bei der der Riese Amazon der Welt seine Studien, Experimente und Innovationen in Bezug auf maschinelles Lernen, Automatisierung, Robotik und mehr veranschaulicht Raum… angewandt auf gegenwärtige und zukünftige Geschäfte.

Die Veranstaltung selbst ist spannend, voller Ideen und Provokationen, mit vielen illustren Gästen, auch externen. Die Reden dieser Gäste, im Fachjargon Keynotes genannt, stehen auch online auf YouTube zur wiederholten Nutzung durch die Öffentlichkeit zur Verfügung.

Am zweiten Tag Keynote verfügbar unter https://www.youtube.com/watch?v=22cb24-sGhg, genau eine Stunde und zwei Minuten nach Beginn fiel mir eine Passage aus Rohit Prasad auf - leitender Wissenschaftler von Alexa AI.

Ich habe seine Kontextualisierung wirklich gut vorbereitet verfolgt: Als er über die Empathie zwischen Mensch und Maschine als ein Gefühl sprach, das der Grundlage für den Aufbau eines Vertrauensverhältnisses ist, konzentrierte er sich darauf, dass die jüngste Pandemie-Notlage für viele von uns den Verlust von Menschenleben bedeutet ein geliebter Mensch.

Alexa – oft ein Symbol dieser technologischen Präsenz, auch wenn es sich um einfache Gespräche handelt – hat im Laufe der Zeit Fähigkeiten entwickelt, für die ich buchstäblich vom Blitz getroffen war: Offensichtlich nicht geeignet, den Schmerz dieser Verluste zu beseitigen, aber ausreichend, um eine weitere Möglichkeit zu bieten, das Gedächtnis der Menschen zu stärken ausdauerndere Pflege.
Innerhalb von Sekunden ändert sich das Video und zeigt ein Kind, das Alexa bittet, ihm von seiner verstorbenen Großmutter eine Passage aus dem Zauberer von Oz vorlesen zu lassen, so wie er es zu Lebzeiten getan hat.

Alexa antwortet mit einem „Okay“ auf die Bitte, um gleich zu einer perfekten Simulation der Stimme der lieben Oma überzugehen und dem Technik-Enkel eine sichtbar spürbare Emotion zu verleihen.

Das Video kehrt dann zu Rohit zurück, der sofort zwei Dinge erklärt, die mir wegen seiner Innovationskraft sehr aufgefallen sind: Erstens, dass die gerade gesehene Möglichkeit aus einem Perspektivwechsel in der Art und Weise resultiert, wie die Stimme analysiert wird; genauer gesagt, die Analyse von einem Problem der Spracherzeugung, das heißt der Erzeugung einer Audiophrase, zu einer Frage der Sprachumwandlung zu verschieben.

Die zweite Sache, die eng mit der ersten zusammenhängt, betrifft, wie dieser Perspektivwechsel die Wiedergabe mit nur einer Minute bestehender Sprachaufzeichnung ermöglichte, verglichen mit stundenlangen Studioaufnahmen, die der vorherige Ansatz erfordert hätte !!!

(Rohit Prasad auf der Bühne von re: MARS 2022)

Aber ich sprach zuerst über die Notwendigkeit kritischen Denkens: Vergangenheit Wow-Momenttatsächlich begann ich, über einige Aspekte nachzudenken.

Es gibt mehrere Online-Dienste, bei denen eine der Authentifizierungsmethoden genau darin besteht, einen Satz auszusprechen, um zu beweisen, dass Sie die Person sind, für die Sie sich ausgeben: Es ist klar, dass es mit einer solchen Technologie, die auch nicht nur Amazon zur Verfügung steht, es wird wichtig, die Stärke des Authentifizierungsprozesses anderen Mechanismen anzuvertrauen - sicherlich weniger simulierbar.

Die sprachbiometrische Authentifizierung ist sicherlich eine junge Technologie, die jedoch aufgrund ihrer einfachen Verwendung und des Fehlens von zusätzlichen Tools ziemlich schnell Popularität erfahren hat. Ein Großteil dieser Popularität wurde von Bank- und Versicherungsdiensten in großem Umfang wahrgenommen, wenn auch in letzter Zeit mit anderen Mechanismen kombiniert, um die Gesamtstärke des Prozesses zu erhöhen. In einem Artikel aus dem Jahr 2020 wurde die Kombination von Mehrfrequenztönen einer Telefontastatur als starkes Authentifizierungsverfahren vermutet, kombiniert mit einem mit der Stimme des Kunden aufgenommenen Satz, der wiedergegeben werden musste: Es versteht sich von selbst, dass die von Amazon vorgestellte Innovation es ist würde diese Kraft zunichte machen und den Authentifizierungsprozess dem Risiko von Imitationsangriffen aussetzen. Angriffe, bei denen der Angreifer über alle notwendigen Werkzeuge verfügt, um so zu tun, als wäre er das endgültige Opfer, indem er die technologische Einheit täuscht, die die Identität bestätigen soll.

Ein weiterer riskanter Prozess ist die Kontrolle des physischen oder virtuellen Zugangs zur Arbeit aus Preisgründen oder die Überprüfung der Arbeitszeiten. Ein weiterer Bereich, in dem Angreifer durch diese Sprachsynthesetechnologien erheblich erleichtert würden.

Die zweite Reflexion ist etwas emotionaler: Wie ich eingangs sagte, finde ich diese Möglichkeit absolut faszinierend und innovativ; Mir ist jedoch klar, dass dies für verschiedene Menschen möglicherweise nicht bereits eine Quelle positiver Emotionen ist, sondern den Schmerz über den Verlust eines geliebten Menschen auf eine wichtige und kaum erträgliche Weise verlängert.

Nun, wenn es eine Sache gibt, die den Menschen von der Technik unterscheidet, dann ist es das Bewusstsein, aus dem der freie Wille hervorgeht. Die Geschichte lehrt uns die Sinnlosigkeit, Fortschritt, Wissenschaft und Technologie zugunsten persönlicher Gefühle und Überzeugungen zu leugnen – richtig oder falsch. Deshalb empfehle ich diesen Leuten einfach, sich zu entscheiden. Die Entscheidung, diese von der Technologie gebotene Möglichkeit zu ignorieren, während das gleiche Recht dem Rest der Menschen überlassen wird.