Spotifys neues AI DJ Feature – Bahnbrechend oder heiße Luft?

Als ich in den letzten Tagen in meinen Social Media Feeds von einem neuen Spotify AI DJ Tool las, wurde ich aufmerksam, aber auch argwöhnisch: Technische Neuerungen, die auf künstlicher Intelligenz (KI, siehe Erklärungen unten) beruhen, sind gerade in aller Munde. Bei manchen Neuerungen wie zum Beispiel des derzeit viel diskutierten Bot-Prototypen „Chat GPT“ von der Firma „Open AI“ deutet sich tatsächlich an, dass tiefgreifende Verbesserungen in der Mensch-Maschinen-Kommunikation für eine breite Menge zugänglich gemacht werden. Manchmal vertrocknet das Tech-Hype-Pflänzchen aber genauso schnell, wie es aufgeblüht ist. Was ist aus den umfassenden Verheißungen von Kryptowährungen oder NFTs geworden? Nicht immer gehen mit technischen Neuerungen direkt bahnbrechende kulturelle Veränderungen einher.

Der neue AI DJ soll direkt auf der Startseite der Spotify-App angezeigt werden. Bild: Spotify

Beim AI DJ ist meine Neugier jedenfalls geweckt und ich habe hier alle verfügbaren Infos und meine Einschätzungen und Gedanken dazu zusammengetragen. Und bevor ihr jetzt direkt eure Spotify-App aufmacht und euch wundert: Bisher gibt es das Tool nur für Beta-Tester:innen in USA und Kanada (Pressemitteilung Spotify). Ob und wann die Funktion in Deutschland verfügbar wird, ist noch nicht bekannt (Gearnews).

Was ist das neue AI DJ Tool und was kann es?

Per Knopfdruck wählt der AI DJ einen Song aus, der zu der momentanen Stimmung des:der Hörer:in passen soll. Manche Lieder moderiert der DJ mit einer synthetisierten Stimme an und liefert wohl Hintergrundwissen oder kleinere Fakten zu den Liedern (Thetab.com). Wenn einem das Genre oder die Stimmung nicht gefällt, kann man den DJ-Button drücken und die Stimmung ändert sich (Pressemitteilung Spotify). Wie die synthetisierte Stimme des AI-DJs klingt, könnt ihr in diesem Werbe-Video von Spotify anhören:

Im YouTube-Video wirbt Spotify für die neue AI DJ Funktion.

Die Kommentare zu den Songs sind laut the Verge von Musikkenner:innen und Kulturprofis gescriptet. Die einzelnen Informationshäppchen daraus werden aber jedem individuell ausgespielt (Theverge.com). Die synthetisierte Stimme des AI-DJs basiert auf der echten Stimme des Moderators Xavier „X“ Jernigan, der wohl auch schon für andere Projekte mit Spotify zusammengearbeitet hat (Giga.de). Um das Anmoderieren technisch möglich zu machen, hat Spotify wohl auf die Technologie von dem bereits erwähnten Chat GPT von Open AI zurück gegriffen (Gearnews). Spotify will keine halben Sachen und verspricht vollmundig:

The DJ is a personalized AI guide that knows you and your music taste so well that it can choose what to play for you.

Pressemitteilung Spotify

Ein DJ, der mich besser kennt als meine engsten Vertrauten und für mich Musik auswählt? Klingt cool! Aus der Gender-Perspektive ist zudem spannend, dass die DJ-Stimme aus der Stimme eines männlichen Moderators synthetisiert wird. Andere bekannte, maschinell synthetisierte Stimmen wie Alexa oder Siri sind fast immer weiblich. Es gibt verschiedene Thesen dazu, wieso das so ist: weiblich kodierte Maschinen werden als weniger bedrohlich empfunden, Stereotype von „weiblichen Dienstmägden“ oder weniger Hemmungen, eine weiblich geframte Assistenz „auszunutzen“ (Deutschlandfunk.de, Adlershof.de). Dass für den Spotify-DJ eine männliche Stimme gewählt wurde, entspricht dem nach wie vor von Männern dominierten Musikbusiness und reproduziert die vorhandenen Gender-Stereotype aus diesem Bereich. Ob Nutzer:innen eine weiblich kodierte Stimme nicht akzeptieren würden, weil sie ihr weniger Kompetenz bei der Musikauswahl zuschreiben würden? Das sind Mutmaßungen. Diese wären aber angesichts der bisherigen Gender-Zuschreibungen im KI- und Robotik-Bereich nicht weit hergeholt.

Personalisiertes Musikhören geht einen Schritt weiter

Personalisierung ist schon immer eines der Kernelemente von Spotify: Einige Funktionen, die viele von euch bereits kennen und nutzen werden, sind z.B. personalisierte Playlists wie „Dein Mix der Woche“, die Radio-Playlists zu einem bestimmten Song oder Künstler:in oder der popkulturell sehr relevante Jahresrückblick. Diese Elemente beruhen bereits auf Technologien wie künstlicher Intelligenz und maschinellem Lernen.

Auf den ersten Blick wirkt die Neuerung nicht unbedingt bahnbrechend. Wenn ich Moderation haben möchte, dann kann ich Radio hören. Zugegeben, der Gedanke, dass dann wirklich nur „meine“ Musik anmoderiert wird, klingt schon attraktiv. Aber ich frage mich, ob mich der Moderator mehr nerven als in den Flow bringen würde.

Schafft Spotify es, mit dem neuen AI DJ Tool Stimmungen aufzugreifen und das Hörerlebnis so noch personalisierter und emotionaler zu gestalten? Bild: Screenshot Werbe-Video Spotify

Spannend finde ich tatsächlich die Stimmungs-Anpassung. Hier würde mich wirklich brennend interessieren, wie sich das live anfühlt. Kann der Spotify DJ wirklich datengetrieben vorhersagen, welche Stimmung gerade passt oder welcher längst vergessenen Lieblingssong mich gerade jetzt abholen würde? Realistisch ist sicher, dass Spotify genug Daten über meine Hörgewohnheiten hat, um zumindest ein grobes Stimmungsprofil über den Verlauf eines Tages zu erstellen. Aber eine wirklich im Moment korrekte Passung stelle ich mir schwierig vor. Ob ich das Feature nutzen würde, hängt stark von der emotionalen Passung ab. Ohne Test kann ich nicht sagen, wie gut das klappt. Man darf also gespannt sein, ob und wann der AI DJ in Deutschland eingeführt wird.

Ein Tippen auf den DJ-Button führt zu einem Stimmungs- oder Genre-Wechsel. Bild: Screenshot Werbe-Video Spotify

Ich schätze, dass die neue Funktion nicht so sehr auffallen wird, aber Spotifys Stärke beim emotionalen Hörerlebnis noch ausbauen wird. Aus meiner Sicht können solche technologischen Details für Tech-Giganten erfolgsentscheidend sein, denn die User:innen werden sich immer für das Angebot entscheiden, das in der Anwendung am zufriedenstellendsten ist. Spotify versucht so also, sein Monopol im Musikstreaming-Markt auch für die Zukunft zu sichern und auszubauen. Ein strategisch kluger Schachzug, da bin ich mir sicher. Aber ich bin auch gespannt, ob die neue AI DJ Funktion wirklich so überzeugend sein wird, wie sie im Moment angepriesen wird. Man darf außerdem gespannt sein, ob es nicht doch demnächst ein Konkurrent aus dem Musikstreaming-Bereich schafft, mit einem neuen Ansatz Spotify den Markt streitig zu machen. Das wäre nicht zuletzt für Künstler:innen gut, da sie so etwas unabhängiger von Spotify werden könnten.


Intelligente Maschinen kurz erklärt

AI, KI, maschinelles Lernen, Bots: den meisten von euch werden die Begriffe geläufig sein. Da es aber immer wieder zu Verwirrung kommt, hier ein paar knappe Definitionen (siehe auch die einzelnen Lemmata im Glossar):

AI und KI

AI (engl. für Artifial Intelligence) und KI (Künstliche Intelligenz) sind die englische oder deutsche Abkürzung und bezeichnen künstliche (also vom Menschen hergestellte) Intelligenz einer Maschine. Diese Intelligenz definiert sich dadurch, dass die Maschine Eingabedaten eigenständig auswertet, sortiert und darauf reagieren kann. Die Fähigkeit dazu kann entweder ein spezifisches Programm sein oder auf maschinellem Lernen beruhen (Frauenhofer Institut für Kognitive Systeme).

Maschinelles Lernen

Maschinelles Lernen ist die Eigenschaft eines Algorithmus, anhand von Trainingsdaten übergreifende Muster und Gesetzmäßigkeiten zu erkennen und diese dann auf unbekannte Daten anwenden zu können (Frauenhofer Institut für Kognitive Systeme, Reitmeier 2015).

Bot vs. Chatbot

Unter dem Begriff Bot (engl. Kurzform von „robot“, also Roboter) versteht man ein Programm, das automatisiert wiederholende Aufgaben durchführt. Z.B. werden solche Programme eingesetzt, um automatisch das Internet nach Mail-Adressen für Werbung zu durchsuchen (Internet-ABC).

Ein Chat-Bot wie z.B. Chat GPT hingegen meint ein Dialog-System, bei dem vom Menschen Fragen oder Aussagen eingegeben werden können und die Maschine anhand von künstlicher Intelligenz und maschinellem Lernen antwortet (IBM). Dabei gab es in den letzten Jahren deutlich wahrnehmbare Fortschritte in der Angleichung der maschinellen Antworten an menschliche Sprache. Chat GPT ist das (Zwischen-)Ergebnis dieser Entwicklungen und überzeugt meiner Einschätzung vor allem auch durch die Benutzerfreundlichkeit (usability). Es ist derzeit der beste Konversationsagent für die breite Massenanwendung.


Titelbild: Screenshot Werbe-Video Spotify

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s