Bahnbrechendes Verfahren?
Litauische Forscher nutzen KI zur Diagnose von Depressionen
Litauische Wissenschaftler der Technischen Universität Kaunas (KTU) haben ein bemerkenswertes KI-Modell entwickelt, das die Diagnose von Depressionen mithilfe von Sprache und neuronaler Gehirnaktivität revolutionieren könnte.
Laut einer Pressemitteilung der KTU ermöglicht dieses neue System einen völlig neuartigen Ansatz zur Erkennung der Erkrankung. „Depressionen gehören zu den häufigsten psychischen Störungen und haben gewaltige Folgen für den Einzelnen und die Gesellschaft“, erklärte Rytis Maskeliūnas, Professor an der KTU.
„Deshalb entwickeln wir eine neue, objektivere Diagnosemethode, die in Zukunft für jeden zugänglich sein könnte“, fuhr er fort. Das Team weist darauf hin, dass herkömmliche diagnostische Verfahren häufig nur eine Datenquelle nutzen.
Der neue, multimodale Ansatz kombiniert hingegen verschiedene Datenquellen, um ein umfassenderes Bild des emotionalen Zustands einer Person zu zeichnen. Die Kombination von Sprach- und Gehirnaktivitätsdaten erreichte bei Tests eine beeindruckende Diagnosegenauigkeit von 97,53 Prozent.
„Wir haben uns für die Stimme entschieden, weil sie emotionale Zustände subtil offenbart“
Musyyab Yousufi, Forscher an der KTU, erklärt die Wahl der verwendeten Datenquellen genauer. „Man geht zwar davon aus, dass der Gesichtsausdruck mehr über den psychischen Zustand einer Person aussagen könnte, aber diese Daten sind recht leicht zu fälschen.“
„Wir haben uns daher für die Stimme entschieden, weil sie einen emotionalen Zustand auf subtile Weise offenbaren kann, wobei die Diagnose das Sprechtempo, die Intonation und die allgemeine Energie beeinflusst“, so Yousufi.
Zugleich betonte das Team die Notwendigkeit, die Privatsphäre der Patienten zu wahren, während die Kombination mehrerer Datenquellen das Potenzial der Methode zusätzlich steigere. Die EEG-Daten, auf denen das System basiert, stammen aus dem Multimodal Open Dataset for Mental Disorder Analysis (MODMA).
Die gesammelten EEG- und Audiosignale wurden in Spektrogramme umgewandelt
Ergänzt wurden diese Daten durch Audioaufnahmen aus Frage-und-Antwort-Sitzungen sowie weiteren Aktivitäten wie dem Lesen und Beschreiben von Bildern, um laut LRT.lt natürliche Sprache und kognitive Zustände der Probanden zu analysieren.
Die gesammelten EEG- und Audiosignale wurden in Spektrogramme (also bildlich) umgewandelt, die anschließend mithilfe eines modifizierten DenseNet-121-Deep-Learning-Modells analysiert wurden. Hierbei visualisierten die Spektrogramme zeitliche Veränderungen der Signale.
Das Forschungsteam ist zuversichtlich, dass das KI-Modell in Zukunft dazu beitragen könnte, Diagnosen zu beschleunigen oder sogar aus der Ferne durchzuführen. Gleichzeitig betonten die Wissenschaftler, dass weitere klinische Studien und Verbesserungen notwendig seien, um das System marktreif zu machen.