FedCSIS 2022

Bereits zum vierten Mal begleitete das WIG2 Institut eine Session auf der Federated Conference on Computer Science and Intelligence Systems (FedCSIS) zum Thema Data Science in Health, Ecology and Commerce. DSH’04 fand als Online-Workshop am 07.September statt und konnte so Teilnehmende aus Deutschland, Algerien, Brasilien, Japan und aus weiteren Teilen der Welt zusammenbringen.  
Während das WIG2 Institut und die Juniorprofessur Health Economics and Management der Universität Leipzig (J.-Prof. Dr. Dennis Häckl) den Aspekt Gesundheitswesen in das Workshop-Thema einbrachte, steuerte der Lehrstuhl für Informatik derselben Universität, das Helmholtz-Zentrum für Umweltforschung und das Social CRM Research Center Expertise in den weiteren Bereichen bei. So betrachten die vorgestellten Beiträge im Gesundheitswesen, der Umweltforschung und der Wirtschaft Einsatzmöglichkeiten von Data Science – darunter mit Datenanalyse, Datenökonomie, Informationssysteme und datenbasierter Forschung, und der Interaktion dieser Felder.
Insgesamt wurden elf Beiträge zu DSH’04 eingereicht. Diese stammen aus der Feder von 46 Autor:innen aus 17 verschiedenen Ländern. Sieben Beiträge konnten angenommen werden. Darunter zwei als reguläres Forschungspapier, zwei als Kurzpapiere und weitere drei als Positionspapiere, die einen sich noch im Prozess befindlichen Forschungsansatz vorstellen. Alle präsentieren verschiedene Ansätze zu Data Science im Gesundheitswesen, der Umweltforschung und der Wirtschaft. 


Künstliche Intelligenz in der personalisierten Gesundheitsanalyse für Menstruationsbeschwerden von Frauen

regular research paper
(Artificial Intelligence in Personalized Healthcare Analysis for Womens’ Menstrual Health Disorders)

Łukasz Sosnowski, Joanna Żuławińska, Soma Dutta, Iwona Szymusik, Aleksandra Zyguła and Elżbieta Bambul-Mazurek

Das Forschungsteam aus Polen entwickelte eine KI-gestützte personalisierte Analyse bei Menstruationsbeschwerden zur Einschätzung von möglichen Gesundheitsrisiken. Als Basis wurde dazu die bereits existierende App OvuFriend genutzt und zu OvuFriend 2.0 weiterentwickelt. Die Analyse erfolgt in drei Schritten. Ausgangspunkt sind die bei Appnutzung eingetragenen Informationen und Symptome des aktuellen Zyklus. Diese werden im zweiten Schritt zyklusübergreifend durch die KI hinsichtlich möglicher Korrelationen und Muster analysiert. Abschließend werden die Erkenntnisse genutzt, um die Wahrscheinlichkeit möglicher Gesundheitsrisiken abzuschätzen. Die implementierte KI kann derzeit eine Risikoabschätzung für PMS (Prämenstruales Syndrom), LPD (Lutealphasendefekt), Uterusmyome und -polypen, PCOS (Polyzystisches Ovarialsyndrom) sowie eine Schilddrüsenunterfunktion liefern. Die Entwicklung der KI erfolgte in Zusammenarbeit mit einem Team aus medizinischen und wissenschaftlichen Expert:innen, welche mit ihrem Wissen nicht nur die Basis legten, sondern auch parallel die durch die Nutzer:innen erbrachten Informationen prüften und für das Vorgehen bewerteten. Das Forschungsteam plant für die Zukunft, die Anwendungsoberfläche von OvuFriend 2.0 durch Dialogfunktionen noch interaktiver zu gestalten. Durch Machine Learning Techniken könnte zudem der Diagnoseprozess verbessert und flexibler gestaltet werden. 

Neuronales Encoder-Decoder-Netzwerk mit Aufmerksamkeitsmechanismus zur Erkennung von Typen in verknüpften Daten

regular research paper
(Encoder-Decoder Neural Network with Attention Mechanism for Types Detection in Linked Data)

Oussama Hamel and Messaouda Fareh

Mit dem Problem der Datenunvollständigkeit bei der Nutzung von Linked Data beschäftigte sich das Forschungsduo von der Universität Blida in Algerien. Ein solches Problem tritt in vielen Anwendungsbereichen und bei verschiedenen Datenbanken auf – stellt aber Forschungsmethoden vor gleiche Probleme, darunter die Typerkennung für Entitäten in RDF-Daten. Deshalb soll ein Ansatz entwickelt werden, der auf Deep-Learning-Techniken basiert und unter Verwendung eines Encoder-Decoder-Modells eine Schicht einbettet, um die Merkmale jedes Subjekts aus den RDF-Tripeln und den GRU-Zellen zu extrahieren, wodurch der Unvollständigkeit von Informationen entgegengewirkt werden soll. Für die Trainings- und Testphasen wurde der DPpedia-Datensatz verwendet. Erste Testergebnisse können die Wirksamkeit des Modells bestätigen. In Zukunft soll der Ansatz validiert werden, indem dieser an verschiedenen Datensätzen getestet und mit den Ergebnissen verwandter Arbeiten verglichen wird. Weiterhin sollen auch NLP-Techniken auf Textobjekte angewendet werden.

Modell der Vertrauensverbreitung von Produkten auf der Grundlage von Fuzzy-Aggregationsnormen

short research paper
(Model of Trust Dissemination of Products Based on Fuzzy Aggregation Norms)

Oleksandr Sokolov, Aleksandra Mrela, Maryla Bieniek-Majka, Veslava Osinska and Wlodzislaw Duch

Viele Unternehmen sind auf der Suche nach kostengünstigen und effektiveren Wegen, um bei ihrer Zielgruppe eine positive Meinung hervorzurufen. Als Alternative zu teuren Werbemaßnahmen stellt der Beitrag eines polnischen Teams ein Multi-Agenten-Modell zur Verbreitung von Vertrauen in das Produkt auf der Grundlage von Fuzzy-Aggregationsnormen vor. Einzelne Personen tauschen Meinungen untereinander aus und festigen somit ihre eigene; das theoretische Modell erleichtert mithilfe von Simulationen die Nachvollziehbarkeit des Prozesses. Bei der Arbeit mit Fuzzy-Aggregationsnormen werden zwei Ansätze vordefiniert: Im optimistischen Ansatz vertreten zwei Personen dieselbe Meinung über ein zu bewerbendes Produkt, wodurch das Vertrauen zu diesem bei beiden steigt. Im pessimistischen Ansatz haben sie hingegen unterschiedliche Meinungen, was zu Unsicherheiten über das Produkt führt. Die Anwendung des Modells wird durch ein Beispiel vorgestellt, in Form der Ergebnisse eines Multi-Agenten-Modells zur Verbreitung des Vertrauens in ein Produkt und die Ergebnisse der NetLogo-Simulation.

Erkennung von Demenzsymptomen bei älteren Menschen anhand von Merkmalen des Pupillenlichtreflexes

short research paper
(Detecting Symptoms of Dementia in Elderly Persons using Features of Pupil Light Reflex)

Minoru Nakayama, Wioletta Nowak and Anna Zarowska

Bereits zum zweiten Mal begrüßen wir das polnisch-japanisches Forschungsteam, das sich mit der Identifikation von Demenzsymptomen bei den Augen beschäftigt. So wurden im vorjährigen Kurzpapier bereits Indikatoren der Augenmotoren vorgestellt, die sich bei Demenzerkrankten signifikant von der Kontrollgruppe unterschieden. In Erweiterung dieses Forschungsansatzes standen in diesem Jahr Pupillenlichtreflexe im Vordergrund. Das Team untersuchte in mehreren Durchgängen, welchen Reflex Pupillen auf blaue und rote Lichtimpulse zeigen, die auf eines der beiden Augen gerichtet waren. Die Studienteilnehmenden wurden in drei Gruppen – keine Demenzerkrankung, milde kognitive Einschränkungen und Alzheimererkrankung – eingeteilt; auch ihr Alter wurde erfasst und ausgewertet. Aus den Merkmalen wurden drei Faktorscores berechnet: Geschwindigkeit und Beschleunigung der Pupillenveränderung, Merkmale der Kontraktion bspw. relative Amplitude sowie die Zeiten für die unterschiedlichen Raten und Beschleunigungen. Mit Hilfe einer Regressionsanalyse wurde ein Klassifikationsverfahren zur Bestimmung des Grades der kognitiven Beeinträchtigung einer Person erstellt. Es gibt keine signifikanten Unterschiede in den Merkmalen und Faktorwerten zwischen dem linken und dem rechten Auge. Im Ergebnis konnte die Abhängigkeit der Faktorwerte für blaue Lichtimpulse vom Alter der Teilnehmer:innen bestätigt werden. Das Team hat bereit weitere Forschungsaktivitäten in diesem Feld angekündigt. 

Analyse der Auswirkungen von Finanznachrichten auf die Vorhersage von Aktienkursen mit einem Stacked-LSTM-Modell

communication paper
(Financial News Effect Analysis on Stock Price Prediction Using a Stacked LSTM Model)

Alexandre Heiden and Rafael Stubs Parpinelli

Die beiden Autoren von der Santa Catarina State University in Brasilien beschäftigten sich mit der Analyse der Auswirkungen von Finanznachrichten aus einer verlässlichen Quelle auf den Aktienkurs. Als Datenbasis wurden die Finanznachrichten der New York Times von Januar 2016 bis Dezember 2020 genutzt. Auf dieser Basis wurde ein Algorithmus für eine Sentimentanalyse trainiert, der Nachrichten hinsichtlich möglicher positiver oder negativer Beeinflussung der Aktie auf dem Markt bewerten kann. Für das Experiment wurden die Top 50 Aktien des S&P Index inkl. deren historischem Verlauf mit den Indikatoren für das erste Quartal 2021 betrachtet. Die historischen Daten fließen gemeinsam mit dem Ergebnis der Sentimentanalyse in ein Long Short-Term Memory (LSTM) Modell, das so fähig ist, die sich entwickelnden Preise der einzelnen Aktie in den nächsten 35 Tagen mit guter Genauigkeit vorherzusagen. Das Modell könnte nach weiterer Erprobung durchaus das Potenzial innehaben, eine Relevanz für den realen Investmentmarkt aufzuweisen. Bisher beschränkt sich der Untersuchungszeitraum auf 5 Jahre – dieser könnte für realistischere Ergebnisse erweitert werden. 

Visuell verbesserte Python-Funktionen für die Bewertung der klinischen Gleichheit von Messungen

communication paper
(Visually enhanced python functions for clinical equality of measurement assessment)

Mauro Nascimben and Lia Rimondini

Das Forschungsteam aus Italien stellt sich dem Problem, dass eine mögliche Austauschbarkeit, bzw. Bestimmung der Ähnlichkeit zweier Testverfahren durch rein statistische Tests bisher nicht möglich ist und präsentiert kundenspezifische Methoden zur Bewertung der biomedizinischen Äquivalenz sowie der Konzentration auf die Übersetzung der Ergebnisse in visuelle Berichte. Mit der Programmiersprache Python werden die Funktionen in einem objektorientierten Framework kodiert. Ferner enthält die Bibliothek bessere Diagramme und neuartige Grafiken, um die Interpretation der Ergebnisse zu erleichtern, sowie Konsolentextausgaben, um Benutzer:innen mit zusätzlichen Erklärungen zu unterstützen. Das aktuelle Modul stellt vier Aspekte der biomedizinischen Statistik dar (Äquivalenz, Bland-Altman- und ROC-Analysen, Effektgröße und Interpretation von Konfidenzintervallen). Python ist eine gute kostenlose Alternative, um medizinbezogene statistische Tests visuell gut darstellen zu können. Zukünftige Versionen des Programmes sollen zunehmend erweitert und verbessert werden, wobei der Schwerpunkt auf der Erzeugung visueller Erkenntnisse liegen wird.


Autorinnen der Kurzzusammenfassungen zu den Beiträgen: Franziska Stutzer und Luise Seile

_____________________________

Eine Übersicht aller Newsmeldungen finden Sie in unserem Archiv.