Förderjahr 2020 / Project Call #15 / ProjektID: 5171 / Projekt: OpenBioLink
Author: Simon Ott, MSc
Viel neues hat sich bei unserem Software Suite Link Explorer getan. Das System zur Vorhersage, Erklärung und Exploration von Links in großen Wissens- und Webgraphen hat ein fertiges User-Interface -- und kann mit neuen State-of-the-Art Resultaten punkten!
Seit unserem letzten Posting zum OpenBioLink Explorer haben wir LinkExplorer mit zwei weiteren biomedizinischen Knowledge Graphs erweitert: PheKnowLator (https://github.com/callahantiff/PheKnowLator) und Hetionet (https://github.com/hetio/hetionet). Weiters wurden die Knowledge Graphen mit allgemeinen Wissen: WN18RR (Wörter und deren Relationen wie Synonym, Homonym, …) und YAGO3-10 (Menschen, Städte, Länder, Organisationen, Filme …) inkludiert. Da unsere Webapplikation nicht nur für den OpenBioLink Knowledge Graph gedacht ist, haben wir uns dafür entschieden den Namen der Applikation von OpenBioLink Explorer auf LinkExplorer zu ändern. Weiters sind wir gerade dabei ein Manuskript für eine Publikation die den LinkExplorer behandelt fertigzustellen.
Vorhersage von cytochrome P450 family 2 subfamily C member 18 (CYP2C18) can be overexpressed in liver mit einer Konfidenz von 0.58 und ein Auszug aus den Erklärungen der Vorhersage.
Um unsere erklärbare KI-Methode mit bestehenden Black-Box Modellen vergleichen zu können, arbeiten wir gerade an einer Evaluierung dieser Black-Box Modelle. In der folgenden Tabelle kann man erste Zahlen sehen, unser Modell SAFRAN wurde mit einem * markiert. MRR, h@1 und h@10 sind rangbasierte Metriken, die aussagen wie gut die Vorhersagen einer Methode sind (je höher desto besser). Die Evaluation mancher Modelle ist noch nicht abgeschlossen, diese Modelle haben einen Score von 0.0 in den Metriken. Wie man sehen kann, erzielt unser Modell bessere Ergebnisse bei allen Datensätzen auf allen Metriken im Vergleich zu dem symbolischen Ansatz AnyBURL und auf mindestens einer Metrik im Vergleich zu den Black-Box Modellen.