Förderjahr 2020 / Project Call #15 / ProjektID: 5198 / Projekt: Open AudioSearch
Die Ausgangslage
In den letzten Jahren ist der der Anteil von Audio- und Videoinhalten, die online zur Verfügung gestellt werden, rasant angestiegen. YouTube boomt wie eh und je und mittlerweile werden täglich rund 720.000 Stunden Videomaterial allein auf dieser Plattform hochgeladen. Einen ähnlichen Hype erlebt das Format Podcast. Das Angebot steigt, täglich werden neue Podcast-Projekte von unabhängigen Podcaster:innen, journalistischen Medien, Universitäten und zivilgesellschaftlichen Initiativen gestartet. Auch die Nachfrage steigt rasant an. So gaben 28,4% der Befragten im Rahmen des Digital News Reports Österreich von Reuters an, das Medium Podcast zu nutzen. (vgl. http://www.digitalnewsreport.at/)
Mit über 110.000 Podcasts ist das Cultural Broadcasting Archive ein wichtiger österreichsicher Player im Bereich Podcasting und der größte österreichische Podcast-Provider.
Das Problem
Die Inhalte von Audio- und Videobeiträgen sind nicht ohne weiteres bearbeitbar. Audio-Inhalte können nicht mithilfe von Suchmaschinen durchsucht werden. Grund dafür ist, dass Suchmaschinen bis dato ausschließlich geschriebenen Text verstehen und verarbeiten können. Um Podcasts in Suchmaschinen auffindbar zu machen, müssen diese manuell mit Schlagwörtern/Keywords hinterlegt werden, diese Verschlagwortung ist oft nicht einheitlich, was die Suche nach einem bestimmten Thema erschwert. Jedoch ist diese Verschlagwortung oft nicht einheitlich und erschwert die Suche nach einem bestimmten Thema erheblich.
Abhilfe verschaffen Transkripte, die aber selten von den Urheber:innen zur Verfügung gestellt werden. Eine manuelle Transkription erfordert Können und Know-How und sind äußerst zeitaufwendig. Proprietäre Speech-to-Text Angebote sind für zivilgesellschaftliche Initiativen oftmals zu teuer, bestehende Open Source Lösungen sind wiederum eine Herausforderung, da diese selbst zu betreiben sehr kompliziert ist.
Die Lösung – Open AudioSearch
Open AudioSearch (OAS) ist eine Open Source Speech-to-Text-Engine, die gesprochene Sprache in Text umwandelt und das Durchsuchen von audiovisuellen Inhalten ermöglicht. Sie ist Voraussetzung für den Betrieb automatisierter Recommender- und Verschlagwortungssysteme. Mit NLP (Natural Language Processing) können Transkripte erzeugt und bestimmte Informationen extrahiert werden, die wiederum in einer Search Engine indiziert und im Abgleich mit Knowledge-Bases automatisiert verschlagwortet werden oder als Suchergebnis oder Recommendation angezeigt werden können. Fertige Pakete werden zur einfachen Selbstinstallation als Open Source bereitgestellt.
Open AudioSearch ist ein Projekt des Cultural Broadcasting Archives in Zusammenarbeit mit arso.xyz und data4good der Vienna Data Science Group.