Open AudioSearch
Speech-to-Text Toolkit für Freie Wissensinitiativen

Open AudioSearch

Förderjahr 2020 / Project Call #15 / ProjectID: 5198

Wir sind von

  1. cba.fro.at
  2. arso.xyz (research and build tools for the decentralized preservation and exploration of information)  3. https://viennadatasciencegroup.at/data4good/ für DataScience & Zivilgesellschaft.

Wir wollen Zugang für Zivilgesellschaft zu Informationsgewinnung aus Audio in Ö schaffen. Gemeinnützige Anbieter_innen von Audio/audio-visuellen Inhalten in Österreich. Dh Pod/Videocasts von zB journalistischen Projekten, Medienarchive, Open GLAM- oder Bildungsinitiativen.

Viele lokale Ereignisse sind oft nur in zivilgesellschaftlichen Medien/öffentliche Archive dauerhaft dokumentiert, CBA enthält 110k Podcasts mit lokalen ö. Inhalten, Citizenscience stützt sich bes auf solche Quellen. OpenAudioSearch (OAS) ist eine Open Source Audio Search engine, die Speech2Txt umwandelt für das Verschlagworten und Durchsuchen von Audio&Video- Inhalten und den Betrieb von Recommender-Systemen.

Audio-Inhalte können nicht mit Suchmaschinen durchsucht werden, weil Suchmaschinen nur geschriebenen Text verstehen. Proprietäre Speech2Txt Angebote sind teuer, Open Source ("OS") Lösungen kompliziert selbst zu betreiben und erfordern Know-how. Zugang ist zivilgesellschaftlich schwer zu organisieren.

Audiofiles werden mit Speech2Txt in Transkripte umgewandelt. Mit NLP wird Information extrahiert, in einer Search Engine indiziert und als Suchergebnis oder Recommendation angezeigt. Die UI zeigt Ergebnisse im Player an der richtigen Stelle an, via API ist die Anbindung anderer Services an OAS möglich. Fertige Pakete werden z.B. via Docker zur einfachen Selbstinstallation bereitgestellt.