Madeira Search

Für die investigative Recherche zum Steuerparadies Madeira mussten tausenden Dokumente heruntergeladen und durchsuchbar (OCR) gemacht werden. Die Suchmaschine ermöglicht es die knapp 20.000 Seiten nach bekannten Firmen und Persönlichkeiten zu durchsuchen. Ein API-Endpunkt ermöglich eine systematische Suche und ein regelmäßiges Aktualisieren der Dokumente. Die Suche baut auf der Elasticsearch-Engine auf.

  • Suchmaschine
  • Text Mining, OCR, Backend
  • Bayerischer Rundfunk
  • November 2016

Links zum Projekt