Wir präsentieren: Dokukratie

Mit einem neuen Projekt wollen wir zentrale Dokumente der Demokratie besser zugänglich machen. Dokukratie bietet u.a. den Zugriff auf kleine Anfragen aller Bundesländer – und kann einfach weiterverwendet werden.

Mal dafür, mal dagegen: Fraktionen im Bundestag –

Ob kleine Anfragen, Dokumente aus Untersuchungsausschüssen oder Gutachten der Wissenschaftlichen Dienste – viele wichtigen Informationen des Staates sind zwar veröffentlicht, jedoch kaum auffindbar und nur schwer für Journalist:innen, Wissenschaftler:innen und Aktivist:innen weiter zu verwenden.

Das möchten wir mit einem neuen Projekt ändern: Mit Förderung durch das Medieninnovationszentrum Babelsberg haben wir Dokukratie entwickelt! Dokukratie besteht aus zwei zentralen Elementen: Eine Website, über das alle Menschen zentral auf die gesammelten Dokumente zugreifen können, sowie ein offener Scraping-Hub, auf dem die Dokumente gesammelt werden.

Über das Interface sind derzeit unter anderem sämtliche kleine Anfragen aus Bund und Ländern zugänglich. Damit füllt das Projekt zumindest einen Teil der Leerstelle, die das ehrenamtlich betriebene und im Jahr 2020 geschlossene Projekt kleineanfragen.de hinterlassen hat. Außerdem sind bei Dokukratie mehr als 3.800 Anlagen von allen Bundestag-Untersuchungsausschüssen verfügbar, darunter alle aus dem CumEx- und dem Breitscheidplatz-Untersuchungsausschuss. Auch die mehr als 10.000 Gutachten des Wissenschaftlichen Dienstes im Bundestag werden bei Dokukratie tagesaktuell gespiegelt.

Wie Dokukratie genutzt werden kann, zeigt eine Recherche von netzpolitik.org zu lückenhaften Daten von Justizbehörden, die durch die Zusammenstellung von kleinen Anfragen entstanden ist.

Offene Scraper für alle

Eine wichtige Neuerung von Dokukratie ist die Offenheit der Download-Skripte. Die Scraper, die die Dokumente von Websites der Parlamente, sammeln, sind öffentlich einsehbar auf Github. Sie können weiterverwendet und für andere Projekte angepasst werden. Vor allem aber erhoffen wir uns von der zentralen Verfügbarkeit auch, dass Probleme bei den Scrapern – ausgelöst etwa durch spontan geänderte Behördenwebsites – schnell durch mehrere Personen bemerkt und behoben werden können.

Neben den PDFs können auch nur Informationen aus der Textebene aus den Dokumenten kopiert werden. Liegt nur ein Bild vor, wird die Textebene automatisch extrahiert. Außerdem gibt es für angemeldete FragDenStaat-User eine Annotationsfunktion, sodass sie Inhalte in den Dokumenten markieren und kommentieren können. Dokumentensammlungen können auch auf anderen Seiten per Embed weiterverwendet werden.

zu Dokukratie

zum Scraper Hub

Bild des Autors

Arne Semsrott

Arne ist Journalist und Projektleiter von FragDenStaat.

E-Mail: arne.semsrott@okfn.de (PGP)

Twitter: @arnesemsrott

Bild des Autors

Stefan Wehrmeyer

Stefan gründete FragDenStaat.de im Jahr 2011. Er ist Softwareentwickler und Datenjournalist.

Wir kämpfen für eine informierte Zivilgesellschaft

Unsere Recherchen, Klagen und Kampagnen sind essentiell, um unsere Politik und Verwaltung transparenter zu machen! So können wir unsere Demokratie stärken. Daraus schlagen wir kein Profit. Im Gegenteil: Als gemeinnütziges Projekt sind wir auf Spenden angewiesen.

Bitte unterstützen Sie unsere Arbeit!

Jetzt spenden

OVG Münster: Standardmäßige Abfrage von Postanschriften über FragDenStaat unzulässig

Wichtiger Schritt für die Informationsfreiheit: Das Oberverwaltungsgericht Nordrhein-Westfalen hat heute geurteilt, dass das Innenministerium unzulässigerweise massenhaft Daten von Antragstellern über FragDenStaat abfragt. Die Praxis des Ministeriums muss sich ändern.