Bibliotheken

Das (verteilte) Wissen der Welt

Gerichtsakte, parlamentarisches Geschehen, Momentaufnahmen aus dem Privatleben: Immer mehr Daten entstehen nur noch digital. Und analoge Daten werden zunehmend digitalisiert (siehe Google Book Search und die Digitalisierungsbestrebungen der Bibliotheken). Ein Problem ist jedoch ungelöst – das der Langzeitarchivierung. So recht weiß keiner, wie die digitalen Daten aufbewahrt werden sollen (Festplatten geben allzu gerne den Geist auf, DVDs sind überhaupt nur ein paar Jahre haltbar etc).

Da kam mir doch bitte eine Idee: Was spricht dagegen, die Digitalisierungs-Daten öffentlicher Bibliotheken auf den PCs der Welt nach dem (lange bekannten) Prinzip der verteilten Datenspeicherung dezentral zu verteilen? So in einem peer-to-peer-Verfahren als kleine, verschlüsselte Dateneinheiten von ein, zwei Megabyte, die an und für sich keinen Sinn ergeben und nicht nutzbar sind (wegen Privacy- und Urheberrechts-Bedenken), aber zusammengefügt wieder zB das Archiv der Österreichischen Nationalbibliothek ergeben.

Wenn von jeder dieser Dateneinheiten ein paar hundert idente Kopien auf verschiedenen Privatrechnern liegen, dann lässt sich sicher ausrechnen, wieviele derartige Kopien nötig sind, um einen Totalausfall statistisch ausreichend unwahrscheinlich machen. Wenn eine Kopie verschwindet (Platte kaputt etc), dann erstellt die zentrale Verwaltung der Daten eine neue Kopie auf einem anderen Rechner. So werden reduntante Kopien auf vielen, vielen Harddisks gespeichert, und diese Kopien migrieren auf immer wieder aktuellste Hardware, ohne dass die Bibliotheken ihr knappes Geld investieren müssen.

Ich glaube, die Computernutzer sehen dabei den gesellschaftlichen Mehrwert leicht ein, und stellen in ausreichender Zahl ein paar Megabyte auf der Platte zur Verfügung. Und jeder PC-Nutzer kann bestimmen, wieviel Speicherplatz er dem verteilten Wissen der Welt zugesteht.

Vielleicht wird das in den betreffenden Forscherkreisen eh schon angedacht, das weiß ich nicht. Als Idee find ich’s mal eigentlich ganz einleuchtend. Ein anderes Problem wird damit aber nicht gelöst: Wie diese Daten dann lesbar gehalten werden, sprich, wie die Daten selbst immer wieder für neuere Software-Versionen verständlich bleiben.