»Ich habe irgendwann einmal irgendwo gelesen, dass wir im Zeitalter des größten Wissensverlusts der Geschichte leben – noch nie ging so viel Wissen verloren wie heute.«1 Dieser Satz steht auch exemplarisch für das gleiche Problem im Kleinen: Ich lese heute deutlich mehr Texte als früher und kann mir doch nur einen Bruchteil davon merken. Leider ist der Bruchteil meist nicht der gesamte Inhalt, sondern nur ein Fragment dessen. Mir bleiben nicht die gesamten Texte in Erinnerung, sondern von allen Texten bleiben Fetzen hängen – etwas Einprägsames – und irgendwann fällt mir wieder einer dieser Fetzen ein und ich überlege: »Wie war das noch mal genau und wo habe ich das gelesen?« Mit etwas Glück fallen mir dann noch zwei, drei Stichworte ringsherum ein und ich kann damit so viel vom Kontext rekonstruieren, dass ich die Quelle wiederfinde … jedoch oft auch nicht.

  1. Dass wir gleichzeitig im Zeitalter des größten Wissenszuwachses der Geschichte leben, liegt allein daran, dass der Zuwachs so exorbitant groß ist, dass selbst nach Abzug des stärksten Verlusts allerzeiten immer noch wahnsinnig viel übrig bleibt. 

Aber auch abgesehen von der sich erschöpfenden Speicherkapazität meines Gedächtnisses, glaube ich, dass sich das menschliche Wissen dahingehend verändern wird, dass wir nicht mehr alle Details im Gedächtnis behalten, sondern nur die, die gerade relevant sind, und dass wir uns stattdessen ein breitgefächerteres, vielfältigeres Wissen einprägen – der Wandel vom Speziallisten zum Universalgelehrten. Die Details einer Sache wird man in künstlichen Wissensspeichern nachschlagen, wenn man sie benötigt, und das menschliche Gedächtnis speichert nur noch die Verweise auf die Einträge im externen Speicher1 – ein in der Computertechnik übliches Verfahren, dessen umfangreiche und leicht zugängliche Umsetzung für das menschliche Wissen mit der Computertechnik jetzt möglich geworden ist.

  1. Für manchen mag es danach klingen, nichts mehr lernen zu müssen, aber auch die Stichworte müssen gelernt werden und auch die sind nicht wenige … und das Erkennen und Lernen von Stichworten muss gelernt werden. Ohne Lernen wird's auch in Zukunft nicht gehen. 

Die Idee eines digitalen Gedächtnisses bewege ich schon lange im Kopf hin und her und habe überlegt, wie es seien müsste und was ich dafür brauche. Einfach muss es auf alle Fälle sein, denn jeglicher Mehraufwand reduziert bei mir die Bereitschaft zur Nutzung. Sehr viele Texte lese ich im Browser als Webseiten, weshalb mir schon die Idee eines Crawlers anhand der Historie kam. Leider genügt ein einfacher wget-Aufruf zur Wiederherstellung der gelesenen Seite nicht; die Probleme fangen bei Elementen, die ich weggeklickt habe[^](… oder mit uBlock Origin bzw. I don't care about cookies habe wegklicken lassen) an, gehen bei interaktiv mit Javascript generierten Inhalten weiter bis hin zu Anmeldungen, für die Cookies und der Aufruf mehrerer Seiten notwendig ist.

Bisher habe ich viele, mir wichtig erscheinenden Informationen auf meiner Webseite notiert, aber dies ist immer noch mit einem erheblichen Aufwand verbunden und klappt nicht ganz, wie ich mir das erträume. Aber ich habe jetzt vielleicht einen besseren Weg gefunden.

Speichern von Webseiten

Dieser Tage bin ich auf die Browser-Erweiterung Save Page WE gestoßen, mit der man Webseiten speichern kann. Dabei werden alle Ressourcen (Bilder, Style-Sheets) in eine HTML-Datei integriert, sodass am Ende eine kompakte Datei mit allen Inhalten entsteht, die notwendig sind, um die Anzeige zu reproduzieren.

Speichern kann man eine Seite durch Anklicken des Symbols in der Symbolleiste, über das Kontextmenü der Seite oder über das Tastenkürzel Alt+C (ist anpassbar). Im Idealfall brauche ich so nach dem Lesen eines Textes nur noch die Tastenkombination drücken und habe die Seite gesichert. Über das Kontextmenü lässt sich auch der Umfang der gespeicherten Daten bestimmen: dort kann man Basic, Standard und Custom wählen, wobei sich der Umfang von Custom in den Einstellungen der Erweiterungen bestimmen lässt.

Konfiguration von Save Page WE

Die Einstellungen von Save Page WE sind etwas umständlich zu finden: Am besten klickt man mit der rechten Maustaste auf das Disketten-Symbol in der Symbolleiste und wählt »Manage Extension«. Damit bekommt man die Seite für die Erweiterung und kann dort auf die drei Punkte und dann auf »Preferences« drücken.

In den Einstellungen habe ich folgende Optionen gesetzt:

Unter »File Info« habe ich das Muster !archive_%DATE(-)%_%HOST%_%PATH% festgelegt, um die Dateien im normalen Download-Ordner leicht identifizieren zu können. Durch das Ausrufezeichen werden diese Dateien immer am Anfang der Ordneransicht angezeigt und mit dem Datum kann ich grob die Speicherung zuordnen.

Mehrere Seiten auf einmal speichern

Zum einen habe ich gemerkt, dass man den Tab während eines Speichervorgans wechseln kann, sollte es einmal länger dauern. Dann kann man auch mit Strg+Klick mehrere Tabs auswählen und in einem Aufruf von Save Page WE speichern.

Wenn man eine Textdatei mit URLs oder eine HTML-Datei mit Verweisen hat, kann man diese in den Einstellungen unter »File Info« laden und im Kontextmenü des Diskettensymbols mit »Save listed URLs« speichern. Damit kann man leicht regelmäßig die gleichen Seiten speichern, damit man sie zum Beispiel offline lesen kann.

Speichern von Mozilla-Seiten

Add-ons werden aus Sicherheitsgründen auf Seiten von mozilla.org gesperrt, weshalb man diese Seiten mit Save Page WE nicht speichern kann. Als Umweg habe ich nur gefunden, dass ich die gewünschte Seite mit wget -nd … speichere, dann im Firefox die gespeicherte Seite öffne und dann mit Save Page WE speichere, damit ich die kompakte Fassung mit allen Ressourcen habe.

Steuerung über die Kommandozeile

In den Einstellungen gibt es unter »Advanced« die Option »Perform Button Action on browser startup and then close browser«. Damit könnte man über die Kommandozeile Firefox mit einer Adresse zum Archivieren aufrufen, Save Page WE speichert diese und beendet wieder den Browser. Dadurch könnte man vorhandene Anmelde-Cookies nutzen und eventuell lässt es sich auch mit der automatischen Anmeldung von KeePassXC kombinieren.

Ausprobiert habe ich es noch nicht, aber es klingt sehr gut für die Automatisierung. Gegebenenfalls muss man sich eine Kopie des Firefox-Profils erstellen, um sich nicht das Hauptprofil zu zerschießen.

Durchsuchen der gespeicherten Seiten

Die Speicherung der Seiten ist schon ein guter Anfang für das Projekt digitales Gedächtnis. Allerdings lese ich so viel, dass ich eine elektronische Unterstützung zum Durchsuchen benötigte. Hierfür ist es hilfreich, dass Save Page WE in den Dateien in meta-Feldern die vollständige URL und das Speicherdatum hinterlegt.

Ich muss jetzt nur noch ein Programm finden, dass mir für die Sammlung eine lokale Suchmaschine erstellt. Dies sollte auch machbar sein.

Notizen in Webseiten

Beim Lesen von Texten gibt es immer wieder Passagen, die wichtig sind und die man sich hervorheben will. Hierfür habe ich die Erweiterung Annotating the Web entdeckt. Damit kann man einfach einen Textabschnitt markieren, bekommt ein kleines Symbol mit einem Stift angezeigt und nach dessen Anklicken kann man im sich daraufhin öffnenden Dialog Notizen und Schlagworte hinterlegen.

Wenn man mit der Maus über die Markierung fährt, bekommt man die Notiz und die Schlagworte angezeigt und kann sie bearbeiten oder löschen. Aktuell werden diese Informationen leider im Local-Storage der Seite[^](Die Speicherung im Local-Storage hat eventuell den Vorteil, dass die Daten über Firefox-Sync auf alle Instanzen kopiert werden. Allerdings gehen diese Daten auch verloren, wenn man Cookie AutoDelete nutzt.) abgelegt, aber ich habe bereits Kontakt mit dem Entwickler aufgenommen und gefragt, ob er das ändern könnte.

Denn das praktische daran, dass Save Page WE die Seite im Istzustand speichert, ist, dass es auch die Markierung und (hoffentlich in Zukunft auch) die Anmerkungen speichert. Somit ist alles beisammen, was man beim Textlesen benötigt.

Quellensicherung

Der eingangs angesprochene Wissensverlust ist real. Der Text, den ich ansprach, war die Auswertung der Quellenbezüge einer Dissertation nach mehreren Jahren. Dabei kam heraus, dass ein erheblicher Anteil der Quellen nicht mehr verfügbar war und somit die Verweise ins Leere gingen. Für das Internet ist dies ein riesiges Problem. Projekte wie Wayback Machine, Webpage archive und andere versuchen diesem entgegenzuwirken, aber als Einzelperson kann man sich darauf nicht verlassen.

Für meine eigene Webseite ist dieses Problem bereits spürbar, denn einige Seiten, auf die ich verweise, existieren nicht mehr. Daher wird dieses digitale Gedächtnis nicht nur eine Auslagerung meines menschlichen Speichers, sondern auch eine Archivierung der Quellen, um später einmal darauf zurückgreifen zu können. Denn hätte ich die oben angesprochene Seite archiviert (und würde sie in meinem Archiv finden), könnte ich hier die konkreten Zahlen nennen. Mit etwas Glück finde ich über die Historie meines Browsers irgendwann die Seite wieder, aber für die Seiten, die gelöscht wurden, ist kein Herankommen an die Informationen mehr möglich – als ein einfaches und anschauliches Beispiel, kann man mal suchen, welche Künstler vor nicht einmal zwölf Monaten bei der Kulturarena aufgetreten sind … gut, der noch sein Programmheft hat.