Websitearchivierung im Erzbistum Freiburg

28.01.2025 | Multimodale Ansätze und Konzepte

Illustration Websitearchivierung
Vor einiger Zeit haben wir darüber berichtet, dass das Erzbistum seit nunmehr einem Vierteljahrhundert mit eigenen Angeboten im Internet präsent ist. Heute wollen wir einen Blick darauf werfen, was eigentlich mit Webauftritten passiert, wenn sie in die Jahre kommen.

Die Erzdiözese Freiburg betreibt rund 500 Webseiten in seinem eigenen Content Management System. Hinzu kommen verschiedene Social-Media-Auftritte, Seiten von Verbänden oder lokalen Initiativen. Das Erzbischöfliche Archiv ist nach §6(3) KAO auch für die Archivierung dieser Inhalte zuständig. Dokumentieren diese Seiten doch meist in besonderer Weise das Wirken der Kirche vor Ort und die Vielfalt der Menschen und Projekte in den Gemeinden. Zugleich ist der Medienwandel und die Verlagerung ins Digitale eine historische Entwicklung, die sich auch in den verschiedenen Webauftritten widerspiegelt. 
 
 
 
Diese digitale Vielfalt stellt das Erzbischöfliche Archiv Freiburg jedoch vor mehrere Probleme. Zum einen ist es aufgrund der überwältigenden Menge an Material (allein der Internetauftritt des Ordinariats umfasst über 10 GB) für eine einzelne Person kaum möglich, alles manuell zu sichten und zu bewerten. Zum anderen entwickeln sich die Webtechnologien nach wie vor so rasant weiter, dass frühere Quasi-Standards wie ActiveX, Flash oder Shockwave heute de facto nicht mehr zu finden sind und auch einst sehr populäre Ajax-Frameworks wie Prototype in Kombination mit Script.aculo.us innerhalb weniger Jahre kaum noch eine Rolle in der Webprogrammierung spielen. Dies führt jedoch zu dem Problem, dass früher heruntergeladene oder gecrawlte Websites mit modernen Browsern teilweise nicht mehr fehlerfrei dargestellt werden können. Gleichzeitig beanspruchen komplette Crawls aufgrund redundanter Systemdateien einer Website schnell viel Speicherplatz. Ganz zu schweigen von den unterschiedlichen Dateitypen, die im Zweifelsfall mit heruntergeladen werden. Um dem vorzubeugen gibt es mehrere technische Strategien:
Speichern unter / Crawlen
Einmaliges oder systematisches Abspeichern von Websites und verknüpften Ressourcen.
Pro: 1:1 Kopie einer Serverantwort, alle Daten sind an einem Ort.
Contra: Heruntergeladene Dateien können veralten und in einigen Jahren nur noch schwer zu öffnen sein. Zum Teil hohe Redundanzen oder Speicheraufwand durch Systemdateien (CSS, JS, ...)
Datenbankabzug
Abspeichern der (zumeist hinter einer Website liegenden) Datenbank. Zum Beispiel zur Sicherung von eingestellten Texten.
Pro: Durchsuchbarkeit von Informationen, Überschaubarer Speicheraufwand
Contra: Design und Look&Feel der Seite wird nicht gesichert. Man benötigt einen Adminzugang zu einer Website.
Quellcodekopie/Emulation
Vollständige Kopie aller Daten, die sich auf einem Webserver befinden, einschließlich Quellcode, Datenbanken, statische Ressourcen usw.
Pro: Funktionalität bleibt voll erhalten
Contra: Wartung, Updates und Bereitstellung von Emulatoren und Browsern sind extrem aufwändig. Man benötigt einen Adminzugang zur Website.
Screenshots
Abfotografieren von Websites.
Pro: Look&Feel bleibt erhalten, Informationen teilweise durchsuchbar.
Contra: Multimediale Inhalte (Filme, Audio, ...) können nicht gespeichert werden.
Abfilmen
Filmen eines Websitebesuchs und einer beispielhaften Interaktion auf der Website.
Pro: Vor allem mediale Inhalte und sehr interaktive Websites können gesichert werden.
Contra: Inhalte selbst nicht nativ durchsuchbar. Welche Inhalte und Interaktionen werden erhalten?

Um die Vorteile der jeweiligen Strategien besser nutzen zu können, archiviert das Erzbischöfliche Archiv Websites nach dem Vier-Augen-Prinzip, wobei in der Regel eine oder häufig aber mehrere der genannten Maßnahmen zur Sicherung einer Website festgelegt werden. Dies erscheint auf den ersten Blick etwas ressourcenintensiv, ermöglicht aber die Erreichung eines der Hauptziele: Nämlich die Sicherung und langfristige Interpretierbarkeit von Webinhalten bei gleichzeitiger Vermeidung von Datenredundanzen. So reicht es beispielsweise bei Videowebsites aus, alle Videos herunterzuladen, ein Look&Feel der Seite muss im Zweifelsfall nicht gesichert werden.
 
Die ausführliche Strategie finden Sie in der Dokumentation der AUdS 2024. Ein Tagungsband erschien Anfang 2025 hier.
 
Tony Franzky
Literatur & Links
Das Erzbistum im WWW. In: Blog des Erzbischöflichen Archivs Freiburg, 27.08.2024. [online]
 
Franzky, Tony (05./06.03.2024): Multimodale Ansätze der Webarchivierung - Einblick in das Konzept des Erzbischöflichen Archivs Freiburg. 27. Tagung des Arbeitskreises Archivierung von Unterlagen aus digitalen Systemen (AUdS). [online]
 
Koller, Christian (Hrsg). (2025): Akten der 27. Tagung des Arbeitskreises Archivierung von Unterlagen aus digitalen Systemen. Tagungsband. Schweizerisches Sozialarchiv, Zürich. [online]