Der Traum vom digitalen Archiv – Anspruch und Wirklichkeit *
Der Nachlass Carl von Bach *
Projektbeschreibung *
Technische Umsetzung: Mikrofilm versus digitale Datei *
Ein Traum wird wahr? *
Die Zukunft *
Endnoten *
Der Traum vom digitalen Archiv – Anspruch und Wirklichkeit
Immer wieder und zunehmend häufiger wird der Archivar in der Benutzerbetreuung mit der Frage konfrontiert, warum die Bestände nicht über das Internet recherchierbar gemacht werden. Der Traum dieser Benutzer ist die volldigitalisierte Welt des Archivs, nicht nur eines Trägers, sondern weltweit und darüber hinaus möglichst sämtlicher Dokumenationsstellen 1 . Er möchte seine Suchanfrage dem Netz anvertrauen und daraufhin alle relevanten Dokumente angezeigt bekommen. Dies soll aber nicht nur als Fundstellenübersicht, sondern im Volltext geschehen. Derartige Hoffnungen werden von aktuellen und vielzitierten Schlagworten wie papierloses Büro, digitale Bibliotheken und Archive genährt.
Die Fehlerhaftigkeit oder zumindest Unvollkommenheit solchen Denkens wurde schon in vielen Artikeln beschrieben und zeigt sich auch immer wieder im täglichen Leben. Selbst die bereits in elektronischer Form vorliegenden Dokumente sind unmöglich in einer solchen Form zu präsentieren und zugänglich zu machen, dass das richtige und auch wichtigste Ergebnis mit einer Recherche im Internet herausgefunden werden kann. In den meisten Fällen wird der Benutzer von einer Informationsflut förmlich erschlagen. Aber auch mit dieser Flut muss er nicht unbedingt die für ihn wesentlichen Informationen erhalten. In meinem Beitrag mache ich es mir aber nicht zur Aufgabe, Recherchestrategien oder Suchmaschinen, mögliche Ergebnisse oder Fehlerhaftigkeit dieser Ergebnisse zu besprechen, sondern ich möchte an einem Beispiel die m.E. durchaus sinnvolle Nutzung dieser multimedialen Welt aufzeigen.
Der Nachlass Carl von Bach
Im Frühjahr 1999 begann im Universitätsarchiv der Technischen Universität Chemnitz ein Projekt zur Bearbeitung des Nachlasses Carl von Bach. Die Korrespondenz im Nachlass sollte verfilmt und digitalisiert werden. Die Robert Bosch Stiftung Stuttgart stellte dankenswerter Weise die für dieses Projekt benötigten finanziellen Mittel in Höhe von zunächst 93 TDM zur Verfügung.
Schon sehr lange hatte sich das Universitätsarchiv mit dem Gedanken getragen, den recht umfangreichen und inhaltsschweren Nachlass des bedeutenden Technikwissenschaftlers und Gelehrten Carl von Bach 2 zu sichern. Im Gegensatz zu manch anderen Nachlässen können wir hier glücklicherweise von einem sehr umfangreichen und breit gefächerten Nachlass ausgehen. Insgesamt umfasst er ca. 20 lfm. Archivgut. Dieses Material beinhaltet jedoch nicht nur den wissenschaftlichen Nachlass Bachs, sondern weit mehr: neben den wissenschaftlichen Arbeiten, es sind nahezu alle Manuskripte seiner Hauptwerke in den verschiedensten Auflagen vorhanden, wird auch ein umfangreicher Teil seiner privaten Hinterlassenschaft verwahrt. Darüber hinaus befindet sich im Universitätsarchiv auch der Nachlaß seines Sohnes Julius Bach. Diesem wurde testamentarisch der gesamte Schriftnachlaß seines Vaters vermacht 3 , der diesen schließlich der damaligen Technischen Hochschule Karl-Marx-Stadt neben seinem eigenen vermachte.
Besonders wertvoll am Nachlass Carl von Bachs, wenn man überhaupt eine Untergruppe herausgreifen kann, ist die überlieferte Geschäftskorrespondenz. Auf ca. 50.000 Blatt ist sowohl die eingegangene als auch die ausgegangene Korrespondenz über den Zeitraum von 1876 bis 1931 nahezu lückenlos überliefert. Wegen des Arbeits- und Forschungsschwerpunktes Bachs, der Festigkeits- und Elastizitätslehre, deren Mitbegründer er war, kam er mit den verschiedensten Vertretern aus Wissenschaft und Wirtschaft in Kontakt. Darüber hinaus war Bach sozial ein sehr engagierter Mensch, was sich ebenfalls in dieser Korrespondenz niederschlägt. Die Überlieferung ist aber, wie so viele Archivalien in den Magazinen unserer Häuser, in ihrer Erhaltung gefährdet. Insbesondere die Kopialbücher mit der ausgegangenen Korrespondenz werden nur noch in Ausnahmefällen für die Benutzung freigegeben. Besonders problematisch ist hier der Erhaltungsgrad des Schreibstoffes. Der Nachlasser hat in der Regel keine handelsübliche Tinte benutzt, sondern diese in wechselnder Zusammensetzung selbst zusammengemischt, welche nun zum Teil sehr stark verblasst. Außerdem ist das transparente Papier der Bücher nur von geringer Stabilität.
An den Anfang
Projektbeschreibung
Aus eben diesen Gründen haben wir uns im Universitätsarchiv entschieden, hier mit der Sicherung und Bearbeitung zu beginnen. 4
Um nun auf die oben angesprochenen Träume zurückzukommen: Uns schwebte nicht nur die reine Sicherung auf 35mm - Film vor, sondern die Sicherung in einer herkömmlichen, analogen ebenso wie in einer digitalen Form. 5 Diese Hybridform der Überlieferungssicherung wurde von uns gewählt, weil mehrere Zielstellungen verfolgt wurden. Zum einen sollte mit einem hochwertigen Silberhalogenidfilm eine Bestandssicherung für einen langen Zeitraum erreicht werden. Zum anderen soll es mit der digitalen Datei und einer in einem späteren Projekt erfolgenden tiefen Erschließung dieser Korrespondenz für den Benutzer möglich sein, über diesen Teilbestand nach Empfänger/ Absender, Datum und/ oder Betreff zu recherchieren und sich die Treffer als Ergebnisliste mit Links auf die entsprechenden Bilddateien anzeigen zu lassen. Die Fülle des Materials und der wertvolle Inhalt dieser Korrespondenz rechtfertigt m.E. diesen hohen zeitlichen und materiellen Aufwand. Für die Träumer einer volldigitalen Archivwelt 6 sei jedoch hier angemerkt: Für die 6 lfm Archivgut wurde nur an reiner Arbeitszeit ca. Ÿ Jahre an Vorbereitung, Betreuungsaufwand während der Verfilmung/ Digitalisierung und Nachbereitung durch Arbeitskräfte des Universitätsarchives aufgewendet. In dieser Bearbeitungszeit ist aber noch nicht die Beschreibung der einzelnen Dateien über Metadaten enthalten. Nur mit diesen ist es jedoch möglich, sich dem gewünschten Traum zu nähern und die richtige Datei zu finden. Einschränkend muss auch hier noch hinzugefügt werden, dass diese Metadaten nur eine subjektive, wenn auch nach Möglichkeit weitgehend objektivierte Angabe des Erschließenden darstellen, also keinen Anspruch auf Vollständigkeit erheben können. Eventuell hat der Erschließende gerade die Sachbetreffe nicht erfasst, die dann vom Nutzer abgefragt werden. Auch bei der Einzelblatterschließung kann der Archivar nur an das Schriftstück heranführen. Die Gefahr bei einem solchen Projekt liegt aber u.a. darin, dass ein möglicher Nutzer eines solchen elektronischen Archivs die Vollständigkeit erwartet und bei einem negativen Rechercheergebnis auf ein Fehlen der Information abhebt. Die Vollständigkeit kann nur mit dem Volltext erreicht werden, wobei auch hier quellenkritisch in jeder Hinsicht recherchiert werden muss. 7 Bei gegenwärtig ca. 3.000.000 lfm Unterlagen in den Archiven Deutschlands 8 läßt sich nach dem oben Genannten leicht ausrechnen, wie viel Zeit eine retrospektive Digitalisierung der aufbewahrten Unterlagen in Anspruch nehmen würde, ganz zu schweigen von den mit der Aufbewahrung und Vorhaltung der Daten verbundenen Kosten. 9
Allerdings sollte man davon ausgehen, dass die Unterlagen im vorliegenden Nachlaß hinsichtlich ihrer Erhaltung und Handhabung außerordentlich schwierig waren und sich der Zeitaufwand bei "normalem" Archivgut etwas minimieren würde. Trotzdem würde aber eine unendlich lange Zeit vergehen, ohne dass die in dieser Zeit entstehenden weiteren analogen Unterlagen schon eingerechnet wären. Deshalb wird man den an sich sehr schönen Traum zerschlagen und sich bei der retrospektiven Digitalisierung von Unterlagen sehr stark beschränken müssen.
Mittlerweile ist der erste Teil unseres Projektes zur Verfilmung und Digitalisierung abgeschlossen. In einem vorläufigen Resümee kann die erste Einschätzung bestätigt werden: Diese Form der Sicherung und Nutzbarmachung stellt höchste Anforderungen an den Anbieter bei der Realisierung, aber auch an das Archiv sowohl bei der Vorbereitung der Archivalien als auch bei der Nachbereitung der Daten.
An den Anfang
Technische Umsetzung: Mikrofilm versus digitale Datei
Nun möchte ich zur Beschreibung der technischen Umsetzung der Digitalisierung und Verfilmung der Korrespondenz kommen. Eigentlich hätte ich die beiden Arbeitsschritte im vorhergehenden Satz in ihrer Reihenfolge anders nennen müssen, denn wir haben uns entschieden, die Vorlagen zuerst zu verfilmen und den Scan dann von Film herstellen zu lassen. Im Rahmen der vorbereitenden Gespräche wurden wir von den verschiedensten Firmen immer wieder gefragt, ob wir nicht den umgekehrten Weg gehen wollen. Die Scans würden mit Sicherheit besser werden als über den Umweg des Films, und im Bedarfsfall könnten sogar Farbaufnahmen gemacht werden. Diese so entstehenden digitalen Daten könnten dann im sogenannten COM-Verfahren auf Film problemlos ausbelichtet werden. Wir haben uns aber bewusst gegen diesen Weg entschieden, da die Auflösung auf dem Film höher ist, als die der Scans. Man könnte dem entgegenhalten, dass auch schon heute ein Scan die gleiche Auflösung haben kann. Unsere Erwiderung: im Prinzip ja, aber mit welchem Aufwand! Es würden riesige Datengrößen entstehen, die bei der zu erwartenden Menge an Images nicht mehr zu beherrschen wären. Und schon das Öffnen einer einzigen solchen Datei würde so manches Rechnersystem hoffnungslos überfordern. Da der Film aber für die Langzeitarchivierung gedacht ist, müßten wir mit dem COM-Verfahren bei den ökonomisch notwendigen geringeren Auflösungen unentschuldbare Datenverluste hinnehmen. 10 Wir haben uns auch gegen die Variante des zweimaligen Durchlaufens einer Film- und einer Direktscanstrecke entschieden. Zum einen sind die Vorlagen in ihrem Erhaltungszustand, wie oben schon einmal erwähnt, sehr problematisch und würden so zweimal der mechanischen Belastung ausgesetzt. Zum anderen würde damit der personelle und finanzielle Aufwand für das Projekt erhöht. Denkbar wäre in der Zukunft die Verwendung von zwei parallel laufenden Aufnahmevorgängen, um analoge und digitale Aufnahmen gleichermaßen zu fertigen.
Die Verfilmung soll an dieser Stelle nicht weiter beschrieben werden, da diese im Wesentlichen den bisher allgemein praktizierten Abläufen entspricht. Zu erwähnen wäre aber noch, dass wir auf die Einbelichtung von Blips (Bildmarkierungspunkte) und eine Aufnahmezählung gesetzt haben, um bei voranschreitender Scannertechnik in einigen Jahren automatisiert eventuell neu scannen zu können. Das bedeutet, wir sind nicht unbedingt auf die ständige Migration der Daten angewiesen, welche sowieso nur den derzeitigen technischen Stand in der Auflösung widerspiegeln. Es sollte als mögliche Option offengehalten werden, ohne schon heute entscheiden zu müssen, ob wir diese dann auch wahrnehmen bzw. ob sich dies überhaupt als notwendig erweist. Die Entscheidung wurde noch dadurch befördert, dass der Mehraufwand bei der Kalkulation der ausführenden Firma keine nennenswerten finanziellen Auswirkungen hatte. In der Vorbereitung der Archivalien für die Verfilmung hatten wir einen vorher nicht so kalkulierten Aufwand zu bewältigen. Wegen der eingangs erwähnten starken Bestandsschäden hielten wir eine blattweise Aufnahme und Dokumentation der Schäden für notwendig. Diese Schadenslisten bekam der Anbieter zusammen mit dem zu verfilmenden Material. 11 Auf Grund dieser genauen Dokumentation verzichteten wir auf die eigentlich lt. DIN-Norm geforderten Bildzeichen zur Kennzeichnung von schlecht lesbaren bzw. beschädigten Seiten. Ein solches Vorgehen hätte bei diesem Bestand nahezu eine Verdoppelung der Aufnahmen bedeutet.
Daneben wurde bereits im Archiv während dieser Schadensaufnahme eine Paginierung vorgenommen. Allerdings hatten wir blattweise paginiert. Für eine herkömmliche Nutzung ist das auch ausreichend, da Vorder- und Rückseite physisch fest miteinander verbunden sind. Elektronische Daten sind aber entmaterialisiert und alle Dateien existieren unabhängig voneinander im System. Der Zusammenhang der produzierten Images kann nur über eine entsprechende Retrievel-Software hergestellt werden. Aus unserer heutigen Sicht wäre also bei unserer Zielstellung eine seitenweise Paginierung vorteilhafter gewesen. Mit einer solchen Verfahrensweise ist man darüber hinaus auch einfacher in der Lage, durch Addition der einzelnen Seitenzahlen zur anschließenden Dateikontrolle die Gesamtzahl der zu erstellenden Images zu ermitteln.
Im zweiten Teil dieses Projektes wurden unter Produktionsbedingungen in einem Graustufenscanverfahren mit einer Auflösung von 400 dpi die Filmaufnahmen digitalisiert.
An den Anfang
Ein Traum wird wahr?
Schon bei der Planung war uns klar, dass hier der größte Schwierigkeitsgrad bestand. Deshalb wählten wir nach der Bereitstellung der finanziellen Mittel in Höhe von 93.000 DM durch die Bosch-Stiftung ein sehr aufwendiges Ausschreibungsverfahren. Als Bestandteil des Angebotes sollte jede der anbietenden Firmen eine Probeverfilmung und Probedigitalisierung nach von uns vorgegebenen und einheitlichen Mustern fertigen. Damit sollte die Qualität der Scans einer genauen Prüfung unterzogen werden. Als Muster wurden sowohl Vorlagen der ausgegangenen Korrespondenz, auf sehr dünnem Durchschlagpapier in Copialbüchern überliefert, als auch der eingegangenen Korrespondenz der unterschiedlichen Formate, Beschreibstoffe und Farbe ausgewählt. Da jeder Firma die gleichen Muster für die Anfertigung der Proben für jeweils eine Woche zur Verfügung gestellt wurden, ergab sich schon hieraus eine recht lange Laufzeit der Ausschreibung mit einem gewissen Risiko für die überlassenen Materialien. Wegen des Risikos entschieden wir uns für ein nichtoffenes Verfahren, um die Anzahl der teilnehmenden Bieter von vornherein zu begrenzen. Erfreulicherweise brauchten wir keine fachliche Auswahl der Bieter zu treffen, die mit Sicherheit sehr schwer gefallen wäre, da sich offensichtlich nicht viele Firmen beteiligen wollten und einige wegen formaler Mängel der Beteiligungsmeldung keine Berücksichtigung finden konnten. So blieben schließlich 8 Firmen übrig, die am Ausschreibungsverfahren teilnahmen und auch die Musterverfilmung bzw. -digitalisierung angingen. Von der Ausschreibung im Sächsischen Ausschreibungsblatt am 19.06.1998 bis zur Erteilung des Zuschlags am 10.11. vergingen fast fünf Monate.
In der Ausschreibung wurden für die Leistungsbeschreibung zur Digitalisierung folgende Bedingungen genannt:
- Die Digitalisierung erfolgt vom Mikrofilm.
- Die Digitalisierung ist in Graustufen mit einer Auflösung von 400 dpi, bei einer Farbtiefe von 256 Graustufen vorzunehmen.
- Für die Rohdaten ist eine Ausgabe im Dateiformat TIFF unter Verwendung der Komprimierung LZW vorzunehmen. Es sind zwei Sätze CD-ROM gemäß ISO 9660, zu brennen, wobei der erste Satz im TIFF-Format der zweite im JPEG-Format oder einem anderen platzsparenden Format vorliegen soll. Bei der Komprimierung ist darauf zu achten, daß die Lesbarkeit auch für die Benutzerversion nicht zu sehr eingeschränkt wird.
- Bei der Digitalisierung sollen die Doppelseiten getrennt und die daraus resultierenden Einzelseiten sequentiell sortiert werden.
- Eine ausführliche Beschreibung der verwendeten Rohdatenformate, die alle zum Auslesen der Daten erforderlichen Informationen enthält, ist in maschinenlesbarer Form auf jeder Medieneinheit als Textdatei mitzuspeichern.
- Die Dateinamen sollen sich an den Archivsignaturen orientieren. (Unterstützung von langen Dateinamen)
- Zum Wiederauffinden und späteren Recherchieren ist ein offenes Datenbanksystem mit den Metadaten zu jeder gescannten Datei (Mindestanforderungen: Bestandsbezeichnung, genaue Signatur, Dateiname, Verweis auf CD-ROM, Absender, Empfänger, Datum, Betreff) aufzubauen.
Die Digitalisierung in Graustufen wurde verlangt, da die Vorlagen zum Teil schon im Original sehr schlecht lesbar sind und eine Reduzierung der Farbtiefe auf schwarz/weiß die Lesbarkeit der Seiten und damit das Projekt insgesamt zu sehr beeinträchtigt hätten. Diese Art der Digitalisierung bereitete den Anbietern auch die meisten Schwierigkeiten. Wie oft haben wir in dieser Zeit gehört, dass eine solche Digitalisierung gar nicht möglich ist. Wahrscheinlich führten diese Schwierigkeiten dazu, dass drei der beteiligten Firmen bei Angebotsschluss keine Offerte eingereicht hatten, wobei uns nur eine der Firmen telefonisch eben diese Gründe für ihre Zurückhaltung nannte. Von den fünf abgegebenen Angeboten konnte wiederum eines nicht in die Wertung gelangen, da es nicht fristgerecht eingereicht worden war. Die verbliebenen vier unterschieden sich in der Qualität der Verfilmung nur unwesentlich, zeigten jedoch erhebliche Unterschiede bei den digitalen Mustern. Lediglich das Angebot von Herrmann & Kraemer Garmisch-Partenkirchen erfüllte unsere hochgesteckten Erwartungen. Auch der Preis von ca. 90 TDM blieb innerhalb der von der Stiftung bewilligten Mittel. Die eingereichten Proben waren aber unter quasi labormäßigen Bedingungen entstanden. Der Anbieter hatte ausreichend Zeit zur Verfügung und auch nur eine überschaubare Anzahl von Proben zu fertigen. Mit der Auftragsvergabe galt es, den Labortest unter Produktionsbedingungen zu bestätigen.
Die gelieferten Scans haben schließlich die Proben bestätigt, auch wenn alles nicht ganz so glatt ging, wie ursprünglich gedacht. 12 Die Kalkulation des Preises ging von einer zügigen Realisierung innerhalb von 10 Wochen beginnend mit der 1. Kalenderwoche des Jahres 1999 aus. Die Vorlagen stellten sich dann aber beim Verfilmen als außerordentlich schwierig heraus, so dass schon hier mehr Zeit benötigt wurde, als geplant.
Beim Verfilmen erwies sich die große Rückenstärke der erwähnten Kopialbücher (je ca. 1000 Blatt) und die geringe mechanische Festigkeit des Papiers als besonders problematisch. Normalerweise hätte der steife Buchrücken einen relativ hohen Anpressdruck erfordert, um die Seiten plan an die Glasscheibe zu pressen. Die Seiten würden sich jedoch dadurch zu sehr statisch aufladen und nur schwierig von der Glasplatte zu lösen sein. Bei der Instabilität des Papiers wären große Schäden vorprogrammiert. Für den Anbieter war deshalb ein befriedigender Kompromiss zwischen Wirtschaftlichkeit und Schonung der Vorlagen weder mit Buchwippe noch mit Buchschwinge zu erreichen. Die relativ große Schrift gestattete jedoch eine offene Verfilmung mit manueller Seitenfixierung ohne Glasplatte. Zusätzlich hatte der Anbieter noch die Forderung zu erfüllen, dass die aufzunehmenden Seiten hinterlegt werden sollen, um ein Durchscheinen anderer Seiten zu verhindern, was wiederum zusätzliche manuelle Arbeit erforderte. Auch die eingegangene Korrespondenz war nicht so einfach zu verfilmen, da sie in allen möglichen, ständig wechselnden Formaten und unterschiedlichsten Farben überliefert ist, selbst Fotos und Postkarten innerhalb der Korrespondenz sollten mit verfilmt werden. Zur durchgängigen Informationssicherung wurde die Halbtonverfilmung gewählt. Eine ausführliche Testreihe war notwendig, um Aufnahme und Entwicklung genau aufeinander abzustimmen.
Auch das Scannen erforderte weitaus mehr Zeit. Ergänzend hierzu muß erwähnt werden, daß die auf dem Markt befindlichen Mikrofilmscanner für den Bereich der Registraturverfilmung konzipiert sind. Dort hat man es mit "Strichfilmen" zu tun. Diese sind aber kontraststeigernd, die Halbtonwiedergabe ist mittelmäßig bis mangelhaft. Diesem Trend folgten bisher auch die Mikrofilmscanner. Sie beschränkten sich auf bitonale Digitalisierungen, d. h. es gibt nur schwarze oder weiße Bildpunkte bzw. Pixel. U.a. deshalb hatte die Firma kurz vor dem Start des Projektes einen neuen Mikrofilm Scanner Proscan III der Firma Sunrise angeschafft, der aber in der Einrichtung und auch während des Betriebs einige Probleme verursachte. Die begleitende Software-Peripherie ist noch immer weitgehend auf bitonale Images ausgerichtet. So wertvolle Funktionen wie automatische Seitentrennung und Freistellen (Cropping) stehen momentan für Graustufenbilder nicht zur Verfügung, was sich mit der rasanten Entwicklung auf diesem Gebiet und den steigenden Anforderungen der Nutzer an diesen Bereich mit Sicherheit bald ändern wird. Der Dienstleister war in unserem Fall also gezwungen, eigene Lösungen zu suchen und Jobs selbst zu erstellen. Bei den Ergebnissen müssen wir nun mit Kompromissen leben. Bei der eingegangenen Korrespondenz kommt es auf Grund der unterschiedlichen Formate (von der Visitenkarte bis zum Foliobrief) und der einmal am Filmanfang getroffenen Einstellung für das automatische Scannen zu Schwärzungsabschnitten in der digitalen Datei, die das Betrachten etwas erschwert. Das heißt, mal besteht das Image zum überwiegenden Teil aus der verfilmten Seite, mal nimmt die Seite nur einen geringen Teil der Bilddatei ein. Abhilfe kann hier nur eine manuelle Nachbearbeitung schaffen, wo die relevanten Bildbereiche mit einem Bildbearbeitungsprogramm ausgeschnitten und neu abgespeichert werden. Eine erste Probe ergab, dass mit diesem Schritt eine abermalige Reduzierung der Dateigröße von etwa 40 % erreicht werden kann. Zu leisten wäre dies aber nur in dem schon erwähnten Projekt zur Tiefenerschließung der Korrespondenz.
Welchen Aufwand die Digitalisierung auch bei Einsatz eines Massenscanners darstellt, belegt die Scanzeit von fast 5 Stunden für einen Film mit 1200 Doppelseitenaufnahmen. Daran schließen sich bis zu 20 Stunden Rechenzeit an, um die Dateien gemäß den gestellten Anforderungen zu erzeugen. Außerdem mußten programmierte Jobs getestet werden. Darüber hinaus trugen allseits bekannte und gefürchtete Systemabstürze ebenfalls zu einer Projektlaufzeit bei, die erheblich von der ursprünglich geplanten abwich. Aber es war eben auch eine völlig neue Anforderung, für die erst eine Lösung geschaffen werden mußte. Insgesamt erforderte der Auftrag beim Dienstleister einen Zeitaufwand von ziemlich genau einem halben Jahr.
Die Dateien wurden vom Anbieter in zwei Formaten abgefordert. Im sogenannten Master wurde eine TIFF-Datei verlangt, die aufgrund ihrer Dateigröße (im Schnitt 6 MB) allerdings mit der derzeitigen Technik nur schwer zu handhaben ist. Das TIFF-Format ist jedoch ein Format, in dem ein verlustfreies Komprimieren bei z. Zt. relativ lange möglicher Lesbarkeit gewährleistet ist. Um diese Dateien aber handhabbar zu machen, wurden als zweites JPEG-Dateien geliefert, die eine um den Faktor 6 – 10 geringere Dateigröße aufweisen. Um die Übersichtlichkeit beim Zugang zu erleichtern, wurden die Daten aktenweise auf CD-R gebrannt, wobei natürlich so manche CD lange nicht an ihre Speichergrenze stieß. Aus diesem Grund haben wir bei den komprimierten Dateien eine relativ große Menge von ca. 200 CD-R mit einem Gesamtvolumen von ca. 65 GB zu verwalten, rein rechnerisch wäre dies auch mit der Hälfte der CD-R zu leisten gewesen. Als Speichermedium wurden bewusst Kodak Writable CD Gold verwandt, da CD-R momentan eine sehr weite Verbreitung und Normung erfahren haben. Hinzu kommt, dass auch moderne DVD-Laufwerke diesen Standard unterstützen, mithin die Daten auf diesen Trägern noch eine Weile gelesen werden können. Da die Massenspeicher in Form von Festplatten gegenwärtig eine rasante Entwicklung in Punkto Größe und Preis nehmen, gehen wir davon aus, dass in Zukunft unsere Dateien sehr preisgünstig per Festplatte zugänglich gemacht und damit sehr einfach und schnell gehandhabt werden können.
Die TIFF-Dateien verteilen sich auf ca. 900 CD-R mit einem Datenvolumen von 550 GB ein. Der Dateiname orientiert sich, wie in der Ausschreibung gefordert, an der Archivsignatur. Durch die Ausnutzung der 32bit Struktur unserer Rechnersysteme konnten lange Dateinamen verwandt werden. Um den manuellen Aufwand beim Anbieter nicht zu groß werden zu lassen, einigten wir uns auf die vollständige Signatur als ein Bestandteil des Namens. Daran anschließend wurde eine fortlaufende vierstellige, mit Nullen aufgefüllte Numerierung angefügt 13 . Somit ist gewährleistet, dass auch eine über Suchroutinen gefundene Datei später eindeutig der entsprechenden Signatur zugeordnet werden kann. Eine lediglich fortlaufende Numerierung über die gesamte Korrespondenz wurde verworfen, ebenso wie die immer wieder von vorn beginnende Numerierung für jede Akteneinheit und deren Zuordnung zu einem entsprechend gekennzeichnetem Verzeichnis, weil zu berücksichtigen war, daß elektronische Daten losgelöst vom physischen Medium existieren.
Bereits mit den komprimierten JPEG-Dateien kann gut gearbeitet werden. Ohne jede Rasterung ist eine Vergrößerung der Dokumente auf einem 17" Bildschirm und einer Bildschirmauflösung von 1024 x 768 Punkten soweit möglich, dass 20 Zeichen auf die Zeilen passen. Darüber hinaus können Kontrast und Helligkeit bei Bedarf ohne Probleme angepasst werden. Für die Bilddarstellung benutzen wir derzeit einen kostenlosen und vergleichsweise schnellen Bildbetrachter. 14
An den Anfang
Die Zukunft
Auch wenn das o.g. Erschließungsprojekt noch nicht angelaufen ist, noch nicht einmal die Mittel bewilligt sind, wird der künftige Nutzer des Briefwechsels sich vor dem Bildschirm wiederfinden. Da der Erhaltungszustand der Korrespondenz eine Vorlage im Original nicht als geboten erscheinen lässt, wird dem Benutzer ein Ersatzmedium präsentiert werden. Aber nicht der vorhandene Mikrofilm sondern die digitale Datei im JPEG-Format soll dieses Medium sein. Wie an einem herkömmlichen Filmlesegerät blättert er dann mit dem Bildbetrachtungsprogramm Seite für Seite durch die "Akten", nur mit dem Vorteil, entsprechende Vergrößerungen, Kontrast- oder Helligkeitsänderungen vornehmen zu können. Hierbei erweist es sich in diesem Stadium des bereits angedeuteten Projektes zur Erschließung und Bearbeitung des gesamten Nachlasses als Vorteil, dass die Aktensignaturen mit den CD-R übereinstimmen. Durch die Nutzung der CD-R als "Ersatzakten" sparen wir uns momentan eine teure Serverlösung. M.E. bieten momentan Jukeboxen ein schlechtes Preis-Leistungs-Verhältnis bei einer unsicheren Zukunft der CD-R. Aber auch Festplattensysteme, welche wesentlich schnellere Zugriffszeiten als die Jukeboxen gewährleisten, sind in der benötigten Größenordnung noch relativ teuer und von einem kleineren Archiv nur schwer zu finanzieren. Bei der rasanten technischen Entwicklung bin ich aber davon überzeugt, dass diese in näherer Zukunft durchaus erschwinglich sein werden.
Mit unserer Lösung können auch schon heute mit einem durchschnittlichen Rechner ohne großen Software-Aufwand die Images betrachtet und über einen preiswerten Drucker ganze Seiten oder auch Ausschnitte davon schnell ausgedruckt werden.
So richtig komfortabel wird die Nutzung allerdings erst, wenn der Bestand über eine Datenbank erschlossen und die Datensätze mit den Bilddateien verknüpft sind. Geplant ist – wie oben erwähnt – in einem sich anschließenden Projekt, den Teilbestand bis zum Einzeldokument herunter zu erschließen und in einer Datenbank zu erfassen. Neben den rein technischen Angaben zu den jeweiligen Dateien, die schon vom Anbieter in eine Access-Datenbank eingetragen wurden, sollen die entsprechend nötigen erschlossenen Metadaten der Imagedateien ergänzt werden. Die Datensätze sollen dann mit den entsprechenden Bilddaten, die auf einem separaten Server liegen, verlinkt werden. Die entstehende Datenbank wird schließlich über das Internet recherchierbar und zugänglich gemacht. Zunächst ist noch nicht daran gedacht, die Bilddateien, die ja trotz der Komprimierung sehr groß sind, ebenfalls über das Internet abrufbar zu machen. Mit der Datenbank wird es jedoch dem Benutzer möglich sein, im Bestand dieser erschlossenen Korrespondenz seine Anfrage einzugeben und Vorgänge neu zu komponieren bzw. zu rekonstruieren.
Wir hoffen als Archiv, dass wir den beschrittenen Weg für diesen Teilbestand bis zum Ende gehen können. Einschränkend muss aber abschließend gesagt werden, dass der hohe zeitliche, personelle und finanzielle Aufwand tatsächlich nur für ausgewählte Bestände geleistet werden kann. Eine genaue Bewertung ist dafür die unabdingbare Voraussetzung. Mit dem von uns avisierten Ziel kommen wir dem eingangs genannten Traum zwar näher, aber nur um Millimeter.
An den Anfang
Endnoten
1 Diesen Begriff möchte ich hier nicht weiter diskutieren. Der Unschärfe bin ich mir voll bewusst. Im hier verwendeten Sinne verstehe ich darunter alle Stellen jeglicher Trägerschaft, die über Informationen im weitesten Sinne zu den unterschiedlichsten Bereichen verfügen.
An den Anfang
2 Zum Nachlass vgl. Luther, Stephan: Der Nachlass Carl von Bachs im Universitätsarchiv der Technischen Universität Chemnitz. In: Naumann, Friedrich [Hrsg.]: Carl Julis von Bach (1847-1931). Pionier-Gestalter-Forscher-Lehrer-Visionär. Stuttgart 1998; siehe auch: http://www.tu-chemnitz.de/uni-archiv/bestaende/bach/bach.htm . In engem Zusammenwirken und regem Gedankenaustausch mit namhaften Unternehmern und Erfindern wie Robert Bosch, Paul Daimler, Rudolf Diesel, Graf Ferdinand von Zeppelin u. v. a. gelang es Bach (1847-1931), im Maschinenwesen die Kluft zwischen den Praktikern wie Redtenbacher (Karlsruhe), und den Theoretikern wie Reuleaux (Berlin) durch zielgerichtete Verbindung von Theorie und Praxis, durch experimentelle Forschung im Maschinenbau und Bauwesen zu überwinden. Zur Sicherung der wissenschaftlichen Grundlagen betrieb Bach mit Erfolg die Errichtung zweier Forschungsstätten, der Materialprüfanstalt 1884 und die des Ingenieurlabors 1895, jeweils an der Technischen Hochschule in Stuttgart, wo er mehr als 40 Jahre lehrte.
An den Anfang
3 Vgl. Testament vom 01. Januar 1919 mit dem Zusatz vom 18. Juli 1931. Das Testament wurde dem Archiv freundlicherweise durch den Enkel Bachs Herrn Dr. Rico Steinbrüchel in Kopie zur Verfügung gestellt und wurde dem Nachlaß zugeordnet. (Universitätsarchiv Technische Universität Chemnitz - im folgenden UATUC - Nachlaß Carl von Bach 302 / I / 276) Das Original befindet sich noch im Besitz von Herrn Steinbrüchel.
An den Anfang
4 Bei der Bearbeitungsplanung gingen wir von Anfang an von einer Realisierung in Teilschritten aus. Im Anschluss an das hier im Weiteren beschriebene Digitalisierungsprojekt ist die Erschließung dieser digitalisierten Korrespondenz und der Aufbau einer entsprechenden Datenbank geplant. Auch der übrige Teil des Bestandes soll verfilmt und erschlossen werden. Allerdings ist momentan nicht an eine weitere Digitalisierung gedacht. Lediglich die Pläne unnd Zeichnungen sowie die Fotos werden wahrscheinlich in diesem Sinne bearbeitet. Für diese Anschlussprojekte müssen allerdings noch weitere Projektmittel eingeworben werden.
An den Anfang
5 Als einen wesentlichen Einstieg in diese Thematik wurden von uns die von der DFG geförderten Projekte zur Digitalisierung benutzt, welche sehr ausführlich im Internet beschrieben sind. Vgl. v.a. DFG-Projekt der Landesarchivdirektion Baden-Württemberg: "Neue Möglichkeiten und Qualitäten der Zugänglichkeit zu digitalen Konversionsformen gefährdeter Archivalien und Bücher". In: http://www.lad-bw.de/digpro/index.htm und Digitalisierung gefährdeten Bibliotheks- oder Archivguts. Abschlußbericht der Arbeitsgruppe "Digitalisierung" des Unterausschusses Bestandserhaltung der Deutschen Forschungsgemeinschaft (7. Oktober 1996) In: http://www.lad-bw.de/fr-publi.htm
An den Anfang
6 Diesmal benutze ich als Archivar nicht die klassische Archivdefinition, sondern die der modernen Netzbenutzer.
An den Anfang
7 Technisch ist derzeit eine Volltexterkennung der vorliegenden Handschriften ohne jede Normierung des Textes über OCR mit einem auch nur annähernd vernünftigen Aufwand nicht zu leisten. Die Volltextrecherche muss also auch in diesem Projekt ein Traum bleiben. Und selbst wenn diese Volltextrecherche möglich sein sollte, meine ich mit Quellenkritik auch, dass vergangene Schreib- und Redeweisen, Orthographie usw. vom Benutzer beachtet werden müssen.
An den Anfang
8 Vgl. Brachmann, Botho: Archivwissenschaft. Theorieangebote und Möglichkeiten. In. Beck, Friedrich; Hempel, Wolfgang; Henning, Eckart: Archivistica docet. Beiträge zur Archivwissenschaft und ihres interdisziplinären Umfeldes. Potsdam 1999. S. 47.
An den Anfang
9 Zu den möglichen Kosten der Vorhaltung der schließlich digitalisierten Daten vgl.: Buchholz, Matthias: Archivische Vorbewertung als Instrument elektronischer Überlieferungssicherung, in: Archivische Informationssicherung im digitalen Zeitalter. Optisch-elektronische Archivierungssysteme in der Verwaltung und die Konsequenzen für kommunale Archive. Köln, Puhlheim 1999. (Archivhefte Landschaftsverband Rheinland, 33). S. 101 ff.
An den Anfang
10 Zum Vergleich dieser Möglichkeiten vgl. auch: Fiedler, Wolfram: Digitalisierung von Akten des Stadtarchivs Brandenburg a.d. Havel aus dem Bestand 1945 - 1990. In: Brandenburgische Archive. Mitteilungen aus dem Archivwesen des Landes Brandenburg 13/1999. S. 6 ff. Erstaunlicherweise kommt Fiedler u.a. zu dem Ergebnis, dass die Digitalisierung vom Mikrofilm lediglich 50 - 70 % der Kosten des umgekehrten Weges ausmachen würde.
An den Anfang
11 Diese Schadenslisten sind für die später geplante restauratorische Bearbeitung ebenfalls sehr hilfreich.
An den Anfang
12 Die im folgenden ausgeführten Schwierigkeiten und Probleme in Umsetzung und Zeitdauer legen den Schluss nahe, dass ein ähnliches Projekt kaum für diesen Preis zu haben sein wird. Zumindest für unser Projekt zahlte Herrmann & Kraemer reichlich Lehrgeld, was sich aber bei der Realisierung weiterer bezahlt machen wird.
An den Anfang
13 Die vierstellige Numerierung wurde gewählt, da in einer Akteneinheit nicht mehr als 1200 Blatt zu erwarten sind und der jeweilige Explorer die Dateien in der richtigen Reihenfolge sortieren kann. Ein Dateiname könnte so aussehen: 302_III_001_0023.jpg. Die 302 vor dem Unterstrich kennzeichnet den Nachlass Carl von Bach mit seiner Bestandsnummer, die römische 3 die geschäftliche Korrespondenz innerhalb dieses Bestandes, die 001 die Aktennummer und die letzte Zahl kennzeichnet die laufende Nummer der digitalisierten Datei.
An den Anfang