Zurück     Vor

3.1.4

Geschichtsdatenbanken

Der Einsatz von Datenbanken für die Geschichtswissenschaften erfreut sich zunehmender Beliebtheit. Die Sammlung und Verwaltung nicht nur bibliographischer Informationen, sondern vollständiger Quellen, die aus Text, Bild (Fotos, Bewegtbilder) und Ton (Radioaufnahmen) bestehen, läßt ein Datenbanksystem als das geeignete Werkzeug bei großen Datenbeständen erscheinen. Das Potential wohlorganisierter, systematisch abfragbarer und weltweit zugänglicher Informationssysteme, als deren Untereinheit historische Datenbanken gelten können, ist allerdings bei weitem noch nicht ausgeschöpft.

Unter einer Datenbank wird gemeinhin ein System verstanden, welches eine mehr oder weniger große Kollektion von Daten verschiedener Typen (Zahlen, Text, Bilder, Ton) computergestützt abbildet. Die Informatik unterscheidet dabei zwischen database (den in Beziehung zueinander stehenden Daten, deren Ordnung logischen Regeln folgt), database management system (derjenige Teil der Datenbanksoftware, der den Zugang zur Datenbank und die Integrität der Datenstruktur gewährleistet) und database system (der Kombination aus database, database management system und den zugrundeliegenden Hardware- und Softwareanforderungen, Dokumentation, Personal etc.). 1968 wurde das erste Datenbank Management System von IBM entwickelt, dessen theoretisches Datenmodell einer hierarchischen Struktur folgte.58 Diese lediglich für bestimmte Anwendungsgebiete geeignete hierarchische Datenabbildung wurde in den 1970er Jahren von der Entwicklung des bis heute erfolgreichsten Datenbanksystems, dem Relationenmodell, verdrängt.

Relationale Datenbank Management Systeme basieren auf der einheitlichen Organisation und Repräsentation von Werten, die in Form von Tabellen dargestellt werden können. Diese Tabellen lassen sich untereinander verketten und in Beziehung zueinander setzen (1:1, 1:n oder m:n). Jede Zeile einer Tabelle entspricht einem Datensatz, eine Spalte einem Feld. Felder können lediglich Werte gleichen Typs und gleicher Größe (bezogen auf den Speicherbedarf) enthalten (z. B. Zahlen oder Text). Die Anordnung von Daten in tabellarischer Form birgt gewisse Nachteile in sich: Erstens gestaltet sich die Verwendung nicht in das Tabellenschema passender Daten wie Bilddaten oder beliebig großer Textmengen als schwierig. Zweitens erlaubt das relativ fest gefügte Datenmodell keine im Nachhinein vorgenommenen Änderungen, ohne daß man die Gefahr des Datenverlustes oder der Dateninkonsistenz ausschließen könnte. Für diese anfänglichen Unzulänglichkeiten des RDBMS (Relationalen Datenbank Management System) sind mittlerweile verschiedene Lösungen gefunden worden, die aus Konstrukten wie den BLOBs59 oder sogenannten MEMO-Feldtypen für große Textmengen bestehen.

Eine andere grundsätzliche Beschränkung des relationalen Modells liegt in der Kompliziertheit, mit der sich bestimmte Daten, Objekte oder Ereignisse abbilden lassen. Oft ist es lediglich möglich, durch die Kombination und Verknüpfung verschiedener Tabellen ein überzeugendes Abbild der zu erfassenden Daten zu erhalten. Ebenso komplex und unübersichtlich gestaltet sich dann oftmals die Abfrage solcher Datenmengen. Die Lösung liegt in sogenannten objektorientierten Datenbanken, die einen Datensatz mithin als Objekt ganzheitlich abzubilden versuchen.60 Schneller Zugriff und damit einhergehender größerer Nutzwert einer solchen Datenbank können Vorteile bieten. Ein erheblicher Mehraufwand ist jedoch für die Erstellung eines geeigneten Datenbankmodells zu veranschlagen.61 Für die Geschichtswissenschaften ist mir kein Einsatz eines OODBMS bekannt.

Der Einsatz Relationaler Datenbankssysteme stellt also die bevorzugte Art der Informationsorganisation für historisch relevante Quellendaten dar. Seit Ende der 1980er Jahre herrscht jedoch Streit über die geeignetste Art der Datenbankanlage. Die zwei miteinander konkurrierenden Modelle heißen Quellenorientiertes Datenbankmodell und Methodenorientiertes Datenbankmodell. Dem sich eng an den in der Wirtschaft vorherrschenden Gebrauch Relationaler Datenbanksysteme anlehnenden methodenorientierten Ansatz zur Erfassung von historischen Daten warfen Kritiker wie Thaller vor, daß die mannigfaltigen und divergierenden historischen Quellendaten in ein starres Gefüge eingepaßt werden würden, ohne daß auf Besonderheiten eingegangen werden könnte.62 Als Problem gelten besonders die historischen Quellen eigenen Inkompatibilitäten wie unterschiedliche Orthographien oder Maße, Währungen und Zeitangaben, die mit den unsrigen nicht mehr übereinstimmen. Zudem wüßte der Historiker bei der Anlage der Datenbankstruktur noch nicht, welche Art von Daten ihn in den Quellen erwarten, so daß der Entwurf eines Datenmodells, der beim Methodenorientierten Modell am Anfang steht, vielfach überarbeitet oder gar im Verlauf der Erfassung verworfen werden müsse. Der Lösung, die Thaller mit dem von ihm mitentwickelten Datenbank Management System Kleio vorstellte, liegt die Überlegung zugrunde, daß die Datenerfassung vollständig von der später zu erfolgenden Organisation und Klassifikation, die Grundlage für die eigentliche Analyse sind, zu trennen sei.

Einen Eindruck über die Funktions- und Arbeitsweise des DBMS Kleio vermittelt die Arbeit von Schuh63, die die von ihr untersuchten spätmittelalterlichen Mirakelberichte zunächst hinsichtlich ihrer Struktur untersuchte, entsprechend ordnete, schließlich indizierte, durchsuchte und quantifizierte.64 Dabei führte der Weg über die für das System Kleio unabdingbare Strukturbeschreibung, die die Regeln für die Verarbeitung der Quelle enthält, hin zu den Rohdatenfiles, in denen das Datenmaterial in einer durch die Strukturbeschreibung vorgegebenen Form steht. Kennzeichnend für ein Quellenorientiertes Datenbankmodell ist somit die Trennung der Beschreibung der Quelle von dem Material der Quelle.

Eine Übersicht über solche mittels Kleio oder anderer DBMS angelegter Stand-alone-Datenbanken gibt es ebenso wenig wie ein Verzeichnis über Online-Geschichtsdatenbanken. Vielfach ist der Historiker auf den Zugriff auf Datenbanken anderer Fachgebiete (Wirtschaftswissenschaften, medizinische Datenbanken) angewiesen. Den Versuch, einen Überblick über online zugängliche Datenbanken für Historiker zu bieten, unternahm Horvarth65. Seine Übersicht enthält neben bibliographischen Datenbanken auch Volltextdatenbanken, Online-Archive, online abrufbare Lexika und sonstige Hilfsmittel. Dennoch kommt er zu dem Ergebnis, daß es explizit dem Historiker und seiner Arbeit zugedachte Datenbanken zu spezifischen Themen im WWW bisher kaum gibt.66

Letzte Änderung 11.10.1998

Zurück     Vor