Transkriber oder Transkribus? Warum der Unterschied entscheidend ist

Wer beginnt, sich mit der Erschließung historischer Handschriften zu befassen, stößt früh auf Transkribus. Das ist kein Zufall. Die europäische Plattform, ursprünglich als Forschungsprojekt der Universität Innsbruck entwickelt und mittlerweile von der READ-COOP betrieben, ist seit Jahren der Standard, wenn es um die maschinelle Erkennung historischer Schriften geht. Ihr bekanntestes Modell für deutsche Handschriften, der sogenannte German Giant 1, ist auf Millionen Seiten historischer Kurrent- und Sütterlin-Texte trainiert worden. Das ist eine ernsthafte Leistung, die ernsthafte Anerkennung verdient.

Und dennoch ist Transkribus für viele Menschen, die ein Familienarchiv oder einen Unternehmensbestand erschließen wollen, das falsche Werkzeug. Nicht weil es schlecht ist. Sondern weil es die falsche Frage beantwortet.

Was Transkribus tut — und was es nicht tut

Transkribus ist ein Transkriptions-Werkzeug. Es nimmt ein Bild entgegen und gibt Text zurück. Der German Giant 1 tut das für historische deutsche Handschriften mit bemerkenswerter Präzision: Er erkennt Buchstaben, rekonstruiert Wörter, liefert eine Lesefassung. Für Institutionen, Archive und Wissenschaftler, die große Mengen historischer Dokumente in maschinenlesbaren Text überführen wollen, ist das genau das Richtige.

Aber was haben Sie dann? Sie haben Text. Einen langen, ungekennzeichneten, unstrukturierten Text. Sie wissen, was in Ihren Briefen steht. Sie wissen nicht, wer darin vorkommt. Sie können nicht suchen, wer wann an wen geschrieben hat. Sie können Ihrem Archiv keine Frage stellen und eine Antwort mit Quellenangabe erhalten. Sie können nicht herausfinden, ob Ihr Urgroßvater die Weltwirtschaftskrise in seinen Briefen erwähnt hat — ohne alle Briefe selbst zu lesen. Und Sie können keinen fertigen Artikel über die Familienjahre 1914 bis 1918 auf Knopfdruck generieren lassen.

Transkribus beantwortet die Frage: Was steht in diesem Dokument?
Transkriber beantwortet die Frage: Was bedeutet dieses Archiv?

Der German Giant 1 und seine Stärken

Um fair zu sein: Der German Giant 1 ist bei der reinen Zeichenerkennung gut trainierter Kurrent-Texte sehr leistungsfähig. Er wurde auf einem riesigen Korpus historischer deutscher Handschriften optimiert, und dieser spezifische Fokus zeigt sich in den Ergebnissen. Bei sauberen, gut erhaltenen Dokumenten in einheitlicher Kurrent-Handschrift liefert er zuverlässige Ergebnisse.

Allerdings hat dieser Ansatz eine systemische Grenze. Ein OCR-Modell, das auf Zeichenerkennung trainiert ist, sieht Pixel und lernt daraus Buchstaben. Es versteht nicht, was es liest. Wenn eine Stelle im Brief beschädigt ist, verwischt oder für den jeweiligen Schreiber ungewöhnlich ausgeführt wurde, fehlt dem Modell das Werkzeug, aus dem Kontext zu schließen, was dort gestanden haben könnte. Es erkennt, was visuell da ist. Was visuell fehlt, bleibt leer.

Wie Claude anders liest

Transkriber arbeitet mit Claude, dem Sprachmodell von Anthropic, das nicht primär als OCR-System entwickelt wurde, sondern als großes multimodales Sprachmodell mit Milliarden von Parametern und tiefem Sprachverständnis. Der Unterschied klingt technisch, ist aber in der Praxis spürbar.

Claude liest einen Brief nicht Buchstabe für Buchstabe. Es versteht den Satz, den Absatz, den Brief als Ganzes. Wenn eine Stelle verwischt ist, schließt Claude aus dem grammatischen Kontext, dem Thema des Briefes und dem typischen Wortschatz der Epoche, was dort gestanden haben könnte — und markiert die Stelle transparent als unsichere Lesung. Das ist kein Raten. Das ist dieselbe Strategie, die ein erfahrener Paläograph anwenden würde: das Wissen um Sprache, Zeit und Kontext zur Ergänzung des visuell Unvollständigen einsetzen.

Ein OCR-Modell erkennt Buchstaben. Ein Sprachmodell versteht Bedeutung. Für beschädigte, verwischte oder individuell ausgeprägte Handschriften ist dieser Unterschied entscheidend.

Was nach der Transkription passiert

Der eigentliche Unterschied zwischen Transkribus und Transkriber liegt aber nicht in der Transkription selbst. Er liegt in dem, was danach geschieht. Bei Transkribus endet der automatisierte Prozess mit dem transkribierten Text. Bei Transkriber beginnt er dort erst.

Jeder Brief, der durch Transkriber verarbeitet wird, durchläuft acht Erschließungsstufen. Die Transkription ist Stufe eins. Es folgen: die automatische Extraktion aller erwähnten Personen mit ihren Rollen und Kontexten, die Erfassung aller genannten Orte, die Zuordnung zu historischen Themenfeldern, die inhaltliche Interpretation des Briefes im Kontext der Epoche, die Einbettung aller Absätze als semantische Vektoren für die Volltext- und Bedeutungssuche, die Aufnahme in die Zeittafel und Konkordanz des Archivs — und schließlich die Bereitstellung für den Archiv-Chat, der Fragen in natürlicher Sprache mit Quellenangaben beantwortet.

Funktion	Transkribus	Transkriber
Kurrent / Sütterlin transkribieren	Ja	Ja
Kontextuelle Erschließung bei schwierigen Stellen	Nein	Ja
Personenregister automatisch	Nein	Ja
Ortsregister automatisch	Nein	Ja
Inhaltliche Brief-Interpretation	Nein	Ja
Volltext- und Bedeutungssuche	Eingeschränkt	Ja
Chat mit dem Archiv	Nein	Ja
Zeittafel und Konkordanz	Nein	Ja
Blog-Generator mit Originalzitaten	Nein	Ja
Handschrift-Profile pro Schreiber	Trainingsaufwand nötig	Ein Briefpaar genügt
Zielgruppe	Archive, Wissenschaft	Familien, Unternehmen, Archive

Für wen Transkribus die richtige Wahl ist

Es wäre unredlich, Transkribus pauschal schlechtzureden. Für Stadtarchive, Universitätsbibliotheken und Forschungsprojekte, die große Dokumentenmassen in maschinenlesbaren Text überführen wollen und dann eigene Auswertungsinfrastruktur aufbauen, ist Transkribus nach wie vor eine ausgereifte Lösung mit langer Betriebsgeschichte und einer aktiven Nutzer-Community. Wer technische Kompetenz mitbringt und Transkription als Rohmaterial für eigene Weiterverarbeitung braucht, findet dort ein leistungsfähiges Werkzeug.

Für alle anderen — Privatpersonen mit Familienarchiven, Familienunternehmen, die ihre Geschichte aufarbeiten wollen, Genealogen, die nicht nur wissen möchten, was in den Briefen steht, sondern was sie bedeuten — ist der Aufwand unverhältnismäßig. Transkribus hat eine Lernkurve. Es erfordert das Anlegen von Projekten, das Trainieren von Modellen auf eigene Handschriften, die manuelle Nachkorrektur von Transkriptionen. Das ist für ein Stadtarchiv mit einer Historikerstelle zumutbar. Für jemanden, der an einem Wochenende 30 Briefe seiner Großmutter erschließen will, ist es das nicht.

Die eigentliche Frage

Die Entscheidung zwischen Transkribus und Transkriber ist letztlich keine technische. Es ist eine Frage dessen, was Sie mit Ihren Dokumenten wollen. Wollen Sie wissen, was darin steht? Dann reicht Transkribus. Wollen Sie verstehen, was Ihr Archiv bedeutet — wer Ihre Vorfahren waren, wie sie die großen Ereignisse ihrer Zeit erlebt haben, welche Geschichten in den Briefen stecken, die kein Einzelner je vollständig lesen würde? Dann brauchen Sie mehr als Transkription.

Transkriber ist kein besseres Transkribus. Es ist eine andere Antwort auf eine andere Frage. Eine Frage, die die meisten Menschen, die ein altes Briefarchiv in Händen halten, eigentlich stellen: Was hat das alles zu bedeuten?

Überzeugen Sie sich selbst

15 Seiten kostenlos erschließen — Transkription, Chat, Personenregister und Blog inklusive. Keine Kreditkarte, keine Lernkurve.

Kostenlos starten Demo ansehen

Weiterführend: Ratgeber Kurrent & Sütterlin · Die digitale Familienchronik