Anfangs Woche hat Google eine neue Initiative lanciert und will in Zukunft zusammen mit lokalen und überregionalen Zeitungen deren Bestände digitalisieren. Damit startet Google einen Frontalangriff auf die grossen Datenbankanbieter, die bereits seit langer Zeit solche Inhalte kostenpfichtig vertreiben.
Zwei grosse Unterschiede sind aber von Bedeutung: Google will die Zeitungsseiten im Originallayout belassen und zusätzlich mit einem OCR-Programm behandeln. Damit haben die Benutzer sowohl die korrekte Darstellung der Seiten als auch eine Volltextsuchmöglichkeit in diesen immensen Datenbeständen.
Zum anderen will Google nicht nur die grossen überregionalen Zeitungen digitalisieren, sondern sucht auch die Zusammenarbeit mit kleineren lokalen Blättern. Für Regionalhistoriker könnten tatsächlich goldene Zeiten anbrechen.
Ganz konkurrenzlos wird Google das Feld nicht übernehmen können. Die Österreichische Nationalbibliothek zum Beispiel hat mit ANNO ein hervorragende Referenzprojekt in diesem Segment aufgebaut. Google wird sich auf jeden Fall mit diesen Scan-Qualitäten messen müssen. Gleichzeitig wird sich mit der Google-Aktion der Druck auf ANNO und vergleichbare Projekte aber erhöhen, Features wie Volltextsuche etc. einzubauen.
Und für die grossen Datenbankanbieter könnte mit dieser neuesten Google-Offensive die Luft in Zukunft ziemlich dünn werden …
ANNO ist ja alles andere als ein Vorbild: Keine OCR, auch nicht bei Antiquaschriften. Wenn man heute schon digitalisiert, sollte ein OCR-Text selbstverständlich sein.
Ich finde die Scanqualität von ANNO hervorragend und auch die Ausgabemöglichkeit als PDF sehr angenehm. Mir persönlich war das in einem Forschungsprojekt, in dem ich vor einigen Jahren intensiv mit ANNO-Beständen gearbeitet hatte, wichtiger als eine Volltextsuche. Die klare URL-Struktur machte es mir zudem möglich, aus meiner Exzerptedatenbank heraus automatisiert ANNO-Abfragen zu generieren. Dank ANNO konnte ich (resp. der Schweizerische Nationalfonds) mehrere Reisen nach Budapest und Wien «einsparen». Selbstverständlich sollte OCR aber heute dabei sein, völlig einverstanden.
„Und für die grossen Datenbankanbieter könnte mit dieser neuesten Google-Offensive die Luft in Zukunft ziemlich dünn werden …“
Nicht ganz, leider. Proquest, der Anbieter der „Historical Newspapers“-Datenbank sitzt beispielsweise mit im Boot und freut sich vermutlich über viele neue pay-per-view-Nutzer.
„Pay-Per-View – Los Angeles Times – ProQuest Archiver – Jul 26, 1899“
Liebe/r C.S., vielen Dank für diesen Hinweis. Wo findet man mehr zu diesem Thema …? Wäre wahrscheinlich interessant für einige unserer Leser/innen.
Der Hinweis auf Proquest steht im google-Blog:
Merci!