«Bringing history online» – Googles neuester Schachzug

Anfangs Woche hat Google eine neue Initiative lanciert und will in Zukunft zusammen mit lokalen und überregionalen Zeitungen deren Bestände digitalisieren. Damit startet Google einen Frontalangriff auf die grossen Datenbankanbieter, die bereits seit langer Zeit solche Inhalte kostenpfichtig vertreiben.

Zwei grosse Unterschiede sind aber von Bedeutung: Google will die Zeitungsseiten im Originallayout belassen und zusätzlich mit einem OCR-Programm behandeln. Damit haben die Benutzer sowohl die korrekte Darstellung der Seiten als auch eine Volltextsuchmöglichkeit in diesen immensen Datenbeständen.

Zum anderen will Google nicht nur die grossen überregionalen Zeitungen digitalisieren, sondern sucht auch die Zusammenarbeit mit kleineren lokalen Blättern. Für Regionalhistoriker könnten tatsächlich goldene Zeiten anbrechen.

Ganz konkurrenzlos wird Google das Feld nicht übernehmen können. Die Österreichische Nationalbibliothek zum Beispiel hat mit ANNO ein hervorragende Referenzprojekt in diesem Segment aufgebaut. Google wird sich auf jeden Fall mit diesen Scan-Qualitäten messen müssen. Gleichzeitig wird sich mit der Google-Aktion der Druck auf ANNO und vergleichbare Projekte aber erhöhen, Features wie Volltextsuche etc. einzubauen.

Und für die grossen Datenbankanbieter könnte mit dieser neuesten Google-Offensive die Luft in Zukunft ziemlich dünn werden …

6 Gedanken zu „«Bringing history online» – Googles neuester Schachzug“

  1. ANNO ist ja alles andere als ein Vorbild: Keine OCR, auch nicht bei Antiquaschriften. Wenn man heute schon digitalisiert, sollte ein OCR-Text selbstverständlich sein.

  2. Ich finde die Scanqualität von ANNO hervorragend und auch die Ausgabemöglichkeit als PDF sehr angenehm. Mir persönlich war das in einem Forschungsprojekt, in dem ich vor einigen Jahren intensiv mit ANNO-Beständen gearbeitet hatte, wichtiger als eine Volltextsuche. Die klare URL-Struktur machte es mir zudem möglich, aus meiner Exzerptedatenbank heraus automatisiert ANNO-Abfragen zu generieren. Dank ANNO konnte ich (resp. der Schweizerische Nationalfonds) mehrere Reisen nach Budapest und Wien «einsparen». Selbstverständlich sollte OCR aber heute dabei sein, völlig einverstanden.

  3. „Und für die grossen Datenbankanbieter könnte mit dieser neuesten Google-Offensive die Luft in Zukunft ziemlich dünn werden …“

    Nicht ganz, leider. Proquest, der Anbieter der „Historical Newspapers“-Datenbank sitzt beispielsweise mit im Boot und freut sich vermutlich über viele neue pay-per-view-Nutzer.

    „Pay-Per-View – Los Angeles Times – ProQuest Archiver – Jul 26, 1899“

  4. Der Hinweis auf Proquest steht im google-Blog:

    «This effort expands on the contributions of others who’ve already begun digitizing historical newspapers. In 2006, we started working with publications like the New York Times and the Washington Post to index existing digital archives and make them searchable via the Google News Archive. Now, this effort will enable us to help you find an even greater range of material from newspapers large and small, in conjunction with partners such as ProQuest and Heritage, who’ve joined in this initiative. One of our partners, the Quebec Chronicle-Telegraph, is actually the oldest newspaper in North America‹history buffs, take note: it has been publishing continuously for more than 244 years.»

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.