Schlagwort-Archive: programming

The Programming Historian (II)

Programming Historan

William Turkel weist in seinem Weblog  Digital History Hacks ( war Geschichtsblog des Monats März 2007) auf einen kleinen Programmier-Lehrgang für Historiker (The Programming Historian) hin (Peter Haber hatte bereits im Februar auf die Ankündigung hingewiesen). Wer sich gerne in der Programmiersprache Python versuchen und die rechnergestützte Erledigung einiger Aufgaben der wissenschaftlichen Arbeit ausprobieren möchte, soll sich den Lehrgang auf der Network in Canadian History & Environment Website einmal anschauen. Die vorgestellten programmierbaren Aufgaben umfassen unter anderem die Extraktion von Inhalten aus Web-Seiten, Auszählen von Wort-Häufigkeiten, Sammeln von Hyperlinks, Verfeinern von Suchabfragen. Wünsche für Anleitungen zu weiteren Aufgaben nehmen die Initianten nach eigener Auskunft gerne entgegen. Dafür muss man sich direkt an William J. Turkel & Alan MacEachern wenden, denn das Wiki, auf dem der Lehrgang angeboten wird, ermöglicht zur Zeit keine Anmeldungen.

Text Mining for Historians

babelblog

This summer the Center for History and New Media at George Mason University will begin work on a two-year study of the potential of text-mining tools for historical (and by extension, humanities) scholarship. The project, entitled “Scholarship in the Age of Abundance: Enhancing Historical Research With Text-Mining and Analysis Tools,” aims to determine how historians might begin to take advantage of the incredible abundance of historical content now available in on-line databases.

Many millions of original sources (texts, images, etc.) have now been placed online in these databases, but historians have yet to figure out how to work effectively with such vast quantities of information. Ironically, more and more historians are finding themselves overwhelmed by the abundance of digital sources. As a result, no one has yet figured out how to access potential new insights about the past that may lurk in these databases or in the intersections between them.

Smaller efforts, like those of programming historian Bill Turkel at the University of Western Ontario, have yielded very interesting preliminary results. The CHNM project intends to expand on work like Turkel’s and the MONK project to determine what historians need on a grander scale. Funded by the National Endowment for the Humanities, this project will include a variety of research endeavors, including focus groups with historians who will be asked to test the efficacy of various text mining methods in their research.