Wikipedia: Computergestützte Berechnung der Vertrauenswürdigkeit

Die Idee von Luca de Alfaro (Professor für Informatik an der University of California, Santa Cruz) und B. Thomas Adler ist bestechend: Sie haben ein Programm entwickelt, mit dem sie die Glaubwürdigkeit von Wikipedia-Autor/innen und der von Ihnen verfassten Texte berechnen können – so behaupten sie jedenfalls.

Der Ansatz ist interessant, weil er sich ausschliesslich auf die in Wikipedia vorfindbaren Informationen stützt. Das entscheidende Kriterium ist die Menge an Editiervorgängen im Artikel, die den Text eines bestimmten Autoren unberührt lassen. Wenn ich einen Absatz im Wikipedia-Artikel zu Henri Dunant schreibe, der nach mehreren Änderungen des Artikels immer noch unverändert da steht, gilt der Text (und damit ich als sein Autor) als glaubwürdiger, als jener Text (und sein Autor), der sofort nach seiner Erstellung verändert wurde.

Viele Einwände können mit Fein-Tuning der Algorithmen (die im Hintergrund die Glaubwürdigkeit ermitteln) entkräftet werden: Die Berechnung kann auf Wortebene heruntergebrochen werden, und es kann wohl differenziert werden, welcher Art die nachfolgenden Veränderungen waren und von wem sie stammen (zum Beispiel immer von der gleichen Person oder von verschiedenen Personen, was stärker gewichtet würde). Klar, dass sich das System selbst verstärkt: wird mein Absatz nicht verändert, obwohl ein „glaubwürdiger“ Autor den Artikel bearbeitet hat, trägt dies zu meiner Glaubwürdigkeit bei, usw.

Diese rechnergestützte Zertifizierung bringt zwar erstaunliche Resultate zutage – und kann vermutlich auch ziemlich gut als Fingerzeig beim ersten Beurteilen eines Artikels dienen. Doch die berechnete Glaubwürdigkeit hat einen grossen Haken: sie ist inhaltsblind und weiss nichts über die Motivation. Wer in Maschinenbau sich grosse Glaubwürdigkeit beim Verfassen von Wikipedia-Artikeln erarbeitet hat, muss nicht über die entsprechendes Fachwissen in Literatur-Wissenschaften verfügen, nur weil er aus Leidenschaft gerne Gedichte liest und schreibt. Genauso ist auch ein Umkehrschluss nicht zulässig: der Maschinenbauer kann durchaus auch kompetent über Literatur schreiben. Überdies ist Motivation und sozialer Kontext nicht erfasst: Wer etwa in einen Edit-War gerät, dem wird nicht nur von der Gegenseite mangelnde Glaubwürdigkeit unterstellt. Tatsächlich fällt es den meisten schwer, in einer hitzigen Auseinandersetzung immer noch so sorgfältig wie üblich zu argumentieren und zu formulieren.

So bestechend der Versuch ist, nur mit Wikipedia eigenen Informationen Glaubwürdigkeit zu berechnen: solange die keine inhaltlich verbindlich Struktur die Sachdomänen klar trennt und der soziale Kontext der Autor/innen nicht berücksichtigt werden kann (aufgrund fehlender Modelle zum Einbezug des Kontexts in die Berechnung oder einfach, weil die Informationen dazu nicht vorhanden sind), muss die Berechnung Stückwerk bleiben – so überzeugend sie in der Demonstration der beiden Forscher auch wirkt.

Literatur:

Adler, Thomas B.; de Alfaro, Luca: A Content Driven Reputation System for the Wikipedia. In: WWW 2007, Proceedings of the 16th International World Wide Web Conference, Banff: ACM Press 2007. Verfügbar unter http://www.soe.ucsc.edu/~luca/papers/07/wikiwww2007.html (Zugriff vom 6.8.2007).

3 Gedanken zu „Wikipedia: Computergestützte Berechnung der Vertrauenswürdigkeit“

Hm, seit wann bedeutet, einen Artikel nicht zu überarbeiten, dass er glaubwürdiger ist? Ist im wissenschaftlichen Kontext das Überarbeiten des Geschriebenen nicht eher ein Indiz für Reflexion, für prozessweise Erkenntnis? Und ist der Charakter der Diskussion, der den Artikeln der Wikipedia zugrundeliegt, nicht ihr eigentliches Pfund, mit dem sie wuchern könnte?

Ja, guter Punkt. Allerdings: Wikipedia will ja eben nicht ein Ort der wissenschaftlichen Auseinandersetzung per se sein, sondern ein Ort, wo das etablierte Wissen zusammengefasst wird. Folglich ist der Ansatz konsistent mit dem Anspruch von Wikipedia: Was möglichst viele Mitarbeiter/innen überzeugt (als in diesem Sinne den aktuellen Stand des Wissens repräsentierend) und daher nicht mehr verändert werden muss = möglichst glaubwürdig.
In anderen Wikis kann das aus den von Ihnen angesprochenen Gründen nicht gleich funktionieren, sondern sogar im Gegenteil heissen: Was nicht korrigiert wird, lohnt nicht den Aufwand, darüber nachzudenken – ist also im Diskurs irrelevant.

Das ist eigentlich das, was mich an der Wikipedia bisher manchmal stört: was ist etabliertes Wissen? Rutscht für mich leicht in einen Fehler aus der Open-Source-Richtung, „Wissen“ zum „Naturstoff“ zu verklären („Wissens-Allmende“), und nicht als Schnittmenge gesellschaftlicher Diskurse zu sehen – in die ja auch die Widersprüche von Wissensdefinitionen eingehen. An der Wikipedia, an ihrer freien Editierbarkeit fasziniert doch – im Gegensatz zum Brockhaus – genau das, dass diese Widersprüche und Bewegungen sichtbar werden.

Allein zum Beispiel das Vorkommen von detaillierten Artikeln zu obskursten Subkulturen usw, die etwas von denen, die sich für diese Subkulturen interessieren, wiederspiegeln. Insofern könnten auch die Edit-Wars irgendwann ein interessantes historisches Dokument sein (Dokument jetzt durchaus komplex verstanden).

Will sagen: das nicht-etablierte Wissen, das in der Wikipedia auch gegenwärtig ist, könnte ruhig stärker zum Bestand der Wikipedia gerechnet werden.

Plattform für Geschichte und digitale Medien

Wikipedia: Computergestützte Berechnung der Vertrauenswürdigkeit

3 Gedanken zu „Wikipedia: Computergestützte Berechnung der Vertrauenswürdigkeit“

Schreibe einen Kommentar