Spiele jetzt Wikidata

Wenn vielen Leuten schon die Mitarbeit an Wikipedia, der besten Enzyklopädie der Welt, zu nerdig ist, dürfte Wikidata, das Daten-Repository ebenderselben, von vorneweg schlechte Karten haben, stellen sich doch mutmaßlich die meisten das Verwalten von Daten als Hobby ungefähr so spannend vor wie sie den Job eines Finanzbeamten sexy finden.
Als begeisterter Wikidataianer und nur ein ganz klein wenig pedantischer Freizeitbürokrat weiß ich natürlich, dass das eine falsche Vorstellung ist. Und das kleine Mädchen in mir, das – auch weil es die Wikipedia und ihre angeschlossenen Projekte gibt – immer noch an das Gute auf der Welt glaubt, hofft, dass ein spielerischerer Umgang diesem Projekt nicht nur dadurch helfen kann, dass diejenigen, die eh schon dabei sind, noch mehr tun, sondern dass damit vielleicht auch der eine oder andere Neueinsteiger ein Auge auf Wikidata wirft und dann hängenbleibt (bevorzugterweise nicht mit dem Auge, sondern dem Geiste).

Wikidata

Screenshot WikidataSeit 2012 gibt es mit Wikidata also ein Wikipedia-Schwesterprojekt, das Daten strukturiert erfasst. Auch hier kann jeder praktisch alles bearbeiten und es entstehen am Ende freie Inhalte*, es werden aber keine von der Leber weg formulierten Texte gesammelt, sondern definierte Aussagen zu jedem Datensatz erfasst. Das macht eine komplette maschinelle Auswertung und Weiterverarbeitung möglich und erlaubt damit viele tolle Tools**.
Letztlich soll natürlich auch die Wikipedia selbst davon profitieren. Bereits quasi seit Start des Projektes ersetzt Wikidata die vorherigen Inter-Language-Links in den meisten Wikipedia-Artikeln, also diejenigen Links, die von einem deutschen Artikel auf sein englisches, sein spanisches und sein Suaheli-Pendant verweisen. Bisher enthielt tatsächlich jeder Wikipedia-Artikel diese Interwikilinks für alle Sprachen – wenn es einen Artikel in nur 50 der bald 300 Wikipedia-Sprachen gab, standen also in allen diesen 50 Artikeln die Links zu allen 49 anderen, und wenn eine neue Sprachversion dazu kam oder sich der Artikelname in einer geändert hat, mussten 50 Artikel bearbeitet werden. Das war eine nur für Bots zu bewältigende Fleißaufgabe, die zudem jede Menge Konfliktpotential bot, etwa wenn zwei der 50 Artikel sich nicht einig waren, auf welchen Artikel in der dritten Sprache nun zu verlinken sei. Mit Wikidata ist das alles wesentlich einfacher – zu jedem Subjekt gibt es genau ein Wikidata-Item, und nur das enthält die 50 Links. Ändert sich etwas, bedeutet das einen kleinen Edit bei Wikidata, und alle 50 Wikipedien erhalten automatisch den neuen Link. Aber das ist freilich nur der primitivste denkbare Anwendungsfall für Wikidata.
Die ersten Wikipedien nutzen Wikidata schon, um etwa Normdaten in Biografieartikel einzubinden (also Links zu externen Datenbanken wie dem Virtual International Authority File oder der Gemeinsamen Normdatei) oder die Suchfunktion multilingual mit Treffern aus anderen Wikipediaausgaben anzureichern. Später sollen etwa die zigtausend Stubs (kaum gepflegte Stummelartikel) zu Orten in aller Welt gerade in den kleineren Wikipedien ohne große aktive Community automatisch die aktuellen Einwohnerzahlen spendiert bekommen, ohne dass dafür wieder Bots losrennen müssen. Und auch diverse Listen sollten nicht mehr von Hand in zig Sprachen gepflegt und permanent aktualisiert werden müssen, sondern automatisiert aus Wikidata befüllt werden.

Die Bots, die vorher so intensiv mit den Interwikilinks beschäftigt werden, müssen dennoch nicht befürchten, in Zukunft obsolet zu werden. Denn bei Wikidata gibt es nun 16 Millionen Datensätze (das entspricht grob der Anzahl unterschiedlicher Themen, die die verschiedenen Sprachausgaben der Wikipedia sowie ausgewählter Schwesterprojekte wie Wikivoyage und Wikisource zusammen behandeln), die zwar strukturiert, aber zum überwiegenden Teil praktisch noch leer sind. Zu all denen müssen jetzt möglichst viele Daten erfasst werden, damit sie überhaupt sinnvoll nutzbar werden. Was ist das überhaupt – ein Mensch, ein Tier, ’ne Kirche, ein Pkw-Modell? Wieviele Einwohner hat es? Wer ist der Vater, wer der Autor, wann war der Stapellauf, welchen Identifier hat es in der Internet Movie Database?
Vieles davon können die Bots passabel aus den Infoboxen, Vorlagen und Kategorien der Wikipedia übertragen, aber an etlichen Stellen stoßen sie eben an ihre Grenzen. Dort müssen dann Menschen ran. Denen – so auch mir – kann es durchaus Spaß machen, knifflige Konstellationen aufzulösen und die Datenbasis von Wikidata wachsen zu sehen. Aber wo die immer gleiche Aufgabe immer wieder zu lösen ist und die nötigen Bearbeitungen in Wikidata ohne die passenden Tools zu Klickorgien ausarten, wenn denn überhaupt mal die Stellen gefunden wurden, an denen anzupacken ist, da kann das natürlich in etwa genau so dröge werden, wie man sich die Arbeit eines Datenverwalters so vorstellt.

Auftritt Manske

Hier kommt Magnus Manske ins Spiel. Der Biochemiker ist ein absolutes Wikipedia-Urgestein. Sein Artikel Polymerase-Kettenreaktion gilt, weil von ihm eine Version vom 12. Mai 2001 erhalten ist, inoffiziell als der erste der deutschen Wikipedia. Welcher Artikel tatsächlich der erste war, lässt sich heute nicht mehr rekonstruieren, denn in der Wikipedia-Frühzeit verfielen die Versionshistorien nach einiger Zeit. Solche technischen Unzulänglichkeiten zu lösen half Magnus entscheidend mit, denn er machte sich auch an die Entwicklung der MediaWiki-Software, auf der Wikipedia und unzählige andere Wiki-Projekte seit 2002 laufen und die damit längst eines der bedeutendsten Open-Source-Projekte ist.
Über die Jahre blieb er dem Wikimedia-Universum treu, und so ist er auch für Wikidata der wohl unstrittig wichtigste Tool-Autor. Während Wikidata an sich heute noch eine Datenbank ohne brauchbare Abfragemöglichkeit ist, entwickelte Magnus in seiner Freizeit etwa das Wikidata-Query-Tool, mit dem sich Abfragen wie „Liste alle Schriftstellerinnen auf, die zwischen 1920 und 1940 geboren wurden“ oder „…alle Städte an der Elbe“ realisieren lassen. Auch der Reasonator ist ein eindrucksvolles Tool, das die in Wikidata enthaltenen Daten für ein bestimmtes Item wesentlich weitergehender und nutzerfreundlicher präsentiert als die Wikidata-Standardoberfläche das tut, und dabei durchaus unter anderem auch schon ganze Texte aus ihnen baut.

Das Wikidata-Spiel

Screenshot Wikidata GameNun präsentiert er mit dem Wikidata Game ganz Neues*** – ein Werkzeug, das einige der oben genannten Routineaufgaben für Menschen in einen spielerischen Rahmen setzt, komplett mit Highscores, aber ohne Endgegner, Game Over und In-Game-Purchases. Drei unterschiedliche Aufgaben können die Spieler derzeit lösen und dabei ohne Suchaufwand und Plackerei mit dem Wikidata-User-Interface Wartungsaufgaben in Wikidata auf Knopfdruck erledigen: Für jeweils ein bzw. zwei mit allen verfügbaren relevanten Informationen angezeigte Wikidata-Items soll der Nutzer einfache Entscheidungen treffen: Handelt es sich um einen Menschen? Ist der Mensch ein Mann oder eine Frau? Und gehören diese beiden Items zusammengeführt, weil sie dasselbe Thema behandeln, und bloß nie jemand den ersten Interwikilink gesetzt hat?
Ohne das ganze Drumherum mit selbst in Wartungslisten wühlen, die passende Eigenschaft suchen, Warten auf das Abspeichern, usw. sind diese Aufgaben tatsächlich um einiges Kurzweiliger als zuvor, zumal man natürlich – wie bei allem was mit der Arbeit im Umfeld einer Enzyklopädie zu tun hat – ständig Neues aus dem Weltwissen lernt und obendrein noch für die Schaffung freier Informationen, die auch für alle abrufbar sind, sorgt. Und die als Spiele getarnten Tools brauchen sich auch in ihrer Funktionalität keineswegs hinter den trockenen Arbeitstools im restlichen Ökosystem verstecken.

Ich werde jedenfalls ganz sicher noch viele Stunden mit diesem Spiel verbringen und kann anderen nur raten, es auch mal auszuprobieren. Wem das dann trotzdem noch zu trocken oder zu abstrakt ist, der darf natürlich gerne auch weiterhin Flappy Bird spielen, äh, in der Wikipedia schreiben, meinte ich.


  1. * „Frei wie in Freiheit“ und nur in zweiter Linie „frei wie Freibier“
  2. ** …etwa eine raum-zeitliche Darstellung der Weltgeschichte, eine Suchmaschine für Kunstwerkedynamisch generierte Stammbäume oder einen Frag-Wikidata-Dienst, und sicherlich noch viel mehr noch völlig ungeahnte Tools. Oder auch direkt in der echten Welt, in der etwa der Google Knowledge Graph seine Daten mit denen von Wikidata abgleichen soll.
  3. *** …zumindest in der Wikidata-Welt. Für die Wikipedia haben sich die User schon diverse Spiele ausgedacht, aber die wenigsten davon involvieren die Bearbeitung der Wikipedia. Aber auch die Idee, aus einem Spiel einen echten produktiven Nutzen zu ziehen, ist natürlich nicht neu – serious gaming und gamification heißen die Stichworte.

1 Antwort

Schreib einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.