Wenn Sie in den letzten zwei Wochen auf irgendeiner Social-Media-Plattform waren, haben Sie wahrscheinlich ein Gitter aus grünen, gelben und schwarzen Quadraten gesehen. Dabei handelt es sich um das neueste Pandemiephänomen namens Wordle – ein kostenloses Online-Spiel, das den Nutzern jeden Tag ein neues Worträtsel bietet. Es wurde von Josh Wardle für seine Kreuzworträtsel-begeisterte Partnerin entwickelt. Mit Stand vom 10. Januar hat das Spiel 2,7 Millionen Spieler.
Bei Wordle haben die Spieler sechs Versuche, ein Wort mit fünf Buchstaben zu erraten. Jedes Mal, wenn sie ein Wort erraten, wird ihnen mitgeteilt, welche Buchstaben in dem Wort an der richtigen Stelle (grün) und welche an einer anderen Stelle (gelb) vorkommen. Es ist ähnlich wie das Brettspiel Mastermind, allerdings mit einem entscheidenden Unterschied. Bei Mastermind war es gleich wahrscheinlich, dass alle sechs Farben im Ziel vorkommen. Da es sich bei Wordle sowohl beim Raten als auch bei der Zielvorgabe um echte Wörter handeln muss, ist die Wahrscheinlichkeit, dass einige Buchstaben auftauchen, höher, so dass einige Ratschläge besser sind als andere.
Das führt zu einer Frage, die ich im Internet ausführlich diskutiert habe: Welches ist das beste erste Wort zum Raten? Definieren wir das „beste erste Wort“ als dasjenige, das am wahrscheinlichsten die meisten Buchstaben mit dem Zielwort gemeinsam hat. Was wir wissen müssen, ist: Wie häufig kommen die 26 Buchstaben in englischen Wörtern mit fünf Buchstaben vor? Und zwar nicht nur in irgendwelchen Wörtern mit fünf Buchstaben, sondern in solchen, die eine Chance haben, als Zielwörter aufzutauchen.
Obskure Wörter wie „nisus“ (eine geistige oder körperliche Anstrengung, um ein Ziel zu erreichen) oder „winze“ (eine Verbindung zwischen verschiedenen Ebenen einer Mine) müssen nicht berücksichtigt werden.
Ich habe eine aktuelle Studie gefunden, in der über 60.000 englische Wörter auf ihre Bekanntheit hin untersucht wurden. Diese Art von Statistik ist für Sprachforscher wie mich interessant, weil sie etwas darüber aussagt, wie leicht ein Wort verarbeitet werden kann: Im Durchschnitt werden bekanntere Wörter schneller gelesen.
Ich habe alle Wörter mit fünf Buchstaben genommen, die mindestens 50 % der untersuchten Personen kannten (wenn Sie „nisus“ oder „winze“ kannten – ich jedenfalls nicht -, dann teilen Sie dieses Kunststück mit nur 7 % der Stichprobe). Dann habe ich gezählt, wie oft jeder Buchstabe mindestens einmal in einem Wort vorkommt.
Der häufigste Buchstabe war das „e“, das in 46 % der Wörter vorkommt. Dies ist ein bekanntes Muster, das für die englische Sprache im Allgemeinen gilt. Eine bemerkenswerte Ausnahme ist George Perecs Roman A Void, der absichtlich ohne den Buchstaben „e“ geschrieben wurde. Dieses Muster wurde sogar von Sherlock Holmes in The Adventure of the Dancing Men genutzt, um eine Chiffre aus tanzenden Strichmännchen zu entschlüsseln, indem er schlussfolgerte, dass das häufigste Symbol das „e“ sein würde.
Ein Grund dafür, dass das „e“ so häufig vorkommt, ist die Einführung des stummen „e“ am Wortende im 16. Jahrhundert, das etwas über die vorangehenden Laute aussagen sollte. So wird zum Beispiel „Ton“ anders ausgesprochen als „Ton“.
Die nächsthäufigsten Buchstaben waren: „a“ (39 %), „r“ (34 %), „o“ (29 %), und „i“ und „s“ liegen gleichauf auf Platz fünf (28 %). Von diesen sechs Buchstaben hat sich ein Wort sofort als die beste Option herauskristallisiert! Wollen Sie eine besonders schlechte erste Vermutung? Versuchen Sie „whump“ (ein dumpfes, dumpfes Geräusch). Das ist so ziemlich das Schlechteste in dieser Hinsicht. Bei „arose“ ist es zwar am wahrscheinlichsten, dass die Buchstaben im Ziel vorkommen, aber möglicherweise nicht an der richtigen Stelle.
Wenn wir ein Wort suchen, bei dem die Wahrscheinlichkeit am größten ist, dass die Buchstaben an der richtigen Stelle stehen, ist die beste Option „gleichartig“ (monoton, repetitiv, uneinheitlich). Aber dabei sollten wir es nicht belassen. Wenn wir diese Ansätze zu einem Endergebnis zusammenfassen, erhalten wir ein Wort, das uns sehr bekannt vorkommt: „soare“ (ein junger Falke) – „aufgetaucht“, aber in einer strategischeren Reihenfolge.
Eine letzte Bemerkung. Während ich diesen Artikel schrieb, fand ich heraus, dass Leute in den Quellcode der Wordle-Website eingedrungen waren und die tatsächliche Liste der Wörter gefunden hatten, die als Ziele erscheinen können. Ich habe mich entschieden, diese Liste nicht zu verwenden, weil es mir mehr Spaß macht, zu versuchen, die Frage mit den verfügbaren Sprachressourcen zu beantworten. Außerdem kann sich diese Liste ändern, und ich wollte eine allgemeinere Antwort finden.
Aber nur zu Ihrer Beruhigung: Wenn ich alle oben genannten Punkte mit der Liste der „offiziellen“ Wordle-Ziele durchführe, ist „soare“ wieder einmal das beste Ergebnis. Da haben Sie es also. Was Sie nun mit den Antworten zwei bis sechs machen, bleibt Ihnen überlassen.