Welchem Algorithmus folgen Suchmaschinen und Warum?
Geschrieben von Leo KobesWer in der Schule die vier Grundrechenarten erlernt hat, ist damit in der Lage, einfache Algorithmen praktisch anzuwenden.
Denn in der Mathematik bezeichnet der Begriff „Algorithmus“ ganz allgemein ein Verfahren, mit dem sich ein Problem zuverlässig lösen lässt.
Kann dieses automatisiert und von Maschinen durchgeführt werden, befinden wir uns bereits im Bereich der Informationstechnologie.
Unterscheidung zwischen berechenbaren und kontextabhängigen Problemen
Damit eine Maschine einen Algorithmus ausführen kann, der zu einem Ergebnis führt, müssen sowohl das Problem als auch die Lösungsschritte genau definiert werden.
Wer auf dem PC ein Korrekturprogramm installiert hat, um Textbeiträge für den eigenen Blog oder die Webseite zu überprüfen, der weiß, dass dies nicht in allen Fällen zuverlässig funktioniert. Das Programm findet Rechtschreibfehler und Buchstabendreher, falsche Artikel und grammatische Ungereimtheiten.
Es versagt regelmäßig dann, wenn zwei Alternativen nebeneinander bestehen, die beide theoretisch anwendbar sind, von denen aber nur eine im Kontext als richtig gilt. In diesem Fall handelt es sich nicht um ein konkret eingrenzbares und daher berechenbares Problem, sondern um eines, das einer Entscheidung bedarf.
Suchmaschinen-Algorithmen: das Problem der Relevanz
Wie verhält es sich dann um die Algorithmen, die von Suchmaschinen verwendet werden?
- Welchem Zweck dienen sie und
- zu welcher Aussagekraft gelangen sie?
Die erste Frage ist leicht zu beantworten: Algorithmen, wie sie von Google, Bing, Yahoo und anderen Suchmaschinen verwendet werden, sollen im Suchverlauf die für den Nutzer relevanten Websites finden und in eine geeignete Reihenfolge bringen. Wie der jeweilige Algorithmus Relevanz und Reihenfolge ermittelt, hängt von den Kriterien ab, die der Suchmaschinenbetreiber zur Lösung dieses Problems aufgestellt hat.
Im Fall von Google sollen es rund 200 Kriterien sein, die die Indexierung einer Page beeinflussen; und in der Zukunft werden es sicher nicht weniger. Das Problem, diesen Kriteriendschungel zu lichten, wird zusätzlich dadurch erschwert, dass sich die Suchmaschinenbetreiber nicht offen zu ihrer Auswahl äußern und diese zudem regelmäßig verändern.
Relevante Faktoren für den Suchmaschinen-Algorithmus
Die Entwickler von Suchmaschinen-Algorithmen haben es vornehmlich mit Problemen der Bewertung zu tun. Hierzu werden verschiedene algorithmische Berechnungen kombiniert.
Zu den bekanntesten und für die Suchmaschinenoptimierung (SEO) bedeutenden gehören der Pagerank– und der Trustrank-Algorithmus. Diese messen den Webseiten im Rahmen einer Skala Zahlenwerte zu, die ihre Linkqualität beziffern. Die Zahl der Backlinks fließt in die Berechnungen ebenso ein wie deren Relevanz und die Autorität der verweisenden Seiten.
Neben diesen OffPage-Faktoren sind zudem die OnPage-Faktoren für die Bewertung einer Website entscheidend. Dazu zählen alle Inhalte einer Seite sowie deren
- Navigation,
- Benutzerfreundlichkeit (Bounce Rate),
- Formatierung und Web-Standards,
- Keywordoptimierung
- Interne Verlinkungen
- Ladezeit
- Server Standort und Weiteres mehr.
Und so wie sich bestimmte Faktoren positiv auf die Indexierung auswirken können, gibt es auch Negativfaktoren, die durch die Algorithmen ebenfalls erfasst werden.
Das Individuum als Parameter: der Google-Algorithmus
Insgesamt handelt es sich um einen komplizierten Vorgang, bei dem viele einzelne Algorithmen zu einer Gesamtheit verknüpft werden.
Wie am Beispiel Korrekturprogramm deutlich wurde, ist ein solches System hilfreich, aber nicht fehl-los. Häufig sind kontextabhängige Entscheidungen zu treffen. Vielleicht ist dies einer der Gründe dafür, dass die Berechnungen zunehmend auf eine personalisierte Suche aufgebaut werden – neben den neuen Marketingmöglichkeiten, die sich daraus ergeben.
How Google makes improvements to its search algorithm
Im Jahr 2010 haben Studenten der Northwestern Network Group einen Weg gewählt um den Google Algorithmus tiefer zu analysieren. Dazu haben Sie sich im Prinzip eine eigene Suchmaschine entworfen und dabei den eigenen Algorithmus solange variiert bis er soweit wie möglich das Ergebnis wiederspiegelt dass die Google Ergebnisliste bringt.
Die Originalarbeit als PDF finden Sie hier: http://cobweb.ecn.purdue.edu/~ychu/publications/wi10_google.pdf
Personalisierte Suche im Algorithmus
Personalisierte Suche bedeutet dabei, dass dem Algorithmus ein Parameter „Individuum“ hinzugefügt wird.
Wer im Besitz eines Google E-Mail- und/oder Plus-Accounts ist, kann seine Suchanfragen und Ergebnisse speichern lassen. Der Google-Algorithmus kann ihm dann Suchergebnisse zuordnen, die für ihn persönlich als besonders relevant errechnet wurden. Wir sind gespannt wo sich die Reise nach 2012 hinbewegt.
Ein ähnliches Verfahren nutzen bereits Social Media wie Facebook. Darin liegt die Chance, der großen Informationsflut mitsamt allen Kommentaren im Internet zu entgehen.
Leider verbirgt sich darin aber auch die Gefahr, dass der Befehl „ Search“ nicht mehr zu neuen Informationen führt, sondern nur noch eine Anzahl Google+ Vorschläge hervorbringt, die den Blick über den eigenen Tellerrand nicht mehr ermöglichen.