Wie funktioniert das Indizieren und Ranking bei Suchmaschinen?

Suchmaschinen müssen relevante Informationen der Webseiten, die sie finden, in einer Datenbank ablegen: Sie legen einen Index an; indizieren also die gefundenen Webseiten.

Darüber hinaus versuchen die Suchmaschinen herauszufinden, welche Seiten nun besonders wichtig sind. Wenn jemand Seiten mit dem Stichwort "Hund" sucht, begnügt sich die Suchmaschine nicht damit, einfach alle Seiten die sie kennt anzuzeigen, auf denen das Wort "Hund" erscheint, sondern versucht, ein sog. Ranking zu erstellen. Sie versucht zu entscheiden, welche Seiten wohl am wichtigsten sind.

Indizierung

Nicht alle Suchmaschinen indizieren den gesamten Inhalt einer Webseite. Vor allem frühere Suchmaschinen begnügten sich damit, Meta-Informationen auszulesen oder verlangten einen speziellen Abschnitt, in denen der Autor/die Autorin der Seite in Stichworten den Inhalt beschreibt.

Eine weitere Möglichkeit ist, dass von einer Webseite nur alle unterschiedlichen Wörter (meist dann nur Inhaltswörter) gespeichert werden.

Die Suchmaschine Google indiziert die Seiten komplett; sie legt also eine komplette Kopie der Seite in der eigenen Datenbank ab. Das ermöglicht es z.B. von bestimmten Webseiten alte Versionen anzusehen, die noch immer in der Datenbank von Google liegen (sog. Google-Chache).

Ranking

Es gibt eine vielzahl von Methoden, wie die Suchmaschinen versuchen, die Relevant einer Seite zu ergründen. Man kann beispielsweise analysieren, von wievielen unterschiedlichen anderen Webseiten auf diese Seite verwiesen wird. Je öfter das geschieht, desto wichtiger muss sie sein. Oder man analysiert, wieviele Wörter die Seite enthält, wann sie das letzte Mal aktualisiert wurde etc.

Oder es geht noch einfacher: Betreiber von Webseiten bezahlen die Suchmaschine schlicht dafür, dass ihre Webseite bei einer entsprechenden Suchanfrage als erste genannt wird. Immerhin ist es so, dass eine Suchmaschine normalerweise solche bezahlte Platzierungen kenntlich macht und sie so von den anderen Suchresultaten abhebt.

Bezüglich Ranking und auch Indizierung bleibt aber das Problem, dass die Suchmaschinen kaum offen legen, wie sie funktionieren. Das hat primär zwei Gründe: 1. ist das vor allem bei kommerziellen Suchmaschinen ein Geschäftsgeheimnis, das sie vor der Konkurrenz schützen soll. Und 2. müssen sich Suchmaschinenbetreiber gegen Methoden wehren, mit denen Webseitenbetreiber versuchen, ihre Webseiten durch geschickte Manipulation an eine möglichst vorteilhafte Position in den Suchresultaten zu bringen. Hier findet ein eigentliches Wettrüsten der Methoden zwischen Suchmaschinen und Suchmaschinenaustrixer statt.



Hier ein Beispiel aus Google zu sog. "Sponsored Links" (oben rechts).



Hier ein Beispiel aus Altavista; die "gesponserten Treffer" etwas subtiler gleich zu Beginn.