Was passiert bei einer Google-Suche?
Wie die Suchmaschine das Web durchpflügt und Ergebnisse individuell auf uns zuschneidet
„Kopfschmerzen Halskratzen Husten Grippe“ – „Wohnung 100 Quadratmeter Berlin Neukölln“, – mal eben schnell etwas zu „googeln“ ist aus unserem täglichen Leben und Arbeiten nicht mehr wegzudenken. 95 Prozent aller Suchanfragen in Deutschland laufen über Google.? Diese Marktbeherrschung gibt dem Unternehmen Macht. Denn welche Suchergebnisse uns in welcher Reihenfolge angezeigt werden, hat einen hohen Einfluss darauf, welche Webseiten wir besuchen und welche Informationen wir im Netz finden. Kaum jemand weiß jedoch, welche komplexen Mechanismen sich hinter jeder Suche verbergen.
Gibt man auf google.de „iPhone 6“ – den meistgesuchten Begriff 2014 – in das Suchfenster ein, durchforstet die Suchmaschine nicht das ganze Netz, sondern lediglich den sogenannten Google-Index. Dieser Index ist eine riesige Datenbank, in der so viele Webadressen wie möglich erfasst werden. Dies geschieht mithilfe von Webcrawlern. Das sind automatische Programme, die das Netz durchsuchen und Webseiten analysieren.
Die Suche beginnt also eigentlich – noch vor jeder individuellen Suchanfrage durch Nutzer – mit dem Webcrawler, der das Netz durchsucht, Webseiten analysiert und gefundene Seiten für die Suchmaschine auf den Google-Index setzt. Googles Webcrawler, die Googlebots, gelangen über Hyperlinks, also Verlinkungen zwischen Webseiten, von einer Seite zur nächsten. Theoretisch können sie alle verlinkten Websites im Internet finden. Googlebots durchsuchen täglich Milliarden von Seiten, um neue, aktualisierte oder veraltete zu finden und sie dem Google-Index hinzuzufügen. Die Crawler vermessen für Google sozusagen das Internet.
Welches Ergebnis für welchen Suchbegriff angezeigt wird und an welcher Stelle es landet, bestimmt Googles Such-Algorithmus. Grundsätzlich werden alle Ergebnisse nach Relevanz sortiert: Wird eine Seite ganz oben angezeigt, dann haben Googles Such-Algorithmen ermittelt, dass die Seite eine besonders hohe Relevanz für die Anfrage des jeweiligen Nutzers aufweist. Der wichtigste Faktor zur Messung von Relevanz ist der von Google patentierte PageRank. Dieser misst die Linkpopularität einer Webseite: Je mehr Links auf sie verweisen, desto relevanter ist sie. Je relevanter eine Webseite ist, desto höher werden ihre Verlinkungen auf andere Webseiten gewertet.
Über 200 Faktoren beeinflussen die Suche, doch die genaue Funktion des Such-Algorithmus ist geheim. Zusätzlich wird der Algorithmus ständig angepasst, wie zum Beispiel im April 2015, als Google entschied, Webseiten, die nur schlecht auf Smartphones lesbar sind, im Ranking abzustrafen. Jedes Suchergebnis resultiert aus einer komplexen Kartierung, Indexierung und Gewichtung. Ein geheimer und hochkomplexer Prozess entscheidet also, welche Informationen für welche Suchanfrage am relevantesten sind.
Seit Dezember 2009 schneidet Google Suchergebnisse individuell auf Nutzer zu. Die Suchmaschine berücksichtigt dabei den Standort des jeweiligen Nutzers, aber auch dessen Browsing- und Such-Historie, also den Verlauf gesuchter und besuchter Webseiten. Das gilt auch für Nutzer, die nicht bei Googles Diensten wie Gmail angemeldet sind: Bei jeder Suche werden Informationen über diese Anfrage und die besuchten Seiten an Google gesendet und gespeichert. Dies geschieht mithilfe von Cookies und Cookie-ähnlichen Verfahren, die den Browser eines Nutzers über einen längeren Zeitraum eindeutig identifizieren können. Cookies sind kleine Textdateien, die beim Besuch einer Seite auf dem Rechner gespeichert werden. Diese personalisierte Suche lässt sich allerdings abschalten – und zwar von Nutzern mit und ohne Google-Konto. Google-Kunden können sich für die Suche ausloggen, sie also ein Stück weit entpersonalisieren, und Nutzer ohne Google-Konto können die Anpassung der Suchergebnisse unter http://google.com/history/optout deaktivieren.
Wenn man den privaten Surfmodus des Browsers oder zusätzliche Browser-Erweiterungen einstellt, kann man Cookies, die sonst auf dem Rechner gespeichert werden, blockieren. Vollkommen unsichtbar ist man bei der Google-Suche allerdings nie.