Dienstag, 29. November 2011

29. Nov – Google's Data Centers


Ich höre seit gute eine Woche "In The Plex: How Google Thinks, Works, and Shapes Our Lives" d.h. jeden Tag wird mir die Geschichte von Google erzählt plus auch viele Details erklärt.

Nun ich bin ein großer Fan von Google und eigentlich kenne ich mich halbwegs gut mit Google aus – dennoch gibt so vieles, wo ich immer wieder nur “WOW sagen muss.

Zum Beispiel die Geschichte von Google's Rechenzentren.

Google Inc. betreibt weltweit eine Reihe von Rechenzentren, die jeweils die komplette Funktionalität der Suchmaschine enthalten. Eine Benutzeranfrage wird, gesteuert durch das Domain Name System, an das nächste Rechenzentrum geleitet und von diesem beantwortet.

Fällt ein Rechenzentrum komplett aus fällt, können die verbleibenden Rechenzentren die Last übernehmen.

Jedes Rechenzentrum besteht aus einem Computercluster. Die verwendeten Rechner sind IBM-kompatible Personal Computer, bestehen also aus preiswerten Standardkomponenten. Hier kommt das selbstentwickelte Google File System zum Einsatz, eine verteilte Architektur, bei der alle Daten mehrfach redundant auf verschiedenen Geräten gespeichert sind.

Ist einer der Rechner oder nur eine Festplatte eines Rechners ausgefallen, werden die entsprechenden Daten von einer anderen Stelle im Cluster auf einen Ersatzrechner kopiert und die ausgefallene Hardware-Komponente kann im laufenden Betrieb ausgetauscht werden, ohne dass Ausfälle entstehen. Das Gesamtsystem ist skalierbar, d. h. dass nach Bedarf weitere Rechner und Festplatten hinzugefügt werden können.

Durch Ablage der einzelnen Datenstrukturen (Indizes, Dokumentenkopien, Verzeichnisse aller Art) auf verschiedenen Rechnern und die große Anzahl verfügbarer Einzelrechner lassen sich Anfragen sehr schnell beantworten, da durch die Parallelisierung der zu erledigenden Arbeit nur ein Bruchteil der Zeit benötigt wird, die ein einzelner Rechner benötigen würde.

Praktisch beschäftigen sich bis zu 1000 Einzelrechner mit jeder Suchanfrage. Eine Antwortzeit von höchstens einer halben Sekunde wird als Richtwert angestrebt. Die schnelle Lieferung von Ergebnissen hatte auch frühzeitig zur Popularität von Google beigetragen.

Keine Kommentare:

Kommentar veröffentlichen