Farmy serwerów Google – wszystko, co musisz wiedzieć
1. Co to jest farma serwerów, data center lub serwerownia Google
Hasła takie jak „farma serwerów”, „serwerownia”, „data center” i „centrum danych” często używane są wymiennie. Domyślamy się bez większego problemu, że wszystkie mają związek z fizycznymi dyskami, ale… jaka jest dokładna definicja każdego z powyższych wyrażeń? O tym i nie tylko o tym: w tej części Steru na SEO!
1.1 Definicje
Farma serwerów – to grupa połączonych ze sobą maszyn (pełniących funkcję serwerów), które znajdują się w jednej lokalizacji. W teorii można tak nazwać nawet mały zespół urządzeń, w praktyce jednak przyjęło się, że określenie to opisuje bardzo duże zbiory. Trafne jest zatem mówienie o farmie serwerów Google’a lub Microsoftu, mniej trafne: o farmie sklepu internetowego małej firmy.
Serwerownia – to pomieszczenie, w którym znajdują się serwery. Serwerownia wymaga specjalnych warunków: odpowiedniej wilgotności powietrza, temperatury, systemu zasilania awaryjnego i tak dalej. Ogromną wagę przykłada się także do jej zabezpieczenia: zarówno przed nieautoryzowanym dostępem, jak i ogniem, zalaniem, kurzem czy… gryzoniami.
Data center, po polsku: centrum danych – to budynek, w którym znajduje się serwerownia, ale także cała obsługująca ją infrastruktura. W środku znajdziemy więc zapasowe źródła zasilania, potężne systemy chłodzące, systemy obsługi klimatyzacji, biura, centrum monitoringu i ochrony… Słowem: wszystko, co jest potrzebne, by serwerownia i znajdujące się w niej maszyny spełniały wyznaczone im zadania w sposób całkowicie kontrolowany i bezpieczny.
1.2 Centra danych Google’a – podstawowe informacje
Zanim przejdziemy do analizy rodzajów serwerów, ich wpływu na branżę SEO czy metod zabezpieczania serwerowni Google, poświęćmy chwilę na zbudowanie podstaw naszej bazy wiedzy na temat data center Google’a.
1.2.1 Lokalizacja
W tej chwili data center należące do Google’a są zlokalizowane w 16 miejscach:
Jeśli chcesz dowiedzieć się czegoś więcej o poszczególnych centrach danych Google, to nowinek dostarczy Ci nie tylko nasz blog o pozycjonowaniu i seria Ster na SEO! Na oficjalnej stronie korporacji znajdziesz informacje na temat każdego z nich. Dzięki portalowi możesz dowiedzieć się także, jak wygląda od środka farma serwerów – firma zamieszcza mnóstwo niesamowitych zdjęć!
1.2.2 Powierzchnia
Sprawdzaliśmy już, jak duże jest największe centrum danych– był to obiekt w hrabstwie Mayes w stanie Oklahoma. Jego powierzchnia równa się 91 000 metrów kwadratowym, czyli około 13 boiskom do piłki nożnej. Pozostałe data center Google’a nie mają aż tak imponujących rozmiarów, ale wciąż robią wrażenie.
Powyższe dane nie są, niestety, dokładne: Google niechętnie dzieli się informacjami na temat metrażu swoich data center, stąd wielokrotnie opieramy się na dociekaniach i obliczeniach, a nie na faktycznych danych. Co więcej, korporacja bezustannie rozwija i rozbudowuje swoje farmy serwerów, możliwe więc, że teraz są znacznie większe.
Czy wiesz, że pracownicy obsługujący farmy serwerów Google po data center poruszają się… hulajnogami i rowerami? Biorąc pod uwagę rozmiary obiektów, nie ma w tym nic dziwnego – spacer z jednego końca długiej hali na drugi zająłby kilka cennych minut!
1.2.3 Pracownicy
Ile osób pracuje przy obsłudze jednej farmy serwerów Google? To zależy od konkretnego obiektu. W stosunkowo nowym data center w Danii korporacja chciała zatrudnić pomiędzy 150 a 250 osób. Z kolei przy okazji opisywania inwestycji w stanie Oklahoma, firma chwaliła się stworzeniem aż 400 miejsc pracy – jednak dane te dotyczą zapewne osób zaangażowanych w budowę obiektu, a nie w jego obsługę.
Jeszcze w 2011 roku firma na oficjalnym portalu udostępniała przybliżone dane o liczbie pracowników zatrudnionych w data center. Mówiło się wtedy o „między 100 a 120” czy „ponad 90” osobach na jeden obiekt. Dziś informacje te nie są już publikowane. Biorąc pod uwagę stały rozwój i rozbudowę przez Google jego farm serwerów, możemy spokojnie założyć, że liczby te mogły zostać nawet podwojone.
2. Zadania farm serwerów Google
Każda usługa – generowanie wyników wyszukiwania, poczta Gmail, udostępnianie filmików na Youtube czy pliku na Dysku Google – jest dostępna dzięki farmom serwerów. Na maszynach Google działają dziesiątki typów programów – w tej części Steru na SEO, poradnika omawiającego pozycjonowanie, siłą rzeczy skupimy się na tych bezpośrednio związanych z wynikami w wyszukiwarce. Jak działa wyszukiwarka już pisaliśmy – teraz skupimy się na tych samych procesach, ale „od kuchni”.
2.1 Pięć typów serwerów związanych z wyszukiwaniem
W momencie, w którym po wpisaniu frazy w wyszukiwarkę wciskamy enter, nasze zapytanie wędruje do jednej z grup serwerów – klastra. Klaster jest wybierany przez system DNS. Tam zapytanie zostaje przejęte przez typ serwerów z oprogramowaniem GWS, czyli Google Web Server. Oprogramowanie to należy do firmy i jest wykorzystywane wyłącznie przez nią.
Jakie jest zadanie serwerów GWS? To koordynacja pracy innych maszyn w celu wygenerowania wyników, które potem ten sam serwer odeśle do użytkownika.
Pierwszy z zarządzanych przez GWS typ stanowią serwery indeksujące (index servers). Po otrzymaniu zapytania, programy przeczesują odwrócony indeks (inverted index) zapisany w odpowiedniej bazie danych. Indeks ten można sobie wyobrazić jako słownik, w którym znajdują się ułożone alfabetycznie wszystkie słowa kluczowe, jakie pojawiają się w sieci. Przy każdym takim pojedynczym haśle znajdziemy całą listę adresów do stron, na których pojawiło się dane słowo, wraz z dokładną jego lokalizacją.
Serwer indeksujący tworzy następnie docids– dokument zawierający spis identyfikatorów stron, które odpowiadają na zapytanie użytkownika. Następnym krokiem jest przesłanie go z powrotem do GWS.
Uwaga! Przedstawiony tu opis jest bardzo uproszczony – nie uwzględnia chociażby działania dziesiątek algorytmów czy PageRank, które są kluczowe dla SEO i mają wpływ na pozycje poszczególnych stron w docids.
GWS udostępnia spis identyfikatorów serwerowi dokumentów (document server). Jego zadaniem jest
- odnaleźć w odpowiedniej bazie danych strony kryjące się pod identyfikatorami,
- pobrać z nich adres, tytuł i kontekst, w jakim pojawia się słowo (na przykład fragment zdania z nim),
- stworzyć gotową listę, przypominającą już całkiem wyniki w SERP,
- przesłać listę z powrotem do GWS.
Warto zwrócić uwagę, że serwery dokumentów nie przeczesują „prawdziwej” sieci, a jej obraz zapisany w swojej bazie danych. Można powiedzieć, że na dyskach Google zapisana jest zawartości prawie całego internetu – i to nie w jednej kopii, a kilku!
W opracowaniu zapytania użytkownika biorą udział także serwery odpowiadające za poprawną pisownię (spell checker). To one odpowiadają za komunikat:
Końcowy etap przygotowania SERP to przesłanie do serwera odpowiedzialnego za reklamy (ad server) fraz wskazanych przez użytkownika. Jeśli maszyny znajdą oferty, jakie mają związek z danym zapytaniem, prześlą je do GWS.
Ostatni krok należy do Google Web Server. Otrzymane wyniki – adresy URL stron wraz z tytułami i kontekstem, reklamy i sugestię pisowni – zamienia w kod HTML, który odsyła z powrotem do użytkownika. W efekcie widzimy stronę SERP, a także dumnie prezentowaną przez Google informację o tym, że wszystkie te prace zostały wykonane w rekordowym czasie, na przykład:
2.2 Googleboty – flagowe serwery wyszukiwarki
Powyższe działania nie byłyby możliwe, gdyby nie serwery odpowiedzialne za indeksowanie stron internetowych. Popularne roboty Google, nazywane Googlebotami, skanują zawartość stron, by następnie przesłać ją do baz danych serwerów indeksujących i dokumentów. Więcej na temat robotów Google dowiesz się tutaj. Na działania „pająków Google” wpływają algorytmy oraz PageRank – nie trzeba wyjaśniać, jak ważne są one z punktów widzenia SEO.
Bazy danych dla index servers i document servers znajdują się na osobnych urządzeniach. Firma preferuje, by w ramach jednego programu działała tylko jedna kluczowa funkcja. Wyrażają to między innymi uwagi Google na temat odpowiedzialności za dane znajdujące się w Chmurze.
3. Jak Google dba o bezpieczeństwo swoich farm serwerów?
W bazach danych w data center należących do Google znajdują się nie tylko treści z witryn internetowych, tak kluczowe dla funkcjonowania wyszukiwarki i całej branży SEO. Nie zapominajmy o Chmurze, o aplikacjach dla biznesu, o Youtube, sklepie Google Apps, dziesiątkach innych usług i setkach transakcji, a także związanych z nimi wrażliwymi danymi milionów użytkowników. Taka biblioteka wymaga ochrony na najwyższym możliwym poziomie. Jak więc do zagadnienia bezpieczeństwa farm serwerów podchodzi korporacja?
3.1 Jak zabezpieczone są serwerownie Google?
Skaner oka, identyfikatory z nadrukiem 3D, systemy laserowe wykrywające włamywaczy – niektóre systemy ochrony wydają się pochodzić raczej z literatury science-fiction, niż z prawdziwego życia. Wbrew pozorom tak niesamowite metody ochrony są jak najbardziej prawdziwe i wykorzystywane do ochrony danych przechowywanych w farmach serwerów Google.
By w ogóle wejść na teren data center Google’a, trzeba najpierw znaleźć się na liście osób, którym przyznano prawo wstępu. Co ciekawe, lwia część pracowników firmy takiego zezwolenia nie ma, tak więc centra danych ogląda od środka tylko garstka wybranych. Wstępu do kompleksu chronią murowane ogrodzenia, szlabany i całodobowa ochrona strażników.
Dostęp do samej serwerowni jest strzeżony jeszcze pilniej. W zależności od obiektu, spotkamy na swojej drodze skanery identyfikatorów, systemy biometryczne rozpoznające tęczówkę oka, wykrywacze metalu, kamery termowizyjne ze sztuczną inteligencją oraz ciągłe patrole. W środku serwerowni Google’a natrafimy natomiast na systemy antywłamaniowe oparte chociażby na wiązkach laserowych.
Jednego z centrum danych chroni… aligator. W jeziorze obok obiektu w Karolinie Południowej żyje przynajmniej jeden z tych ogromnych, niebezpiecznych gadów, więc jeśli chcesz niepostrzeżenie podpłynąć pod drzwi serwerowni, zastanów się dwa razy!
3.2 Serwery Google – jak chronione są dyski twarde?
Maszyny wykorzystywane przez firmę są robione na zamówienie według ściśle określonych wytycznych. Dane producenta, który je wytwarza, są utrzymywane przez firmę w tajemnicy, a samych urządzeń nie da się nigdzie kupić. Serwery korzystają ze specjalnie zaprojektowanego systemu operacyjnego Linux. Nie znajdziemy na nim żadnego zbędnego oprogramowania, a tylko i wyłącznie kluczowe programy. Dzięki temu, kolokwialnie rzecz ujmując, na dyskach Google (prawie) nie ma się co zepsuć.
Stan każdego z serwerów w data center jest ściśle monitorowany. W przypadku usterki, dysk jest natychmiast odłączany i naprawiany bądź rozdzierany na metalowe strzępy. Jeśli masz mocne nerwy, proces ten możesz obejrzeć na poniższym filmiku:
Każda informacja jest zapisana na serwerach Google’a w kilku kopiach. Dlatego w przypadku awarii możliwe jest natychmiastowe przełączenie się do innej maszyny, a nawet do innej lokalizacji – praca wyszukiwarki nie zostaje przerwana nawet na moment. Dla dodatkowej ochrony, wszystkie dane zapisane na dyskach są domyślnie kodowane, automatycznie nadawane są im także losowe imiona. Wszystko to sprawia, że żaden człowiek nie byłby w stanie ich odczytać.
4. Serwery DNS od Google
Choć ich debiut nastąpił dekadę temu, to zainteresowanie serwerami DNS od Google nie umiera. Zwłaszcza, że często mówi się o nich w kontekście zabezpieczenia prywatności albo zwiększenia szybkości pracy w sieci. Zaczniemy jednak od podstaw i definicji.
4.1 Co to jest DNS?
Systemy DNS mają za zadanie tłumaczyć adresy stron wykorzystywane przez ludzi(www.google.com, www.sunrisesystem.pl) na formuły zrozumiałe dla maszyn, czyli adresy IP (na przykład: 64.233.160.0). Tylko tyle… i aż tyle, ponieważ jeśli z jakiegoś powodu wykorzystywany przez nas system DNS ulegnie awarii, nie da się wywołać żadnej strony poprzez tradycyjny adres www.
4.2 Darmowe serwery DNS – wady i zalety
Udostępnione w 2009 roku, bezpłatne serwery DNS Google mają proste do zapamiętania adresy: 8.8.8.8 i 8.8.4.4. Ich zaletą jest wysoka przepustowość – szanse, że taki system ulegnie przeciążeniu, są niewielkie. Zwłaszcza w porównaniu do DNS-ów dostawcy internetu. Google podkreśla również poziom zabezpieczeń swoich serwerów i ich odporność na ataki typu phishing czy DDoS.
Serwery DNS od Google nie są jednak pozbawione wad. Często podnoszona jest kwestia prywatności: darmowe usługi zwykle oznaczają, że użytkownicy płacą w nich czymś innym, niż pieniędzmi. Wiele osób obawia się, że w tym konkretnym przypadku walutą są nasze prywatne dane. Firma w polityce prywatności produktu wyjaśnia, jakie materiały przechowuje i po jakim czasie je usuwa, zapewnia także, że niemożliwe jest powiązanie zebranych informacji z konkretnym adresem IP, czyli z konkretnym użytkownikiem. Z drugiej strony, wyszukiwarka przyznaje się do zachowywania adresów wywoływanych witryn, typów żądań czy geolokalizacji, z której zostały one wysłane.
5. Zasilanie
Według informacji z 2017 roku, centra danych wszystkich firm zużywają łącznie 3% energii elektrycznej świata. Co więcej, naukowcy przewidują, że jeśli nic się nie zmieni, w 2025 roku sektor IT będzie zużywał aż 25% całej energii. Jakie miejsce zajmują w tej katastroficznej wizji serwerownie Google?
5.1 Jak farmy serwerów zużywają energię
Data center Google to nie tylko podłączone do prądu, działające 24/7 serwery.Energii elektrycznej wymagają skomplikowane systemy chłodzenia, pompy, klimatyzatory, czujniki kontrolujące parametry w pomieszczeniu, systemy ochrony… A mowa tylko o sprzęcie potrzebnym, serwerownia Google działała poprawnie
Farmy serwerów Google w 2018 roku potrzebowały około 3 gigawatów energii. To moc, której dostarczyć mogłyby 1293 elektrownie wiatrowe pracujące jednocześnie. Gdyby ustawić wiatraki obok siebie, zajęłyby 25% powierzchni Warszawy.
Pojedyncze wyszukiwanie zużywa 0,3 wata, zajmuje około 0,2 sekundy i powoduje wydzielenie do atmosfery 0,2 gramów dwutlenku węgla. Typowy użytkownik, korzystający z wyszukiwarki przez rok, pośrednio produkuje tyle dwutlenku węgla, ile pojedyncze pranie.
5.2 Google i ograniczanie zużycia prądu
Dostosowaniem takich parametrów, jak prędkość wiatraków chłodzących czy temperatura klimatyzacji zajmują się maszyny z oprogramowaniem uczącym się. To znacznie wydajniejsze rozwiązanie, niż pozostawienie takiej pracy ludziom – urządzenia mogą kontrolować naraz tysiące współczynników, a zmiany wprowadzać na bieżąco. Oddanie zarządzania w ręce maszyn pozwoliło zmniejszyć o 40% zużycie energii na chłodzenie, a o 15% – ogólnego poboru prądu w centrach danych.
Rozsądne wybieranie lokalizacji nowych data center jest kolejnym sposobem Google na ograniczenie zapotrzebowania na energię. Najklarowniejszym przykładem jest farma serwerów w Haminie w Finlandii, gdzie najwyższa roczna temperatura nie przekracza 21 stopni Celsjusza – ciągłe zimno pozwala zmniejszyć koszty chłodzenia serwerów. Lokalizowanie serwerowni w pobliżu jezior, rzek czy wreszcie mórz także ma swoje powody – to z nich pompowana jest woda ochładzająca sprzęt. Korporacja nie korzysta jednak wyłącznie z wody, stosowane są także pompy powietrzne.
5.3 Zielona Energia
Firma kupuje tyle energii odnawialnej, ile potrzebuje do działania. Nie oznacza to, że wszystkie data center są zasilane przez wiatraki i panele słoneczne – nie w każdej lokalizacji możliwe jest przełączenie się w 100% na zieloną energię. Jednak każdy kilowat pochodzący z paliw kopalnych, jaki wykorzystuje Google, jest równoważony w innym miejscu przez kilowat pochodzący z odnawialnych źródeł.
Zakup energii to sposób na inwestowanie w ekologiczne elektrownie. Umowy, jakie podpisała z nimi korporacja, opiewają już na około 5 miliardów dolarów. Pieniądze te pozwalają na rozwój całego sektora, czym firma chętnie się chwali.
5.4 Czy Chmura jest ekologiczna?
Serwery utrzymywane przez firmy, zwłaszcza te małe i średnie, wykorzystują zaledwie ułamek swojej mocy – często działa na nich zaledwie kilka programów, choć możliwości obliczeniowe maszyn pozwalałyby na działanie setek naraz. Urządzenia te muszą być jednak podłączone do prądu i nieustannie chłodzone, przez co bez przerwy zużywają ogromne ilości energii elektrycznej. Oprócz generowania wysokich kosztów, taka sytuacja przyczynia się do pogorszenia stanu środowiska – emisja dwutlenku węgla serwerowni jest ogromna.
Co natomiast daje przechowywanie plików w środowisku wirtualnym i korzystanie z aplikacji zainstalowanych nie na dyskach twardych komputerów, a w Chmurze?
Przede wszystkim, firmy mogą zmniejszyć zarówno koszty, jak i swój ślad węglowy, poprzez zmniejszenie liczby lub całkowite zrezygnowanie z utrzymywania czy wynajmowania serwerów, których możliwości i tak nie zużywały w 100 procentach. Kolejna zmiana, to wyposażenie pracowników – zamiast komputerów stacjonarnych, będą oni mogli wykonywać swoją pracę na smartfonach i tabletach, a więc urządzeniach pobierających znacznie mniej prądu. Wreszcie zmniejsza się liczba sprzętu, który będzie kiedyś wymagał utylizacji.
Chmura Google’a jednak nie działa w próżni – może istnieć tylko dzięki farmom serwerów firmy. Rodzi to paradoks: jaki sens ma przeniesienie programów firmowych z jednego data center do drugiego, skoro każde centrum danych wykorzystuje ogromne ilość energii? Odpowiedź jest prosta: data center Google wykorzystują dziesiątki rozwiązań pozwalających oszczędzać prąd oraz zmniejszać ślad węglowy. Przeprowadzane przez maszyny optymalizacje, wykorzystywanie energii odnawialnej, ekologiczne sposoby chłodzenia sprzętu – wszystko to sprawia, że serwerownie Google zużywają stosunkowo znacznie mniej zasobów, niż urządzenia wykorzystywane przez inne firmy.
Przeniesienie się do Chmury oznacza więc zmniejszenie ogólnej liczby serwerowni wykorzystywanych przez firmy. Owszem: rezygnacja z wynajmowania własnych serwerów na korzyść rozwiązań w środowisku wirtualnym oznacza wykorzystywanie farm serwerów Google. Jednak w przypadku data center Google’a można mówić o przeniesieniu się na infrastrukturę, która u samej swej podstawy jest znacznie bardziej ekologiczna, niż większość serwerowni, z jakich na co dzień płyną wykorzystywane przez nas dane.
6. Podsumowanie
Dla przypomnienia, zbierzmy w jednym miejscu wszystkie sekrety, jakie w tej części Steru na SEO wyrwaliśmy farmom serwerów Google.
I już! Od tej chwili data center Google’a nie mają przed nami żadnych tajemnic.
Źródła: DataCenter Knowledge 1, 2, 3; World’s Top Data Centers 1, 2; Business Insider; Techopedia; GoogleGuide; Google Cloud 1, 2; Google Official Blog 1, 2; Forbes; Google Sustainability; Google Data Centers 1, 2; Inhabitat; Columbia INSIGHT; Data Center Frontier; Aspekty ochrony środowiska naturalnego w chmurze obliczeniowej