Den som använder Facebook har säkert noterat att aktivitetsflödet ständigt fylls med nya statusuppdateringar, bilder, videoklipp och annat innehåll. Att hantera detta för över en miljard användare är ingen enkel uppgift, men tack vare gigantiska kluster kan Facebook tugga igenom imponerande mängder data.

facebook-big-data.jpg

På en presskonferens framkommer flera intressanta siffror. Varje dag delar över en miljard användare sammanlagt 2,5 miljarder poster, trycker på gilla-knappen 2,7 miljarder gånger och laddar upp ofattbara 300 miljoner bilder. Som om inte det vore nog går systemet igenom 105 terabyte data var 30:e minut för att hålla aktivitetsflödena uppdaterade.

Detta resulterar i att Facebooks system växer med hela 500 terabyte data om dagen, något som adderas till ett Hadoop-kluster med mer än 100 petabyte lagringsutrymme. En petabyte är 1 048 576 gigabyte.

Facebook arbetar nu med något som kallas för Project Prism, som syftar till att distribuera den väldiga databasen till flera nya datacenter världen över. Fyra av dessa är placerade i de amerikanska delstaterna Kalifornien, Virginia, Oregon och North Carolina. Dessutom tillkommer ett datacenter i svenska Luleå.

Källa: Techcrunch.