rssb
Contenuti più letti


stalkkedico

Analisi: Googlescopia

Scritto da Enrico Bertini | 11 Gennaio 2008commentawikio

googlescopia.png Due ingegneri di Google, Jeffrey Dean e Sanjay Ghemawat hanno pubblicato sul numero di Gennaio 2008 delle Communications of the ACM un documento intitolato "MapReduce: Simplified Data Processing on Large Clusters", un documento all’interno del quale essi descrivono le caratteristiche, il funzionamento, nonché l’evoluzione della piattaforma software di computing parallelo e distribuito MapReduce, quella che Google utilizza per indicizzare il Web e per "far girare" il proprio motore di ricerca, la cui implementazione open source è rappresentata da Hadoop (della battaglia in corso tra le due piattaforme parla un articolo di BusinessWeek). Dal documento di Jeffrey Dean e Sanjay Ghemawat si apprende anche che MapReduce esegue attualmente più di 100.000 jobs (compiti) al giorno, processando quotidianamente più 20 petabytes (20.000 terabytes) di dati. MapReduce inoltre, quale parte integrante dell’architettura di cloud computing di Google, è uno dei vantaggi competitivi che la società di Mountain View possiede sui propri competitors (Yahoo!, MSN, Ask) nel settore dell’Internet search, un’infrastruttura software sulla quale, negli ultimi quattro anni, Google ha sviluppato internamente ed implementato più di 10.000 differenti programmi. "Programmers find the system easy to use" dice Google, e "This allows programmers without any experience with parallel and distributed systems to easily utilize the resources of a large distributed system". more

Categorie: Analisi, Google