- WordPress World: 100+ WordPress plugins, articles and resources
- Web Semantico: semanticizzare un WordPress blog (Parte 1)
- Blogosfera: bloggingActors, individualismo di rete ed economia aperta
- Social Media: il radioso futuro delle social news
- Web Semantico: semanticizzare un WordPress blog (Parte 2)
- Life on the Net: privacy e gestione dell'identità online, due problematiche scottanti
- OpenID: lo standard prende piede
- Buzz, News & Trends: un "costante aggiornamento" sugli strumenti che servono
- Blogging: le 7 fatiche del professional blogger
- Cloud Computing: la frontiera - la prossima Google potrebbe non possedere alcun server
Analisi: Googlescopia
Scritto da Enrico Bertini | 11 Gennaio 2008
![]()

Due ingegneri di Google, Jeffrey Dean e Sanjay Ghemawat hanno pubblicato sul numero di Gennaio 2008 delle Communications of the ACM un documento intitolato "MapReduce: Simplified Data Processing on Large Clusters", un documento all’interno del quale essi descrivono le caratteristiche, il funzionamento, nonché l’evoluzione della piattaforma software di computing parallelo e distribuito MapReduce, quella che Google utilizza per indicizzare il Web e per "far girare" il proprio motore di ricerca, la cui implementazione open source è rappresentata da Hadoop (della battaglia in corso tra le due piattaforme parla un articolo di BusinessWeek). Dal documento di Jeffrey Dean e Sanjay Ghemawat si apprende anche che MapReduce esegue attualmente più di 100.000 jobs (compiti) al giorno, processando quotidianamente più 20 petabytes (20.000 terabytes) di dati. MapReduce inoltre, quale parte integrante dell’architettura di cloud computing di Google, è uno dei vantaggi competitivi che la società di Mountain View possiede sui propri competitors (Yahoo!, MSN, Ask) nel settore dell’Internet search, un’infrastruttura software sulla quale, negli ultimi quattro anni, Google ha sviluppato internamente ed implementato più di 10.000 differenti programmi. "Programmers find the system easy to use" dice Google, e "This allows programmers without any experience with parallel and distributed systems to easily utilize the resources of a large distributed system". 

