Motori di ricerca: gli algoritmi di Google ed il real-time Web
Scritto da Enrico Bertini | 2 Gennaio 2008
![]()

Un articolo di Google Operating System parla di come, ultimamente, i risultati restituiti dal motore di ricerca Google (le SERPs) possano cambiare di parecchio nella loro composizione, stante il fatto che da un pò di tempo il motore stesso indicizza molto più velocemente il Web al fine di trovare i suoi contenuti più recenti. L’articolo sottolinea il fatto che, mostrando contenuti che sono stati pubblicati da pochissimo tempo, il motore Google non può assegnare loro un ranking (PageRank, TrustRank, ecc.), essendo tali contenuti naturalmente sprovvisti di backlinks, cosicché al motore non resta altro che affidarsi a dei dati storici ed "inferire" su di questi. Ed in alcuni casi, quando ad esempio il motore Google "vede" che una certa query sta divenendo popolare, esso assume che un qualcosa di rilevante stia avvenendo sul Web, mostrando di conseguenza dei risultati piuttosto aggiornati. Facendo riferimento alla celebrazione del nuovo anno e dei 25 anni del TCP/IP (che ha visto uno speciale logo sulla home page di Google), l’articolo fa quindi notare che la query "January 1 TCP/IP" è stata la query più "calda" (Hot Trends) negli USA il giorno 31 Dicembre 2007, cosa che ha consentito ad un blog creato al volo per l’occasione e con un titolo ottimizzato di conquistare la Google home page, ottenendo un grosso traffico di ritorno. Anche altri blog hanno approfittato della situazione, conclude l’articolo, sottolineando che l’indicizzazione del Web in tempo reale potrebbe portare gli algoritmi del motore Google a produrre dei risultati impredicibili.
Non credo che l’indicizzazione del Web in tempo reale sia un pratica da non attuare, anzi, credo esattamente il contrario, vista l’enorme mole di contenuti generati costantemente dalla blogosfera e dai social networks, per cui credo che questa sia una delle sfide che l’evoluzione del search si trova necessariamente ad affrontare, anche se non credo affatto che si tratta di una sfida agevole. E poi c’è l’avanzata del Web 3.0 da tenere in considerazione, il che mette ulteriore "carne sul fuoco".
Google sta sicuramente lavorando duro intorno a tali problematiche, e, come già detto più volte su Stalkk.ed, sta facendo evolvere gli algoritmi del suo motore di ricerca seguendo in parallelo l’evoluzione del Web, cercando anche di trasformare il PageRank in un effettivo TrustRank, ContentRank, e magari anche DemocraRank.
Si può perciò parlare di "bug" per quanto concerne la query "January 1 TCP/IP"? Non saprei dire al momento, per cui è una domanda che per ora lascio in sospeso. Vorrei però ricordare che, come riporta HitTail, bloggare disponendo di un Web totalmente real-time può essere di enorme vantaggio per i bloggers.
Categorie: Google, Motori di Ricerca, Search Engines, Web 2.0, Web 3.0
Supporta Stalkk.ed
Questo è un blog di Open Consulting.
Hai trovato interessante questo articolo?
Considera di linkarlo: Motori di ricerca: gli algoritmi di Google ed il real-time Web.
Considera anche di sottoscrivere il feed RSS di Stalkk.ed, oppure di utilizzare il motore di ricerca Stalkk.ed BNS per le tue ricerche sulla tecnologia.
Articoli Correlati
Commenti
Lascia una risposta

