rssb
stalkkedico

SEO: non tutti i links sono creati uguali

Scritto da Enrico Bertini | 18 Febbraio 2008commentawikio


pesi.png Ognuno dei links esistenti all’interno di una determinata pagina web ha le stesse probabilità di essere seguito (cliccato) dai navigatori Internet che hanno tutti gli altri, indipendentemente da dove questo link viene visualizzato nella pagina stessa: questa è una delle assunzioni sulle quali si fonda il modello navigazionale previsto dal PageRank di Google. Immaginiamo ora di cominciare a navigare partendo da una pagina web presa a caso e contenente dei links, di cliccare su uno di tali links e di seguirlo, così da venir trasportati all’interno di un’altra pagina web contenente ulteriori links, oppure nessuno ("vicolo cieco"), ed immaginiamo di fare ciò all’infinito (o finché tali links non si esauriscono). Immaginiamo altresì di cliccare tutti i links che una certa pagina web contiene, non uno soltanto, preparandoci ad esplorare una estremamente complessa rete di percorsi navigazionali sul Web, quelli che di fatto cioè costituiscono la sua topologia. Staremo in effetti navigando all’interno di un immenso grafo "topologico" composto di nodi (le pagine Web che via via visitiamo) e di archi (i links che le collegano tra loro) che rappresenta l’intero Web, un grafo la cui esplorazione viene quotidianamente demandata al lavoro dei crawlers.

Si tratta di un grafo orientato, perché lo sono tutti i suoi archi (links), e sulla cui struttura topologica agisce l’algoritmo di PageRank, proprio analizzando l’orientamento di questi archi, per poi assegnare un punteggio di merito (rank) ad ognuno dei suoi nodi (pagine web). Ciascuna di queste pagine web possiederà di conseguenza una propria visibilità (data dai links orientati nella sua direzione da altre pagine web - inbound links), una propria luminosità (data dai links orientati nella direzione opposta e verso le pagine web linkate - outbound links), nonché una propria autorità (rank/trust) che gli verrà assegnata dall’algoritmo di PageRank anche su queste basi (e qui si può parlare anche popolarità direzionata e non direzionata).

All’interno di questo grafo orientato, inoltre, ciascuna pagina web rappresenta anche uno stato, e ciascun link rappresenta una transizione di stato, la quale può oppure no verificarsi in funzione di una certa probabilità (si verifica allorché un navigatore clicca su di un link cambiando pagina, ovviamente). Infine, dato che il modello navigazionale del PageRank, come detto sopra, assume che tutti i links contenuti da una pagina web abbiano la stessa probabilità di essere cliccati, tale grafo orientato non è pesato: al di fuori dell’orientamento dei links, non esistono cioè fattori in grado di determinare la maggiore importanza di un dato link rispetto a tutti gli altri.

Ma davvero tutti i links esistenti all’interno di una pagina web hanno la medesima probabilità di essere cliccati (dando quindi luogo a transizioni di stato e generando traffico) dai navigatori Internet? E il modello navigazionale previsto dall’algoritmo di PageRank coglie in pieno la realtà di ciò che avviene sul Web?

Questo è ciò che ha cercato di comprendere uno studio condotto dalla Indiana University, in collaborazione con altre università, e stando al quale i meccanismi di ranking implementati dal PageRank non colgono pienamente la realtà di ciò che avviene sul Web.

Secondo lo studio, in pratica, c’è una grandissima sproporzione tra le transizioni di stato (traffico) che i diversi links contenuti in ciascuna pagina web sono in grado di generare, e si tratta di una spoporzione che in parte è possibile compensare solamente pesando il grafo dell’intero Web, e ciò applicandogli un weighted PageRank, come lo definiscono i ricercatori, vale a dire un PageRank che pesa i links (archi) del grafo in ragione dei clicks che essi veramente ricevono.

Lo studio, denominato "Ranking Web Sites with Real User Traffic", ha prodotto dei risultati derivanti dalla campionatura del comportamento di un largo numero di utenti Web nel corso di circa sette mesi, ed al suo interno i ricercatori affermano tra le altre cose che: "The ranking obtained by the actual frequency with which a site is visited by users differs significantly from that approximated by the uniform surfing/teleportation behavior modeled by PageRank, especially for the most important sites. To interpret this finding, we consider each of the fundamental assumptions underlying PageRank and show how each is violated by actual user behavior. To our knowledge this is by far the largest effort to date to study in depth the structure and dynamics of the weighted Web graph, i.e. the network where links are weighted by actual requests of Web users. A first set of contributions of this work concerns a number of intriguing structural properties revealed by the ‘dynamic’ (traffic-weighted) Web graph, and how they compare to those of the ’static’ Web graph based on unweighted hyperlinks. We further show that temporal traffic patterns show strong regularities, with a significant portion of traffic that is highly predictable — with implications for Web caching schemes".

Lo studio contiene anche diverse altre interessanti conclusioni e considerazioni sulle dinamiche del traffico Web in relazione ai comportamenti dei navigatori Internet. Però, se penso per un attimo ai miliardi di miliardi (…) di links che andrebbero costantemente pesati e ricalibrati in tempo reale sul Web (per ogni singolo click che avviene al suo interno) mi vengono i brividi.

Categorie: Ranking, SEO


Supporta Stalkk.ed


Questo è un blog di Open Consulting.
Hai trovato interessante questo articolo?
Considera di linkarlo: SEO: non tutti i links sono creati uguali.
Considera anche di sottoscrivere il feed RSS di Stalkk.ed, oppure di utilizzare il motore di ricerca Stalkk.ed BNS per le tue ricerche sulla tecnologia.


Articoli Correlati



Commenti

1 Risposta a “SEO: non tutti i links sono creati uguali”

  1. Motori di Ricerca e SEO: che cosa cambierà nel futuro prossimo del Search? | Stalkk.ed il 4 Aprile 2008 20:10

    […] di quest’ultimo sulla base dei più disparati parametri quantitativi e/o qualitativi. Non tutti i links sono però creati uguali, e, per relazionarsi correttamente con il Web, è indubbio che occorra maturare una cultura […]

Lascia una risposta