Twitter: data mining, information gathering, information retrieval e semantic web
Scritto da Enrico Bertini | 2 Marzo 2009
I tweets sono piccolissime unità di informazione contenenti al massimo 140 caratteri, potremmo dire atomi di informazione se paragonati a contenuti web "molecolari" quali articoli o notizie, per cui si può essere portati a pensare che il loro valore informativo intrinseco sia piuttosto scarso a livello generale (non ovviamente a livello particolare nell’ambito di una data conversazione che avviene tra due o più soggetti). Ma quando Twitter viene utilizzato ad esempio per diffondere delle breaking news o delle informazioni da eventi live questo valore di fatto cresce, così come cresce allorché il servizio di microblogging viene usato per veicolare informazioni strutturate e/o semantiche tramite l’aggiunta di #hashtags (metadati) ai tweets nonché attraverso l’adozione di determinate convenzioni linguistiche/simboliche/numeriche condivise: un caso fra tutti riguarda l’uso dell’hashtag #uksnow, unitamente a codici postali e a valori di precipitazioni nevose (frazioni da 0/10 a 10/10), per la creazione su Twitter di una sorta di stazione meteorologica distribuita su tutta la Gran Bretagna (e come mostra un articolo di Nodalities si possono facilmente creare dei software in grado analizzare tali metadati, per poi costruire dei mashups come questa mappa interattiva).
Inoltre, l’intrinseco valore informativo dei tweets (essi ammontano a circa 1.265.900.000 nell’istante in cui scrivo secondo il counter di GigaTweet) cresce però altresì cumulativamente sulla base del sempre più ampio numero di utenti di Twitter (tra i 5 e i 10 milioni), i quali mediante il servizio condividono news, rumors, opinioni, consigli, idee, ecc., e tale valore è decisamente ancor più elevato in presenza di links, di keywords rilevanti, nonché di retweets (per comprendere meglio le dinamiche di retweeting consiglio di leggere l’articolo "The Science of ReTweets" scritto da Dan Zarrella e pubblicato da Mashable).
Di fatto, quindi, considerato l’enorme volume di informazioni che transitano su Twitter ed il costante incremento nell’uso degli #hashtags da parte dei suoi utenti, il servizio di microblogging sta diventando un’ottima piattaforma sulla quale effettuare operazioni di data mining nonché di information gathering circa persone, organizzazioni, brands, prodotti, trends, oppure operazioni di information retrieval sui più disparati argomenti.
Oltre alle Twitter API e al motore di ricerca Twitter Search, esiste un intero ecosistema di applicazioni/servizi Web che consentono di esplorare l’universo informativo della twitosfera sulla base di #hashtags, di keywords, o di retweets, moltissime delle quali sono già state citate in precedenti articoli di Stalkk.ed (seguite il tag Twitter). Qui voglio citare invece il "Particls Fountain", un servizio di tracciamento delle conversazioni di Twitter contenenti determinate keywords, e voglio menzionare il mashup Twitter-OpenCalais implementato da WindyCitizen.com per monitorare i tweets riguardanti i candidati alle elezioni speciali IL-5 per un posto alla Casa Bianca.
Twitter anche come piattaforma a supporto del semantic web? Assolutamente.
Nel video sottostante, l’intervento di Evan Williams, co-fondatore di Twitter, durante il TED2009.
Abbonati a/Supporta Stalkk.ed
Articoli Correlati
- Twitter: una panoramica sulle applicazioni (servizi) Web disponibili per Twitter
- Twitter: 25 risorse per la Twitosfera
- Twitter: disquisizioni su autorità, influenza e popolarità
- Twitter: analizzare l’evoluzione e l’importanza del Twitterverso
- Twitter: dentro la natura della twitosfera o del twitterverso







Vi segnalo una lista di APP: http://twitter.pbwiki.com/Apps