Web Semantico: che cosa si prepara per il dopo Google? (Parte 1)
Scritto da Enrico Bertini | 20 Ottobre 2007
![]()


“The Search is ‘game over’” diceva Bernard Lunn in un articolo dal titolo “From Search to (Re)Search: Searching For The Google Killer” pubblicato qualche tempo fa su Read/WriteWeb. “Google ha vinto“, aggiungeva Lunn, considerato che nuove interfacce utente, nuove opzioni di visualizzazione, suggestions, alerts, od altre minori funzionalità di vario genere, non sono abbastanza sufficienti a fare in modo che gli utenti cambino il loro motore di ricerca di riferimento abbandonando Google: in pratica, finora, non esistono delle ragioni di fondo perchè ciò possa avvenire a brevissimo termine e su larga scala. Forse il Google-killer non sarà da ricercarsi nell’ambito di un “miglioramento del Search”, ma in quello più indefinito di un futuro “Post Search”, concludeva Lunn.
E sul futuro del Search c’è anche un bellissimo articolo di Search Engine Land intitolato “Search In The Year 2010“, un articolo strutturato sulla base di domande rivolte ad una serie di importanti personaggi della Search Industry (ma non solo) provenienti da Google, Yahoo!, Microsoft e Ask.
Il Web Semantico o Web 3.0
Si dibatte molto su che cosa sarà davvero il Web Semantico o Web 3.0 da quando Tim Berners-Lee coniò tale termine per descrivere una auspicabile evoluzione del Web verso un enorme World Wide Database contenente dati strutturati in formati interoperabili ed interrogabili tramite il linguaggio naturale: ci sono anche due voci di Wikipedia (Semantic Web e Web 3.0) in costante aggiornamento che contribuiscono a far luce sull’argomento per i meno addetti ai lavori (Seth Godin sta attualmente aspettando il Web 4.0, ma questo è un’altro discorso).
Comunque, l’intera visione di Tim Berners-Lee a proposito del futuro del Web è riportata in questo ottimo articolo di ITworld.com, e si può inoltre consultare la W3C Semantic Web Activity.
La ricerca semantica
A differenza di un classico motore di ricerca, un motore di ricerca semantico è basato sull’elaborazione del linguaggio naturale, vale a dire che esso incapsula la conoscenza del linguaggio umano con i suoi costrutti ed è in grado di comprenderne i significati. I suoi algoritmi emulano di fatto la comprensione umana, ed al posto delle keywords essi sono capaci di manipolare concetti e/o significati. è perciò ovvio che l’intero Web viene “indicizzato” diversamente da parte di un motore di ricerca semantico rispetto ad uno classico, e dovrebbe essere altrettanto ovvio che il Web Semantico ed i motori di ricerca semantici sono due cose differenti tra loro, sebbene il primo faciliti il compito dei secondi strutturando semanticamente la “conoscenza” del Web. In pratica, possono esistere motori di ricerca semantici anche in assenza di un Web Semantico, ma essi si troveranno di fronte ad un compito più arduo da portare a termine.
Analizzando il significato di un testo, piuttosto che ricercando le keywords contenute al suo interno, un motore di ricerca semantico deve essere quindi in grado di fornire risultati di ricerca di gran lunga più rilevanti rispetto ad un motore classico. Conseguentemente, esso non può basarsi su analisi statistiche di alcun genere, ma deve esclusivamente fare affidamento sulla comprensione dei significati delle parole. Esso deve consentire inoltre di effettuare ricerche molto più complesse e più profonde sui contenuti testuali, innalzando oltre ogni limite le possibilità di personalizzazione delle queries (”personalized search”), le quali diventeranno così potenzialmente infinite (esattamente come in un dialogo fra persone): si parla in questo caso di long-tail queries.
Semantica = Intelligenza Artificiale?
Nel momento in cui analizza un testo, un motore di ricerca classico (come Google o Yahoo!) lo indicizza sulla base delle parole contenute al suo interno, e tali parole corrispondono poi alle keywords utilizzate per interrogarlo. Un motore di ricerca semantico, invece, deve essere in grado di distinguere, nel medesimo testo, i costrutti lessicali, sintattici e grammaticali della lingua in cui esso è scritto (composti di parole, punteggiatura, periodi, frasi, soggetti, verbi o predicati, forme verbali, complementi oggetti, articoli, nomi propri, sostantivi, aggettivi, avverbi, preposizioni, congiunzioni, numeri, ecc.) e di trasformarli in costrutti semantici capaci di rappresentare il significato delle espressioni linguistiche che il testo contiene. Tali costrutti semantici, che possono variare a seconda del modello di rappresentazione della conoscenza adottato, vengono poi inseriti all’interno di una ontologia, vale a dire un modello gerarchico (schema) di rappresentazione della conoscenza che può contenere domini, concetti, classi, relazioni, regole, sentenze o enunciati, e tutta un’altra serie elementi semantici di varia tipologia: siamo entrati, ovviamente, nel campo dell’Intelligenza Artificiale.
Ma la semantica non è l’Intelligenza Artificiale. Senza entrare in specifici dettagli, basta osservare che, una cosa è analizzare un testo, seppur semanticamente, mentre una cosa completamente diversa è crearlo dal nulla in maniera del tutto fantasiosa oppure attinente con la realtà.
Categorie: Web 3.0
Supporta Stalkk.ed
Questo è un blog di Open Consulting.
Hai trovato interessante questo articolo?
Considera di linkarlo: Web Semantico: che cosa si prepara per il dopo Google? (Parte 1).
Considera anche di sottoscrivere il feed RSS di Stalkk.ed, oppure di utilizzare il motore di ricerca Stalkk.ed BNS per le tue ricerche sulla tecnologia.
Articoli Correlati
Commenti
1 Risposta a “Web Semantico: che cosa si prepara per il dopo Google? (Parte 1)”
Lascia una risposta


[…] prima parte di questo articolo ho introdotto i concetti di Web Semantico e di ricerca semantica, ed ho spiegato perché parlare di […]