rssb
stalkkedico

RSS feeds: filtrare i feeds attraverso Feed Rinse

Scritto da Enrico Bertini | 5 Maggio 2007commentawikio


feedrinse.png

Feed Rinse è un servizio che consente di filtrare i posts contenuti all’interno di un qualsiasi RSS feed. Il servizio funziona alla stregua di un filtro per lo spam e permette di impostare una serie di regole condizionali a cascata per il setacciamento dei posts. Soltanto i posts che soddisfano tutte le regole specificate saranno lasciati passare da Feed Rinse: tutti gli altri verranno bloccati.

Attraverso Feed Rinse si possono applicare filtri alle varie parti che compongono la struttura di un post: titolo del post, autore, corpo del post, tags. Il filtraggio avviene sulla base di parole chiave.
Le regole di filtraggio possono essere create specificando se includere od escludere determinati contenuti, anche parziali. Ogni regola di filtraggio è indipendente dalle altre.
è possibile creare dei canali che raggruppano i feeds, fino ad un massimo di 5, ed ogni canale può contenere al suo interno un numero illimitato di elementi.
Tutti i feeds possono essere aggiunti manualmente (anche attraverso un bookmarklet) oppure importati da un file OPML.
Tutte le operazioni di impostazione dei filtraggi sono semplicissime.

Feed Rinse è davvero un utilissimo strumento per l’RSS mashup.
Il servizio è completamente gratuito.

Categorie: Mashups, RSS


Supporta Stalkk.ed


Questo è un blog di Open Consulting.
Hai trovato interessante questo articolo?
Considera di linkarlo: RSS feeds: filtrare i feeds attraverso Feed Rinse.
Considera anche di sottoscrivere il feed RSS di Stalkk.ed, oppure di utilizzare il motore di ricerca Stalkk.ed BNS per le tue ricerche sulla tecnologia.


Articoli Correlati



Commenti

2 Risposte a “RSS feeds: filtrare i feeds attraverso Feed Rinse”

  1. MAvero il 9 Luglio 2007 17:17

    …e se io volessi filtrare dei feed non per parole chiave bensì per cifre?
    Ad esempio -> tutti i feed che contengono “almeno” un numero inferiore a 2.000 … cosa mi dite a tal proposito?

  2. Enrico Bertini il 9 Luglio 2007 22:53

    Il problema è un tantino più complicato di quello che può sembrare a prima vista. Esso rappresenta una porzione di una più ampia problematica che ha che fare con il comprendere i significati contenuti all’interno di un testo.
    Si tratta in sostanza della stessa problematica che devono affrontare i nuovi motori di ricerca semantici che si contrappongono ai motori di ricerca classici.

    Il problema può essere posto in questi termini:

    - i campi titolo del post, autore, corpo del post, ecc., contenuti dalla struttura XML di un RSS feed, sono rappresentati da stringhe (sequenze di caratteri), che per loro natura sono tipi di dati destrutturati;

    - le stringhe possono essere indicizzate sulla base delle parole contenute al loro interno che diventano “parole chiave” (keywords), e ricercate sulla base di queste ultime (questo è ciò che fanno i motori di ricerca come Google. I filtri RSS devono applicare esattamente lo stesso principio);

    - l’indicizzazione di una stringa avviene sulla base di delimitatori contenuti al suo interno, i quali possono essere rappresentati sia dagli spazi (blanks), sia dalla punteggiatura (lasciamo perdere per il momento i vari caratteri speciali che, il più delle volte, vengono scartati);

    - l’indicizzazione di una stringa è un processo “stupido”, nel senso che non tiene conto del significato delle parole da indicizzare, ma soltanto della loro presenza in quanto simboli e del loro numero (ricorrenza);

    - l’individuazione di uno o più numeri all’interno di una stringa comporterebbe l’esecuzione di algoritmi di parsing semantico-lessicale che dovrebbero essere in grado di riconoscere la loro presenza in varie parti della stringa medesima. Ovviamente, tali algoritmi dovrebbero tenere conto anche del fatto che i numeri possono essere rappresentati in vari modi (attraverso cifre intere o decimali (2.000 - 0,2000), lettere (duemila), frazioni (1/2000), rapporti (1:2000) percentuali (2000%), ecc.) e che 2000 a.C. rappresenta una data e non un numero;

    - premesso che i suddetti algoritmi di parsing semantico-lessicale possano essere implementati abbastanza facilmente se limitati soltanto ai numeri, e che le procedure di RSS filtering implementino i necessari operatori relazionali (>, >=, <, <=, ==, !=) e l’operatore condizionale “almeno” (if, not less than), come andrebbe contestualizzato il numero 2.000? In altre parole, a quale unità di misura esso dovrebbe essere riferito? Si tratta di quantità di pesche, mele, banane? Si tratta di metri? Si tratta di euro? Oppure di che cosa si tratta? Di un semplice numero?

    - ebbene, stante quanto sopra premesso e nel caso si tratti di un semplice numero completamente decontestualizzato (ovvero privo di un significato particolare), che senso avrebbe filtrare gli RSS feeds sulla base di una tale grandezza? Ovviamente, nessuno.

    In conclusione, la problematica appena descritta si colloca nel campo delle ricerche riguardanti l’elaborazione del linguaggio naturale (NLP), ed è una problematica di natura totalizzante per ciò che concerne il linguaggio umano. Essa evidenzia il fatto che non serve comprendere una frase (enunciato, sentenza) soltanto in maniera parziale, ma serve comprenderla nella sua interezza, nonché stabilire il giusto contesto (dominio di conoscenza) nel quale essa si colloca.

    Indubbiamente, nel momento in cui più evoluti algoritmi semantici saranno disponibili, essi verranno applicati anche agli RSS feeds.

Lascia una risposta