Primo piano

Scoprire i contenuti più interessanti del web con weBrowse

POLITECNICO DI TORINONell’ambito del progetto europeo mPlane, coordinato dal Politecnico in collaborazione con INRIA e Alcatel-Lucent Bell Labs, il gruppo di ricerca del prof. Marco Mellia del Dipartimento di Elettronica e Telecomunicazioni (DET) ha realizzato weBrowse, un’applicazione che permette di scoprire i contenuti più interessanti del web, usando il traffico che normalmente scorre in rete. weBrowse analizza il traffico che fluisce nella rete e ne estrae le pagine che sono state visitate dagli utenti (ovvero la crowd), basandosi sull'ipotesi che i contenuti più osservati nella rete sono anche quelli che possono di attrarre l'attenzione di altri utenti.

Più in dettaglio, weBrowse considera come input uno stream di richieste HTTP che si ottengono monitorando il traffico nella rete generato dagli utenti. Su questo stream, applica dei filtri online che estraggono i link (le URL) che sono stati effettivamente visitati, scartando tutti i contenuti di “servizio” come ad esempio immagini, bottoni di social network, o pubblicità. I contenuti più popolari sono quindi selezionati e presentati in un feed aggregato. I link che sono pubblicati nel feed di weBrowse possono essere generici (Più Popolari e Contenuti Caldi) o appartenere alla sfera delle notizie (Notizie Fresche e Flusso di Notizie), attingendo ad un insieme predefinito di giornali online.

L’applicazione consente di sapere da una parte quali sono le pagine web più visitate dagli utenti del Politecnico di Torino (analizzando il traffico generato da terminali all'interno della rete del Politecnico di Torino, generato da postazioni fisse o connesse tramite WiFi), mentre dall’altra evidenzia quali siti e pagine all’interno dei siti del Politecnico sono stati visitati più di frequente nell’ultimo giorno o nell’ultima settimana. Le misure di traffico estratte dalla rete sono rese del tutto anonime e utilizzate per soli scopi di ricerca, nel pieno rispetto delle norme, del d. lgs. 196/2003, e delle regole del buon comportamento.
WeBrowse utilizza solo dati aggregati, processando i dati direttamente in memoria, senza neanche scriverli su disco e impiega algoritmi di ultima generazione per assicurare l'anonimità degli utenti.