Il futuro di Yahoo Research è nelle mani dei ricercatori dell'Università di Pisa. La società americana ha avviato un progetto di collaborazione triennale con l'ateneo toscano che, attraverso lo studio di algoritmi innovativi, fornirà le tecnologie di base per la nuova generazione dei motori di ricerca.
"I nostri studi mirano a rendere le ricerche sul web più efficaci e in grado di fornire soluzioni e suggerimenti all'utente che avrà risposte sempre più personalizzate, spiega Paolo Ferragina, docente del Dipartimento di Informatica all'Università di Pisa (http://www.di.unipi.it/) e coordinatore del progetto. Staremo molto attenti a non infrangere la privacy di chi naviga pur utilizzando il feedback degli utenti, quello che gli americani chiamano <<winsdom of the crowd>>. La saggezza della gente, appunto: Yahoo conta ogni mese su 500 milioni di utenti in tutto il mondo.
L'interesse della società americana per la ricerca di nuovi algoritmi (procedimenti in sequenza) nasce dalla necessità di gestire e analizzare più efficacemente l'enorme mole di dati prodotta dai suoi servizi web. Il progetto nasce dagli studi avviati a metà degli anni novanta dal gruppo algoritmico della Facoltà di Informatica di Pisa sullo sviluppo di strutture dati efficienti per la compressione, ricerca e analisi di grandi quantità di informazioni.
"D'altronde, ricorda il rettore dell'Ateneo Marco Pasquali, l'informatica italiana è nata a Pisa, città che nel 1969 ha ospitato il primo corso di laurea italiano in Informatica e che da allora rappresenta un polo di eccellenza nella ricerca in Information Tecnology".
Massimo Martini, manager Yahoo Italia, nel ricordare che l'attenzione verso i ricercatori pisani nasce dal quartier generale di Yahoo in California, si dichiara: "orgoglioso di vedere l'Italia in prima linea nello sviluppo di nuove tecnologie per la ricerca web del futuro che hanno l'unico obiettivo di rendere gli utenti Internet sempre più soddisfatti".
L'attenzione di Yahoo per le opportunità scientifiche che possono arrivare dal vecchio continente è dimostrata anche dalla recente apertura a Barcellona del primo centro di ricerca europeo.
Entusiasta dell'accordo tra Yahoo e l'università di Pisa è Ricardo Baeza-Yates, direttore del polo scientifico catalano: "Il nostro impegno è far si che gli sforzi di ricercatori come quelli del gruppo algoritmico pisano divengano uno standard tecnologico per i futuri utenti Internet"
Fonte Affari&Finanza Repubblica 08 gennaio 2007
In quali università sono state scoperte cellule staminali nel liquido amniotico?. Se ponete la domanda a un motore di ricerca, otterrete decine di collegamenti. Rovistando un pò, la soluzione: Harward e Wake Forest University. Ma se allo stesso motore di ricerca chiedete: Qual'è la data prevista per la missione Nasa che riparerà il telescopio spaziale Hubble?. Difficilmente la ricerca vi restituirà la risposta che volete: settembre 2008.
Questo finora. Ma un sistema in studio al Dipartimento di Ingegneria dell'Informazione dell'Università di Siena (http://www.dii.unisi.it/) consentirà di risolvere problemi simili in modo nuovo.
E' un motore di ricerca, basato sul <<modo di ragionare>> dei più avanzati sistemi di intelligenza artificiale. E' simile a quello creato dall'IBM (Piquant) ma a differenza di quest'ultimo risponde anche in italiano oltre che in inglese. I risultati non consistono, come oggi, in link ad altri documenti, bensì in risposte precise: fornisce un elenco di parole in cui, fra le prime dieci, c'è quello che cercavamo.
E'un software che sa interrogare i motori stessi, spiega Marco Gori, docente di intelligenza artificiale all'ateneo senese, padre (con i ricercatori Giovanni Angelini e Marco Ernandes) del <<progetto WebCrow>> di cui l'applicazione fa parte. Progetto finanziato da Google con un premio di 65.000 dollari.
"L'applicazione elabora il linguaggio naturale, precisa Gori. Non si è obbligati, come nei motori tradizionali, a formulare una richiesta per parole chiave, ma si può scrivere la domanda. Il software comprende la frase e la converte in richiesta per Google. Riceve i risultati, li analizza, ne stila la classifica e mostra una lista di parole che soddisfa la richiesta. La probabilità di trovare la risposta corretta è molto alta: 80-90 %. E' impossibile trovare una sola risposta: il senso critico dell'utente resta fondamentale".
Un grado di certezza sorprendente lo si riscontra su notizie inserite in rete di recente. Se chiediamo: Qual'è l'ex governatore del New Jersey che ha dichiarato si essere gay?. La risposta è: James McGreevey. La tecnologia senese è poi facilmente gestibile sui telefonini rispetto agli attuali motori di ricerca. In questi giorni gli studiosi senesi stanno lavorando a un prototipo in cui domande e risposte viaggiano via sms. Lo scopo originario del WebCrow era la risoluzione automatica di cruciverba.
"Non è solo un gioco, ma una sfida per l'intelligenza artificiale, aggiunge Gori. La domanda era: può una macchina collegata ad internet risolvere da sola le parole crociate?. Un'ottima palestra per creare un'applicazione che dialoghi in modo intelligente con i motori di ricerca e ne interpreti le risposte. Rispettando il vincolo degli incroci e tenendo traccia dei tentativi".
"Nel web c'è uno sterminato patrimonio per tutti. I motori di ricerca, però, non rivelano la ricetta con cui operano: con i loro algoritmi, decidono cosa mostrare prima e cosa dopo", sostiene Gori che, con il neozelandese Ian Witten e Teresa Numerico dell'Università di Salerno, ha pubblicato un testo sull'uso critico di queste tecnologie.
Il volume (Web Dragons: inside the myths of search engine technologies), uscito ora negli Usa, mette in guardia sulle tecnologie con cui si ottiene visibilità gratuita sul Web, o su come aziende senza scrupoli attacchino la pubblicità dei concorrenti cliccandola di continuo (gli annunci sui motori di ricerca vengono pagati in base ai clic ricevuti).
Un motore di ricerca andrebbe dunque posto sotto controllo?.
"Non credo sia possibile, sostiene Gori. Siamo intrappolati in un paradosso: se i motori rendessero nota la loro ricetta, sarebbe il paradiso degli spammers che farebbero lievitare le informazioni spazzatura, peggiorando la qualità delle ricerche. Il modello alla base dei motori di ricerca, nella suà semplicità, si è rivelato molto efficace. Ma forse è giunto il momento di soluzioni radicalmente diverse".
fonte: Panorama 25 gennaio 2007
|