Ibm e l'Unione Europea si preparano a rivoluzionare la ricerca sul web. I ricercatori dell'azienda americana, in collaborazione con un
Consorzio dell'UE, hanno infatti sviluppato un
motore di ricerca analitico che consente di trovare
video, immagini e musica non contrassegnati con informazioni descrittive (tag), che corrispondano a dati multimediali sottoposti come query.
Il nuovo sistema è basato su una tecnologia web chiamata
Sapir (
Search in Audio visual content using Peer-to-peer Information Retrieval), capace di analizzare e identificare i pixel in grandi archivi costituiti da contenuti audiovisivi.
Sapir, basata sull'architettura
peer-to-peer, è in grado di indicizzare archivi costituiti da milioni elementi multimediali, estraendo da fotografie o video i
“descrittori base", che comprendono caratteristiche quali
il colore, il layout, le forme o i suoni. Il multimedia identificato viene automaticamente indicizzato e ordinato per essere poi facilmente reperito.
Se, ad esempio, un turista usa un telefono cellulare per fotografare una statua, Sapir ne identifica i descrittori, li confronta con le fotografie esistenti ed aiuta a identificare la statua.
Le potenziali applicazioni sono illimitate. Estendendo la potenza della
scalabilità della tecnologia, potrebbero essere analizzate caratteristiche più specifiche, in modo tale da rendere possibile fotografare un elemento di abbigliamento alla moda, visto in qualche vetrina, e scoprire in quali negozi poterlo acquistare, o usare Sapir come ausilio nell'assistenza sanitaria analizzando immagini mediche e documentazioni dei pazienti per proporre diagnosi verosimili confrontando i risultati con dati storici estratti da archivi medici distribuiti.
I file multimediali costituiscono la stragrande maggioranza dei dati disponibili su internet e, da uno studio di
Idc del maggio 2009, emerge che
il 95% delle informazioni in formato elettronico, come ad esempio le foto digitali,
non è ben categorizzato o identificato da tag.
Le immagini, catturate da più di 1 miliardo di dispositivi nel mondo, costituiscono la parte maggiore dell'universo digitale. Sapir attinge i suoi dati da questo vasto repertorio elettronico multimediale, guidando l'utente nelle sue ricerche all'interno di esso.
Una demo di prova per il pubblico è disponibile all'indirizzo
http://sapir.isti.cnr.it/index.
Il consorzio del progetto Sapir comprende: Ibm Research- Haifa, Israele; Istituto di Scienza e Tecnologie dell'Informazione, Consiglio Nazionale delle Ricerche (CNR), Italia; Max-Planck-Gesellschaft Zur Foerderung der Wissenschaften E.V. (MPG), Germania; Eurix S.R.L. (EURIX), Italia; Xerox – SAS (XRCE), Francia; Masarykova Univerzita (MU Brno), Repubblica Ceca; Telefonica Investigacion y Desarrollo sa Unipersonal (TID), Spagna; Telenor ASA (TELENOR), Norvegia; Università degli Studi di Padova (UPD), Italia.