iPharro, riesce a capire cosa c’è dentro un video, identificando materiali coperti da copyright ed eventuali manipolazioni.

ipharro Leggendo il comunicato di iPharro, società tedesca che ha ricevuto 4 milioni di euro di finanziamento dal fondo Triangle Venture, ho avuto subito l’impressione che si trattasse di qualcosa di molto interessante. iPharro è attiva da oltre tre anni nel campo della ricerca e sviluppo di tecnologie per il riconoscimento di contenuti all’interno di sequenze video.

La loro attività era rimasta piuttosto nell’ombra fintanto che la Nielsen non ha deciso, questa estate, di sperimentare la loro tecnologia ottenendo risultati strabilianti. Ora che si è ufficialmente aperta la seconda fase dello sviluppo della Net TV, centrata sul tema della tutela del copyright, le meraviglie proposte da iPharro sono saltate agli occhi di tutti, tanto da ricevere immediatamente un bel finanziamento.

Sentite cosa è riuscita a fare Nielsen con questa tecnologia:

ipharro contraffazioni “Oltre che alla semplice identificazione dei contenuti video, la nostra tecnologia può riconoscere e tracciare eventuali alterazioni applicate a video clip preesistenti.

Nilsen Media ha già scoperto la praticità di questo meccanismo, usando iPharro come sistema per facilitare il monitoraggio, dentro le pubblicità in video, di variazioni come il prezzo o il packaging di un prodotto. Potendo inoltre monitorare molteplici canali TV in contemporanea, iPharro ha aiutato Nielsen a tracciare il posizionamento di tutte le pubblicità.

Questo ha permesso a Nilsen di dare ai suoi clienti un quadro accurato sull’esatta conformazione del mercato pubblicitario, ad esempio quali pubblicità, e di che tipo, vengono mandate in onda su ogni canale per ogni giorno della settimana.”

Capite bene che questa è un’altra storia rispetto alla soluzione proposta, ad esempio, da AudibleMagic, già adottata da MySpace ed in procinto di essere sposata anche da YouTube. AudibleMagic riconosce solamente l’audio di un filmato. L’assunzione che viene fatta è che ogni filmato ha una colonna sonora che rimane sempre strettamente accoppiata con il video (è difficile che in un film, ad esempio, venga sostituita la traccia del parlato). Ma AudibleMagic di solo audio tratta, quindi non riesce ad esempio ad identificare spezzoni di video usati con un montaggio di musica differente, o ancora filmati nei quali è stato manipolato qualche elemento del video. iPharro lavora invece direttamente con il video. Adottando un sistema molto simile a quello che Audible Magice usa per l’audio, e quindi costruendo per ogni filmanto (per ogni scena), un “fingerprint“, un’impronta univoca.

iPharro

In questo modo la prima applicazione di iPharro è rivolta proprio a chi opera già oggi con il video, ed ha la necessità di monitorare e verificare ciò che accade. In questo senso l’esperimento di Nielsen è particolarmente significativo, dimostrando come questa tecnologia possa adattarsi meravigliosamente a questi scopi, con un’efficacia (100% dichiara Nielsen) e dei costi imparagonabili rispetto ad un lavoro analogo eseguito con “forza lavoro umana“.

Ma l’applicazione più a la page di iPharro è sicuramente quella rivolta alla lotta contro il materiale coperto da copyright distribuito sui vari servizi online come YouTube, DailyMontion, MySpace, etc. Rispetto ad AudibleMagic, iPharro promette decisamente di più. Capendo esattamente cosa c’è dentro ogni porzione di video, non c’è più scampo. E diventa inutile, a questo punto, anche inserire watermark dentro i filmati. Come recita la presetazione di iPharro “è il media che diventa effettivamente il watermark di se stesso”. Se riesco a capire il contenuto, è il contenuto che protegge se stesso.

iPharro Architetture

La classica ciliegina sulla torta è l’architettura con cui è concepita l’infrastruttura tecnologica del servizio iPharro. Per fare girare le varie componenti del sistema vengono usati dei comunissimi PC (desktop), organizzati in cluster, e messi in grado di operare cooperativamente. Una griglia di semplici PC per creare una potenza di elaborazione in grado di scalare virtualmente all’infinito semplicemente aggiungendo nuove macchine al sistema.

Molto interessante, sono sicuro che sentiremo parlare ancora di iPharro nel prossimo futuro.

— Il sito di iPharro.

Technorati , , , , , , , , , ,

9 thoughts on “iPharro, riesce a capire cosa c’è dentro un video, identificando materiali coperti da copyright ed eventuali manipolazioni.

  1. tra 100 anni saranno le macchine a impiantare pezzi umani nel loro corpo. 😀

    cmq interessante Tommaso!

    e grazie per la segnalazione ma non ho ben capito come funzionerebbe la tecnologia di identificazione.

    Esiste da qualche parte una risorsa dettagliata in cui viene spiegato tutto l'ambardam?

  2. Allora, sul loro sito come avrai visto non c'è praticamente nulla. Le info le ho avute direttamente da loro, e quello che è scritto è praticamente tutto quello che mi hanno detto/inviato.

    Però, però… hanno manifestato anche massima disponibilità ad approfondire qualsiasi tema. Quindi: cosa approfondiamo secondo te?

  3. a me interesserebbe capire cosa sono e come funzionano questi "fingerprint"..

    Non ho molta competenza in materia ma la logica mi dice che una banalissima compressione video (per non parlare di veri e propri ritocchi al video) dovrebbe alterare queste impronte univoche.

    Invece secondo quanto hai riportato nel tuo articolo, questa tecnologia bypassa facilmente questi problemi… non capisco come questo possa accadere.

    Ciao!

  4. Nannolino, forse perchè parti dall'idea che la sequenza di simboli cambia all'interno del file che contiene l'opera… e questo è assolutamente vero: il checksum di un divx è diverso dal checksum di un mpeg2 contenete lo stesso video. Ma il sistema non agisce sul file, ma sul "quadro immagine" che come la comprimi comprimi, è sempre la stessa: non è che se tu passi un dvd in divx, poi ti guardi in divx un film diverso da quello che era su dvd :)))

    Ovviamente la compressione altera un po' anche l'immagine; ma l'analisi numerica e il calcolo numerico a che servono!?!? Il tutto si riduce ad un mero problema di "taratura" del sistema di riconoscimento… tutt'altro che banale… ma è una questione di fine tuning. Il pof di questo sistema è proprio il livello di precisione raggiunto; Tommaso, se vuoi approfondire gli chiederei lumi soprio sulla precisione. Altro pof potrebbe essere la potenza di calcolo necessaria a fare queste operazioni di confronto in modo sistematico e estensivo…

  5. Ciao Tommaso,

    è il mio primo post sul tuo blog che seguo da un po' di tempo (complimenti).

    Mi piacerebbe capire se questa tecnologia può essere utilizzata, oltre che come strumento di pattern matching di contenuti video (quindi in grado di ricondurre a contenuti video conosciuti – è l'applicazione di Nielsen), anche come strumento di catalogazione.

    In un mondo in cui la varietà dei contenuti video fruibili è in rapida espansione, forse sarebbe utile uno strumento per aiutare a catalogare tali contenuti. Mi vengono in mente esempi di categorie forse banali: indoor/outdoor, scene lunghe/scene corte, telecamera a spalla / steady / cavalletto, tipo di soggetto prevalente (umano, animale, automobile, etc) e molti altri che potrebbero essere utili per la ricerca di materiale video.

    Ciao :)

  6. Ecco le prime risposte sul tema del fingerprinting (ho chiesto anche il resto):

    "The system was specifically designed to handle modifications like those often encountered on “Youtube”, so scaling and compression is absolutely no problem. Additionally, all manner of video files and compression are able to be detected. Since the technology is looking at the actual color and makeup of the picture as opposed to the digital file itself, it doesn’t matter if you are looking at the original image or a photo of the movie."

  7. Pingback: Il dictat per gli User Generated Content. | tommaso.tessarolo

Leave a Reply to Nannolino Cancel reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>