Deep Tube

Data: 09 giugno 2014 Categoria: internettopoli, video

Viviamo nell'illusione che il web sia a portata di mano, che tutto sia a pochi click, ma quello che vediamo è solo la punta dell'iceberg e quello che c'è sotto ci sfugge. Eppure è più vicino di quanto crediamo, non è irragiungibile e nascosto dietro chissà quale porta impenetrabile. Ad esempio lo troviamo anche in Youtube.

Il "Deep Web" o "Web invisibile" (vedi Wikipedia: http://it.wikipedia.org/wiki/Web_invisibile) rappresenta la maggior parte del web. Forse dovremmo considerarlo al contrario: il web che conosciamo e che possiamo raggiungere è solo una piccola parte, quella che viene indicizzata dai motori di ricerca. Come dire che tutto ciò che non può essere indicizzato da Google, Bing e altri rimarrà per noi totalmente sconosciuto. Non ci viene impedito di raggiungerlo ma non sappiamo neanche della sua esistenza.

Per dimostrare quanto questo "sconosciuto" sia vicino eppure invisibile farò un esempio con Youtube, il popolare sito di video. Youtube indicizza i propri contenuti ma per farlo ha bisogno di un "aiutino" da parte di chi carica il video: testo. In effetti un file video non si può indicizzare (almeno non ancora) nel senso che un robot di ricerca non può capire cosa si vede in quel video. L'indicizzazione dei video viene quindi fatta sul testo che inseriamo insieme al caricamento del filmato, ovvero titolo e descrizione. Se mancano queste informazioni testuali il robot non saprà come indicizzarlo. Quali termini di ricerca potremo mai usare per trovarlo? Questi video sono invisibili perché introvabili. È come cercare il numero di telefono di qualcuno che ha chiesto di non essere messo sull'elenco telefonico: come potremo mai trovarlo?

C'è però un particolare: se non si inserisce un titolo al momento del caricamento del video allora Youtube, in maniera automatica, userà il nome del file come titolo e questo ci fornisce un appiglio.

Ogni apparecchio che registra video (smartphone, videocamera, ...) userà uno "schema" per dare un nome al file memorizzato. Di solito il nome del file viene costruito usando alcuni dati relativi alla ripresa che possono essere: la data, a volte con l'aggiunta dell'orario, un numero progressivo, alcune lettere. Ad esempio VID-20140517-WA0000.mp4 è il nome di un file video registrato con uno smartphone Android ed è facile capire che è il primo file (gli 0000 finali) girato nel giorno 17 maggio 2014. Se usiamo questo schema insieme a delle "wildcard" troveremo video che non sono indicizzati in nessun altro modo, pochi li hanno visti magari perché conoscevano il link diretto o perché il video è stato inserito in una pagina web: abbiamo scoperto una parte "invisibile" di Youtube, un "DeepTube".

Provando alcune variazioni della stringa di ricerca cosa ho trovato? Di tutto ovviamente e insieme a noiosi compleanni, grotteschi balletti, selfie idioti e via dicendo ho trovato anche cose "disturbanti": un omicidio in diretta, una prova di fellatio alla tequila, sesso consumato in un vicolo, la scena di un massacro (incidente? autobomba?) con corpi e pezzi di corpi sparsi per la strada. Ovviamente evito di mettere i link ai video ma qualche schermata può rendere l'idea.

Privacy, questa sconosciuta.

Verrebe da chiedersi come mai nessuno abbia "segnalato" questi video per la rimozione; la risposta è che hanno avuto una audience così ristretta che la probabilità di essere visti da una persona che si prenda la briga di segnalarli è minima. In effetti non troverete nessuno di questi video semplicemente digitando nel box di ricerca termini come "sesso" e "tequila", magari ne trovereti altri, ma non questi. Tra parentesi ho notato che alcuni di questi video hanno zero visualizzazioni, che vuol dire che non l'ha guardato nemmeno chi l'ha caricato...

Volendo sperimentare altre ricerche si noti che è possibile anche cercare video girati in una particolare data, visto che questa è una delle componenti del nome del file. Si consideri anche che quello indicato poco sopra è il nome di un file girato con uno smartphone Android ma ogni smartphone e ogni videocamera potrebbero usare uno schema diverso, ad esempio un file girato da uno smartphone con Windows Phone usa uno schema tipo WP_20140509_155801Z.mp4. Si apre quindi una grande varietà di termini di ricerca.

Questa è una gamba...

Tutto questo è ovviamente solo una curiosità, un esempio pratico di quanto sia illusoria la nostra sicurezza di "trovare tutto", di quanto sia piccolo il nostro mondo digitale che invece nella realtà è enorme. Qui non si tratta di scovare segreti, trasformarsi in hacker e penetrare illecitamente in posti preclusi al pubblico. Anzi, è la dimostrazione di come l'internet nascosta sia raggiungibile come quella indicizzata e di fatto non è per niente "nascosta" ma semplicemente "sconosciuta".

Rimaniamo sempre colpiti quando leggiamo di svariati Petabyte (milioni di Gigabyte) di dati digeriti, elaborati e memorizzati dai grandi motori di ricerca tranne poi scoprire che, secondo le stime, tutto questo è solo l'1% dell'intero web.

Chissà quanto sarà grande il "DeepTube"?