Fork me on GitHub
con Valerio Galano

Il podcast dove si ragiona da informatici

Un informatico risolve problemi, a volte anche usando il computer

Riflessioni e idee dal mondo del software

Episodio del podcast

Gli strati del Web

27 marzo 2019 Podcast Episodio 6 Stagione 1
Gli strati del Web

Descrizione

Internet, Web, Deep Web e Dark Web. Proviamo a fare un po’ di chiarezza.

Fonti:
Tanenbaum, Wetherall, Reti di calcolatori - https://amzn.to/2MHSFYi
TCP/IP Definition - http://www.linfo.org/tcp_ip.html
The Deep Web vs. The Dark Web - https://www.dictionary.com/e/dark-web/
Hacker Lexicon: What Is the Dark Web? - https://www.wired.com/2014/11/hacker-lexicon-whats-dark-web/
The birth of the Web - https://home.cern/science/computing/birth-web

Il primo sito Web - http://info.cern.ch/hypertext/WWW/TheProject.html

Alcune effrazioni conosciute - https://haveibeenpwned.com/PwnedWebsites

Attrezzature:
Microfono Blue Yeti* - https://amzn.to/3kSE35f
Filtro anti-pop* - https://amzn.to/3baPMsh
Filtro anti-pop* - https://amzn.to/2MH0Wf1
Schermo fonoassorbente* - https://amzn.to/3sOZE0P

Sostieni il progetto

Sostieni tramite Satispay
Sostieni tramite Revolut
Sostieni tramite PayPal
Sostieni utilizzando i link affiliati di Pensieri in codice: Amazon, Todoist, Readwise Reader, Satispay

Partner

GrUSP (Codice sconto per tutti gli eventi: community_PIC)
Schrödinger Hat

Crediti

Montaggio - Daniele Galano - https://www.instagram.com/daniele_galano/
Voce intro - Costanza Martina Vitale
Musica - Kubbi - Up In My Jam
Musica - Light-foot - Moldy Lotion
Cover e trascrizione - Francesco Zubani

Mostra testo dell'episodio

Nascondi

Quella che segue è una trascrizione automatica dell'episodio.

Pensieri in codice. Idee dal mondo del software a cura di Valerio Galano. Salve a tutti e ben ritrovati per questo nuovo episodio di Pensieri in codice, il podcast in cui parliamo di idee prese dal mondo del software, di internet e della programmazione. Come forse già saprete, in questo mese, marzo 2019, ricorre il trentesimo anniversario della nascita di uno strumento che, negli ultimi anni, è entrato prepotentemente a far parte delle nostre vite, e cioè il web. In occasione di questa ricorrenza vorrei parlare un po’ con voi di quelli che sono gli strati che lo compongono e provare quindi a inquadrare il più precisamente possibile i concetti di web, deep web e dark web. Iniziamo quindi subito col chiarire un punto, e cioè nonostante molto spesso si parli in modo indifferente di internet e web, essi in realtà non sono la stessa cosa. Internet, infatti, è una rete mondiale formata da miliardi di nodi interconnessi fra loro. Questi nodi possono essere server, computer, smartphone, dispositivi indossabili, dispositivi IoT e, in generale, qualsiasi apparecchio che possieda un indirizzo IP. Le origini di internet vengono fatte risalire ufficialmente al 1982, anno in cui venne per la prima volta utilizzata la parola internet, e fu definito il protocollo TCPIP, che è il fondamento sul quale si basa la comunicazione tra i nodi della rete. Fino ad allora esistevano già delle reti di computer interconnessi fra loro, ma erano localizzate in specifiche aree, come gli Stati Uniti o la Francia, ed erano di proprietà nazionale. Fu proprio da una di queste reti, conosciuta come ARPANET, e sviluppata dal Ministero della Difesa americano a partire dagli anni 60, che prese vita quella che noi oggi conosciamo come internet. Per quanto riguarda il web invece, esso nacque nel 1989 da un’idea di Tim Barners-Lee, che all’epoca lavorava come stagista al CERN di Ginevra. Lee, anche basandosi su varie idee che già in quegli anni iniziavano a circolare, avviò l’elaborazione di un software che permettesse di condividere documentazione tra più computer in modo indipendente rispetto alla piattaforma utilizzata. Per ottenere ciò diede il via alla definizione di quelli che oggi noi conosciamo come linguaggio HTML e protocollo HTTP. Il primo serve ad implementare a livello informatico il concetto di ipertesto, formulato da Ted Nelson negli anni 60 e di cui parleremo in modo più approfondito in un prossimo episodio. Il secondo invece aveva il compito di rendere possibile la trasmissione degli ipertesti tra computer interconnessi fra loro, in pratica quindi sulla rete internet. Dopo circa due anni, nel 1991, ultimato lo sviluppo dei software necessari, Lee fu in grado di pubblicare il primo sito web della storia visibile solo ai dipendenti del CERN e nel quale veniva definito il progetto WWW, tant’è vero che il nome presteso del web è World Wide Web. Se siete curiosi di vedere come fosse fatto il primo sito web della storia, in descrizione trovate un link al quale è possibile visitare una riproduzione del sito web pubblicato da Lee nel 91. Da allora, come tutti sappiamo, il web ha fatto enormi passi avanti con l’introduzione di moltissime nuove tecnologie che permettono di sviluppare funzionalità sempre più avanzate. La diffusione è diventata tale che ormai moltissime delle attività umane passano per il web e la rete internet. Con il passare degli anni il web si è evoluto e ha sviluppato una stratificazione in tre livelli ben distinti. A mio parere, conoscere questi strati, questi livelli e sapere come distinguerli è importante anche solo per poter comprendere una notizia o partecipare ad un discorso al riguardo. Il primo di questi livelli è conosciuto con il nome di Surface Web e si compone di tutti quei siti, pagine, documenti, immagini e in generale le risorse che risultano direttamente accessibili senza alcuna barriera o necessità di autorizzazione. Molto spesso esso viene anche definito come tutta quella parte di web che è indicizzata dai motori di ricerca. Il secondo strato invece prende il nome di Deep Web, ma contrariamente a quello che potrebbe sembrare dal nome e da quelle che sono le idee comunemente diffuse, esso è semplicemente la parte di web che non è direttamente accessibile se non si possiedono specifiche informazioni o autorizzazioni. Si parla dunque di tutto ciò che, pur essendo sul web, non risulta indicizzato dai motori di ricerca. In pratica è la parte più estesa del web, perché è composta da tutti quei contenuti protetti da un qualche sistema di autenticazione o sottoposti a un qualche tipo di restrizione dell’accesso, quindi non solo aree private, forum o web software, ma anche chat, email, post privati sui social network ecc. Persino i siti troppo nuovi o quelli per i quali non esistono link che vi facciano riferimento, tramite i quali uno spider di un motore di ricerca possa raggiungerli, vanno catalogati nel deep web perché essi non possono o non sono ancora stati indicizzati. Il terzo ed ultimo livello del web, quello più basso, è rappresentato dal dark web. Questa è sicuramente la parte di web più difficile a cui accedere. Concettualmente è un sottoinsieme del deep web perché è composta da una serie di risorse private, tuttavia per accedervi non è sufficiente essere in possesso di informazioni, siano esse link privati o credenziali, ma è necessario munirsi di speciali software e tecnologie apposite. Per accedere al dark web infatti è necessario collegarsi a reti conosciute come darknet e per fare ciò occorre utilizzare speciali software come browser appositamente modificati, ad esempio il browser tor o particolari servizi vpn. Catalogare il contenuto del dark web è impresa impossibile, tuttavia dal momento che ci si trova in un contesto dove non è possibile risalire ai gestori dei server o a chi pubblica i siti è ragionevole supporre che siano presenti tutta una serie di contenuti digitali che legalmente non dovrebbero essere condivisi. Sicuramente sarà possibile accedere a immagini di ogni genere e poi a dati, password e informazioni sensibili sottratte grazie a intrusioni nei grandi database di servizi come facebook, linkedin ecc. A questo proposito vi lascio in descrizione un link che elenca un po’ di queste frazioni giusto per farvi un’idea di quante siano state confermate e immaginare quante ce ne potrebbero ancora essere che non sono state ufficializzate. Su questo stesso sito potete anche verificare se le vostre credenziali siano mai state sottratte in occasione di una di queste frazioni, ma di questo argomento parleremo in una prossima puntata. Al di là di questi tipi di utilizzi, che poi sono anche i più diffusi nell’immaginario comune, non va però sottovalutato il fatto che il dark web ha anche un’altra funzione molto importante di protezione degli utenti e delle libertà individuali. Rendendo infatti sicuro lo scambio di informazioni e non rintracciabili le fonti, esso protegge la libertà di espressione di tante persone che per loro sfortuna si trovano a dover vivere in regimi che operano controlli di massa. Per questi stessi motivi esso salvaguarda anche la sicurezza dei dissidenti politici e permette la circolazione di quelle notizie che normalmente sarebbero sottoposte a censura. Bene, fatta questa doverosa precisazione io vi ringrazio per avermi ascoltato fin qui e spero che il concetto di deep web e dark web sia un po’ più chiaro di prima. Vi rubo solo un ultimo minuto per ringraziarvi di tutte le interazioni e tutti i suggerimenti che ad ogni puntata mi state inviando e che io sto cercando di mettere in pratica. Inoltre vi annuncio la creazione di un gruppo telegram dedicato a pensieri in codice nel quale potremmo confrontarci e scambiare opinioni. Se vi va trovate il link in descrizione e potete liberamente unirvi per discutere degli argomenti del podcast. Detto questo vi saluto e vi auguro una buona giornata e vi do appuntamento alla prossima settimana.

Nascondi