parentesi tecnica

L’umanità dell’internet
(le vie della rete sono infinite)

di Giancarlo Livraghi
gian@gandalf.it

Capitolo 47
Una “parentesi tecnica”:
domain, host, indirizzi IP

Prima di proseguire, ed entrare in qualche dettaglio sull’uso pratico della rete, mi sembra opportuno aprire una piccola parentesi tecnica. Le persone che conoscono bene le tecnologie della rete possono “saltare” questo capitolo; e mi perdoneranno, spero, se per spiegare alcuni concetti essenziali mi esprimo in un modo che non è tecnicamente o scientificamente preciso. Non sto cercando di esplorare il complesso (e spesso astruso) terreno delle tecnologie, ma solo di riassumere alcuni concetti che possono essere utili anche a chi vuole semplicemente usare bene la rete. Chiedo un po’ di pazienza a chi non ama le tecnologie e il loro “gergo”. Senza entrare in dettagli inutilmente complicati, ci sono alcuni fatti essenziali che è meglio conoscere.

La “posta elettronica” esiste da più di trent’anni. C’erano sistemi di e-mail funzionanti molto prima che si diffondesse l’uso dell’internet. Quello attualmente più diffuso, e che si serve dell’internet, nacque nel 1971; l’anno dopo fu adottato il segno @ (in inglese significa “at”, cioè “a” nel senso di luogo) che è diventato abituale in Italia chiamare “la chioccioletta”. Fu adottato quel segno perché era già esistente nei “codici” convenzionali e sulle tastiere. La sua funzione è separare l’identità personale dall’indirizzo. Il testo (una o più parole) che precede la @ è la “id” (identità) della persona; può essere il suo nome o qualsiasi altro termine con cui si identifica in rete. Quello che segue è l’indirizzo; cioè il domain o comunque l’identità del servizio dove quella persona ha una mailbox, cioè una “casella postale”.

Naturalmente possono esserci identità “collettive”, come quando in un’organizzazione ci sono mailbox riferite a servizi (per esempio “info”) o in una famiglia più persone usano la stessa identità. Ma dal punto di vista dei sistemi di rete è come se si trattasse di una sola persona. Cioè conta l’id indipendentemente da chi ha la facoltà di utilizzarla

La cosa è complicata dal fatto che si possono spedire messaggi con identità immaginarie o inesistenti – ma non si possono ricevere se non sono indirizzati a una maibox riconosciuta dal sistema

Ogni comunicazione che viaggia in rete ha un “indirizzo IP”, cioè un codice numerico che permette al “protocollo” internet di farla arrivare a destinazione. (Vedi l’appendice 1 su come funziona l’internet). Questi codici identificano il mittente e il destinatario. Un sistema di codici “alfanumerici” ci permette di definire quegli indirizzi con una combinazione di segni alfabetici (lettere e punteggiatura). Ogni host ha un suo indirizzo IP, che è identificato dal testo che viene dopo la @. Invece la nostra “casella postale” non ha un indirizzo fisso e autonomo.

Ogni volta che ci colleghiamo, ci viene assegnato un “numero IP provvisorio”. Ma questo è un dettaglio che, per la maggior parte degli “utenti” della rete, è irrilevante. Se abbiamo un indirizzo e-mail indipendente dal provider, la rete lo riconoscerà anche quando cambieremo fornitore o server (l’indirizzo IP cambierà, ma l’internet troverà il nuovo percorso grazie al sistema DNS – vedi più avanti).

In pratica questo vuol dire che non abbiamo un “nostro” segnale di identificazione e che la nostra possibilità di accedere alla rete dipende dall’identità riconosciuta di un host; che può essere quello di un provider, dell’organizzazione in cui lavoriamo o di chi per qualsiasi motivo ci concede l’uso di una “casella” su un domain di cui è titolare.

La world wide web è nata molto più tardi, nel 1990 (e non ha avuto una larga diffusione prima del 1994). Usa lo stesso sistema di “indirizzi IP” ma con un codice diverso. Il host viene identificato dalla parte iniziale dell’indirizzo, quella che viene dopo http:// (e può essere preceduta o non dalla sigla www) e prima di eventuali elementi di “indirizzo interno” separati da / che permettono di trovare una specifica pagina. Cioè sul domain oceano.it possiamo avere la “casella postale” luigi@oceano.it mentre se ci fosse una nostra pagina su un “sito” a quell’indirizzo si potrebbe chiamare http://oceano.it/opinioni/luigi.htm oppure http://www.oceano.it/opinioni/luigi.html – o qualcos’altro (spesso con un “indirizzo” più lungo che in questi esempi immaginari) secondo il modo in cui “oceano” organizza il suo sito.

Si possono usare le “estensioni” .html o .htm secondo le preferenze di chi organizza il sito; questa è una delle piccole complicazioni che possono indurci in errore quando dobbiamo scrivere “a mano” un indirizzo web.

Un dettaglio tecnico non irrilevante: gli indirizzi e-mail non sono case sensitive, cioè non ha importanza se si usano le maiuscole o le minuscole. Possiamo scrivere a Luigi@Oceano.it oppure a luigi@oceano.it – il messaggio arriverà ugualmente a destinazione. Invece negli indirizzi web la cosa è meno semplice. Qualche volta sono concepiti per “facilitare”, cioè funzionare indipendentemente dalle maiuscole o minuscole; ma più spesso è necessario che l’indirizzo sia esatto anche nei minimi dettagli. In generale dobbiamo ricordare che il sistema è “stupido”, cioè non è in grado di “interpretare”. Se su una busta sbagliamo l’ortografia di un nome o di un indirizzo, il postino può rimediare. Negli indirizzi elettronici non sono ammessi i “refusi”.

Una complicazione in più è l’uso, in alcuni indirizzi web, del segno ~ (“tilde”) che non si trova sulla maggior parte delle tastiere italiane. Nel caso che ci si trovasse a dover compilare “a mano” un indirizzo del genere, è utile sapere che ~ è il carattere ASCII numero 126 e quindi si può inserire usando il tasto “alt” e i numeri 1-2-6 sul “tastierino numerico”.

Per concludere questa “parentesi”, mi sembra necessario un chiarimento su domain e host. Il sistema DNS (domain name system) è stato definito nel 1984.

Gli indirizzi IP (internet protocol) sono numeri. Il domain naming system identifica quei numeri attraverso un “nome”: cioè codice “alfabetico” che può basarsi su nomi di persone (o di imprese o organizzazioni) o su altre parole con un significato riconoscibile. Una delle conseguenze di questo sistema è che se siamo titolari di un domain possiamo cambiare provider o server mantenendo la nostra identità. In questo caso il numero IP cambia, ma il sistema DNS impara a ritrovarci e così il nostro “indirizzo” in rete rimane invariato.

Nel mondo ci sono circa 260 top level domain (cioè la sigla alla fine dell’indirizzo). Alcuni sono “americani” e definiscono categorie come .com (“commerciale”, cioè in generale qualsiasi impresa privata) .edu (“educazione”, cioè prevalentemente università) .org (“organizzazione”, di solito associazioni o altre entità “senza fini di lucro”) .net (“rete”) .gov (“governo” – si intende quello degli Stati Uniti) .mil (riservato alle forze armate USA). C’è anche .us ma è poco usato. Nel momento in cui questo libro va in stampa si stanno definendo altri “suffissi”; fra un po’ di tempo vedremo comparire domain che finiscono con .info .biz .pro ... eccetera.

In tutto il resto del mondo i top level domain identificano il paese d’origine. Per l’Italia .it, per la Francia .fr, per la Germania .de, per la Gran Bretagna .uk, per la Spagna .es ... eccetera. Ma non necessariamente un indirizzo corrisponde alla sede “fisica”. Un’impresa italiana può avere un indirizzo .it e operare su un server situato in qualsiasi parte del pianeta. Come può scegliere di avere una “estensione” diversa.

Infatti ci sono organizzazioni italiane (come di altri paesi) che hanno indirizzi “americani” come .com o .org o .net – e ci si può anche sbizzarrire, come alcune emittenti televisive che hanno registrato un domain a Tuvalu (un arcipelago nell’Oceano Pacifico) per potersi chiamare pincopallino.tv (se qualcuno sta a Torino potrebbe registrarsi a Tonga .to – se è a Napoli in Namibia .na – eccetera... ma sarebbe difficile per uno di Varese avere .va, che è il Vaticano).

* * *

Una curiosità, che pochi conoscono, è il fatto che esiste una web “parallela” e “non ufficiale”, con categorie di top level domain che non risultano al normale DNS. Come .home .social .wine .nomad .god ... eccetera. Non si accede a questi sistemi con l’uso normale dei browser; occorre ricorrere a qualche artificio tecnico. Per chi volesse sapere qualcosa di più su questa “altra web” c’è una spiegazione completa in un tutorial (in italiano) su Puntonet

* * *

Il concetto di host è diverso da quello di domain. Molti sembrano pensare che un host sia una macchina connessa alla rete, ma non è così. Era vero alle origini dell’internet, quando un host era un dispositivo separato che serviva come “intermediario” fra la rete e i grandi computer di allora. Oggi un host (spero che mi si perdoni la semplificazione) è “qualsiasi cosa che abbia un indirizzo IP” e possono esserci diversi indirizzi (quindi host) sullo stesso server. Nel mondo ci sono quasi 30 milioni di domain e oltre 100 milioni di host internet.

Anche se è ovvio, può essere utile ricordare che la “distanza” fra due nodi della rete non si misura in chilometri, ma in hop (salti). Questo significa che la connessione con qualcosa che sta in Olanda o negli Stati Uniti può essere più veloce che con una macchina situata in Italia se il percorso in rete è più diretto. Inoltre il sistema non ha percorsi “fissi” ma sceglie, secondo il caso e la situazione, la strada migliore disponibile; quindi lo stesso collegamento può essere più o meno “lontano” secondo il momento in cui avviene. Questo è uno dei motivi per cui la visione di un sito, o il trasferimento di un file, può essere più o meno veloce secondo le circostanze.

Spesso in rete si ha una percezione di “lentezza”. Questo dipende in parte da una percezione soggettiva. Un minuto è breve nella nostra abituale esperienza della vita – dieci secondi possono sembrare molto lunghi se stiamo fermi a guardare un monitor. Ma è anche “oggettivamente” vero che spesso le connessioni sono lente. Questo non dipende solo dalla velocità del collegamento che abbiamo con il nostro provider. In qualsiasi punto della rete si può creare un “collo di bottiglia”, cioè un rallentamento. Se una certa quantità di “informazione” (tecnicamente bit o byte) sta cercando di passare per un certo punto, si crea un ingorgo: prima che ciò che stiamo cercando di trasmettere o ricevere possa passare deve “aspettare il suo turno” – e questo allunga i tempi. (Nel gergo tecnico si parla di bandnwidth, “larghezza di banda” – e quindi di “carico di banda” per indicare la quantità di “dati” che cerchiamo di mandare o ricevere).

Come nella fisica, o nei comuni sistemi di “pesi e misure”, si parla di kilobit o kilobyte (in sintesi k) per indicare mille, di “mega” (M) per un milione. E ormai le dimensioni sono tali che si usano termini come “giga” per indicare un miliardo e “tera” per mille miliardi. Per chi non lo sapesse... un byte è un’unità di comunicazione (corrisponde a un “carattere” dell’alfabeto – comprese le lettere, i numeri, i “segni di interpunzione” e altri “segnali”) che è fatta di 8 bit (l’unità di base nel codice binario dei computer). Sono di 7 bit quei 134 caratteri-base dell’alfabeto ASCII (lo standard per la comunicazione elettronica) che costituiscono il codice di trasmissione nell’internet. Questo sarebbe solo un dettaglio tecnico se non influisse sulla “codificazione” dei caratteri, come vedremo nel prossimo capitolo a proposito delle lettere “accentate”.

E inoltre... anche quando il percorso è veloce possiamo trovare un appesantimento al punto di arrivo, o perché in quel momento c’è molto “traffico” su quel host o perché qualcosa è particolarmente ingombrante – come nel caso di trasferimento di software (che tende a diventare sempre più pesante) oppure di “siti web” mal concepiti e sovraccarichi di inutili ingombri (una malattia, purtroppo, molto diffusa).

Indice dei capitoli online

Ritorno alla pagina
di presentazione del libro

home