Lumanità dellinternet
(le vie della rete sono infinite)di Giancarlo Livraghi
gian@gandalf.it
Capitolo 47
Una parentesi tecnica:
domain, host, indirizzi IP
Prima di proseguire, ed entrare in qualche dettaglio sulluso pratico della rete, mi sembra opportuno aprire una piccola parentesi tecnica. Le persone che conoscono bene le tecnologie della rete possono saltare questo capitolo; e mi perdoneranno, spero, se per spiegare alcuni concetti essenziali mi esprimo in un modo che non è tecnicamente o scientificamente preciso. Non sto cercando di esplorare il complesso (e spesso astruso) terreno delle tecnologie, ma solo di riassumere alcuni concetti che possono essere utili anche a chi vuole semplicemente usare bene la rete. Chiedo un po di pazienza a chi non ama le tecnologie e il loro gergo. Senza entrare in dettagli inutilmente complicati, ci sono alcuni fatti essenziali che è meglio conoscere.
La posta elettronica esiste da più di trentanni. Cerano sistemi di e-mail funzionanti molto prima che si diffondesse luso dellinternet. Quello attualmente più diffuso, e che si serve dellinternet, nacque nel 1971; lanno dopo fu adottato il segno @ (in inglese significa at, cioè a nel senso di luogo) che è diventato abituale in Italia chiamare la chioccioletta. Fu adottato quel segno perché era già esistente nei codici convenzionali e sulle tastiere. La sua funzione è separare lidentità personale dallindirizzo. Il testo (una o più parole) che precede la @ è la id (identità) della persona; può essere il suo nome o qualsiasi altro termine con cui si identifica in rete. Quello che segue è lindirizzo; cioè il domain o comunque lidentità del servizio dove quella persona ha una mailbox, cioè una casella postale.
Naturalmente possono esserci identità collettive, come quando in unorganizzazione ci sono mailbox riferite a servizi (per esempio info) o in una famiglia più persone usano la stessa identità. Ma dal punto di vista dei sistemi di rete è come se si trattasse di una sola persona. Cioè conta lid indipendentemente da chi ha la facoltà di utilizzarla
La cosa è complicata dal fatto che si possono spedire messaggi con identità immaginarie o inesistenti ma non si possono ricevere se non sono indirizzati a una maibox riconosciuta dal sistema
Ogni comunicazione che viaggia in rete ha un indirizzo IP, cioè un codice numerico che permette al protocollo internet di farla arrivare a destinazione. (Vedi lappendice 1 su come funziona linternet). Questi codici identificano il mittente e il destinatario. Un sistema di codici alfanumerici ci permette di definire quegli indirizzi con una combinazione di segni alfabetici (lettere e punteggiatura). Ogni host ha un suo indirizzo IP, che è identificato dal testo che viene dopo la @. Invece la nostra casella postale non ha un indirizzo fisso e autonomo.
Ogni volta che ci colleghiamo, ci viene assegnato un numero IP provvisorio. Ma questo è un dettaglio che, per la maggior parte degli utenti della rete, è irrilevante. Se abbiamo un indirizzo e-mail indipendente dal provider, la rete lo riconoscerà anche quando cambieremo fornitore o server (lindirizzo IP cambierà, ma linternet troverà il nuovo percorso grazie al sistema DNS vedi più avanti).
In pratica questo vuol dire che non abbiamo un nostro segnale di identificazione e che la nostra possibilità di accedere alla rete dipende dallidentità riconosciuta di un host; che può essere quello di un provider, dellorganizzazione in cui lavoriamo o di chi per qualsiasi motivo ci concede luso di una casella su un domain di cui è titolare.
La world wide web è nata molto più tardi, nel 1990 (e non ha avuto una larga diffusione prima del 1994). Usa lo stesso sistema di indirizzi IP ma con un codice diverso. Il host viene identificato dalla parte iniziale dellindirizzo, quella che viene dopo http:// (e può essere preceduta o non dalla sigla www) e prima di eventuali elementi di indirizzo interno separati da / che permettono di trovare una specifica pagina. Cioè sul domain oceano.it possiamo avere la casella postale luigi@oceano.it mentre se ci fosse una nostra pagina su un sito a quellindirizzo si potrebbe chiamare http://oceano.it/opinioni/luigi.htm oppure http://www.oceano.it/opinioni/luigi.html o qualcosaltro (spesso con un indirizzo più lungo che in questi esempi immaginari) secondo il modo in cui oceano organizza il suo sito.
Si possono usare le estensioni .html o .htm secondo le preferenze di chi organizza il sito; questa è una delle piccole complicazioni che possono indurci in errore quando dobbiamo scrivere a mano un indirizzo web.
Un dettaglio tecnico non irrilevante: gli indirizzi e-mail non sono case sensitive, cioè non ha importanza se si usano le maiuscole o le minuscole. Possiamo scrivere a Luigi@Oceano.it oppure a luigi@oceano.it il messaggio arriverà ugualmente a destinazione. Invece negli indirizzi web la cosa è meno semplice. Qualche volta sono concepiti per facilitare, cioè funzionare indipendentemente dalle maiuscole o minuscole; ma più spesso è necessario che lindirizzo sia esatto anche nei minimi dettagli. In generale dobbiamo ricordare che il sistema è stupido, cioè non è in grado di interpretare. Se su una busta sbagliamo lortografia di un nome o di un indirizzo, il postino può rimediare. Negli indirizzi elettronici non sono ammessi i refusi.
Una complicazione in più è luso, in alcuni indirizzi web, del segno ~ (tilde) che non si trova sulla maggior parte delle tastiere italiane. Nel caso che ci si trovasse a dover compilare a mano un indirizzo del genere, è utile sapere che ~ è il carattere ASCII numero 126 e quindi si può inserire usando il tasto alt e i numeri 1-2-6 sul tastierino numerico.
Per concludere questa parentesi, mi sembra necessario un chiarimento su domain e host. Il sistema DNS (domain name system) è stato definito nel 1984.
Gli indirizzi IP (internet protocol) sono numeri. Il domain naming system identifica quei numeri attraverso un nome: cioè codice alfabetico che può basarsi su nomi di persone (o di imprese o organizzazioni) o su altre parole con un significato riconoscibile. Una delle conseguenze di questo sistema è che se siamo titolari di un domain possiamo cambiare provider o server mantenendo la nostra identità. In questo caso il numero IP cambia, ma il sistema DNS impara a ritrovarci e così il nostro indirizzo in rete rimane invariato.
Nel mondo ci sono circa 260 top level domain (cioè la sigla alla fine dellindirizzo). Alcuni sono americani e definiscono categorie come .com (commerciale, cioè in generale qualsiasi impresa privata) .edu (educazione, cioè prevalentemente università) .org (organizzazione, di solito associazioni o altre entità senza fini di lucro) .net (rete) .gov (governo si intende quello degli Stati Uniti) .mil (riservato alle forze armate USA). Cè anche .us ma è poco usato. Nel momento in cui questo libro va in stampa si stanno definendo altri suffissi; fra un po di tempo vedremo comparire domain che finiscono con .info .biz .pro ... eccetera.
In tutto il resto del mondo i top level domain identificano il paese dorigine. Per lItalia .it, per la Francia .fr, per la Germania .de, per la Gran Bretagna .uk, per la Spagna .es ... eccetera. Ma non necessariamente un indirizzo corrisponde alla sede fisica. Unimpresa italiana può avere un indirizzo .it e operare su un server situato in qualsiasi parte del pianeta. Come può scegliere di avere una estensione diversa.
Infatti ci sono organizzazioni italiane (come di altri paesi) che hanno indirizzi americani come .com o .org o .net e ci si può anche sbizzarrire, come alcune emittenti televisive che hanno registrato un domain a Tuvalu (un arcipelago nellOceano Pacifico) per potersi chiamare pincopallino.tv (se qualcuno sta a Torino potrebbe registrarsi a Tonga .to se è a Napoli in Namibia .na eccetera... ma sarebbe difficile per uno di Varese avere .va, che è il Vaticano).
* * *
Una curiosità, che pochi conoscono, è il fatto che esiste una web parallela e non ufficiale, con categorie di top level domain che non risultano al normale DNS. Come .home .social .wine .nomad .god ... eccetera. Non si accede a questi sistemi con luso normale dei browser; occorre ricorrere a qualche artificio tecnico. Per chi volesse sapere qualcosa di più su questa altra web cè una spiegazione completa in un tutorial (in italiano) su Puntonet
* * *
Il concetto di host è diverso da quello di domain. Molti sembrano pensare che un host sia una macchina connessa alla rete, ma non è così. Era vero alle origini dellinternet, quando un host era un dispositivo separato che serviva come intermediario fra la rete e i grandi computer di allora. Oggi un host (spero che mi si perdoni la semplificazione) è qualsiasi cosa che abbia un indirizzo IP e possono esserci diversi indirizzi (quindi host) sullo stesso server. Nel mondo ci sono quasi 30 milioni di domain e oltre 100 milioni di host internet.
Anche se è ovvio, può essere utile ricordare che la distanza fra due nodi della rete non si misura in chilometri, ma in hop (salti). Questo significa che la connessione con qualcosa che sta in Olanda o negli Stati Uniti può essere più veloce che con una macchina situata in Italia se il percorso in rete è più diretto. Inoltre il sistema non ha percorsi fissi ma sceglie, secondo il caso e la situazione, la strada migliore disponibile; quindi lo stesso collegamento può essere più o meno lontano secondo il momento in cui avviene. Questo è uno dei motivi per cui la visione di un sito, o il trasferimento di un file, può essere più o meno veloce secondo le circostanze.
Spesso in rete si ha una percezione di lentezza. Questo dipende in parte da una percezione soggettiva. Un minuto è breve nella nostra abituale esperienza della vita dieci secondi possono sembrare molto lunghi se stiamo fermi a guardare un monitor. Ma è anche oggettivamente vero che spesso le connessioni sono lente. Questo non dipende solo dalla velocità del collegamento che abbiamo con il nostro provider. In qualsiasi punto della rete si può creare un collo di bottiglia, cioè un rallentamento. Se una certa quantità di informazione (tecnicamente bit o byte) sta cercando di passare per un certo punto, si crea un ingorgo: prima che ciò che stiamo cercando di trasmettere o ricevere possa passare deve aspettare il suo turno e questo allunga i tempi. (Nel gergo tecnico si parla di bandnwidth, larghezza di banda e quindi di carico di banda per indicare la quantità di dati che cerchiamo di mandare o ricevere).
Come nella fisica, o nei comuni sistemi di pesi e misure, si parla di kilobit o kilobyte (in sintesi k) per indicare mille, di mega (M) per un milione. E ormai le dimensioni sono tali che si usano termini come giga per indicare un miliardo e tera per mille miliardi. Per chi non lo sapesse... un byte è ununità di comunicazione (corrisponde a un carattere dellalfabeto comprese le lettere, i numeri, i segni di interpunzione e altri segnali) che è fatta di 8 bit (lunità di base nel codice binario dei computer). Sono di 7 bit quei 134 caratteri-base dellalfabeto ASCII (lo standard per la comunicazione elettronica) che costituiscono il codice di trasmissione nellinternet. Questo sarebbe solo un dettaglio tecnico se non influisse sulla codificazione dei caratteri, come vedremo nel prossimo capitolo a proposito delle lettere accentate.
E inoltre... anche quando il percorso è veloce possiamo trovare un appesantimento al punto di arrivo, o perché in quel momento cè molto traffico su quel host o perché qualcosa è particolarmente ingombrante come nel caso di trasferimento di software (che tende a diventare sempre più pesante) oppure di siti web mal concepiti e sovraccarichi di inutili ingombri (una malattia, purtroppo, molto diffusa).
Indice dei capitoli online
Ritorno alla pagina
di presentazione del libro