ASCII: spiegazione ed esempi
Il codice ASCII è una codifica di caratteri che determina come i dispositivi elettronici, ad esempio i computer, debbano rappresentare i caratteri. A tal fine, i singoli caratteri vengono convertiti in valori binari, decimali ed esadecimali, consentendo al computer di elaborarli.
- Certificato SSL Wildcard incluso
- Registrazione di dominio sicura
- Indirizzo e-mail professionale da 2 GB
Che cos’è ASCII?
ASCII è uno standard per la rappresentazione di caratteri su dispositivi elettronici. Per capire che cosa significhi, bisogna prima comprendere come funziona a grandi linee un computer. In un computer, i processi di calcolo si basano sempre sul sistema binario: gli 1 (uno) e gli 0 (zero) ne determinano i processi. Anche ASCII è improntato su questo sistema. Lo standard ASCII originario definisce diversi caratteri attraverso 7 bit, corrispondenti a 7 spazi consecutivi, contenenti ciascuno un 1 o uno 0.
ASCII: La codifica di caratteri corrisponde all’American Standard Code for Information Interchange e quindi al suo predecessore statunitense ISO 646 (set di caratteri definiti a livello internazionale). ASCII è un codice a 7 bit capace di definire 128 caratteri (27). La codifica si compone di 33 caratteri non stampabili e 95 stampabili e comprende lettere, segni di interpunzione, cifre e anche caratteri di controllo.
L’ottavo bit (8 bit = 1 byte) viene solitamente utilizzato a fini di verifica. Le estensioni, sempre basate su ASCII, utilizzano questo ottavo bit per ampliare i caratteri disponibili a 256 (28).
In origine l’ottavo bit doveva permettere di rilevare l’eventuale presenza di errori nei dati. Il cosiddetto “bit di parità” permette al destinatario di riconoscere l’inesattezza della sequenza. Tuttavia, consente solamente di riconoscere la presenza di un errore, ma non la sua origine, perciò il controllo di parità risulta poco adatto per la correzione degli errori.
Così ogni carattere corrisponde a una sequenza a 7 cifre di zero e uno, che possono essere rappresentate come cifre decimali o esadecimali. I caratteri ASCII sono suddivisibili in più gruppi:
- Caratteri di controllo (0 - 31 & 127): i caratteri di controllo sono caratteri non stampabili. Servono a trasmettere i comandi al computer o alla stampante e si basano su tecnologie di scrittura a distanza. Con questi caratteri vengono impostate, per esempio, le interruzioni di riga o i tabulatori. Molti di questi caratteri oggigiorno non sono più molto utilizzati.
- Caratteri speciali (32 - 47 / 58 - 64 / 91 - 96 / 123 – 126): i caratteri speciali comprendono tutti quei caratteri stampabili che non sono né lettere né cifre, come ad esempio i segni di interpunzione o i segni tecnico matematici. Anche lo spazio, sebbene non visibile, è comunque stampabile e conta quindi come ASCII, non rientrando nella categoria dei caratteri di controllo come ci si aspetterebbe.
- Cifre (30 – 39): le cifre comprendono le dieci cifre arabe dallo 0 al 9.
- Lettere (65 – 90 / 97 – 122): le lettere sono suddivise in due blocchi, il primo contenente le lettere maiuscole e il secondo quelle minuscole.
Per convertire facilmente dei caratteri nel codice ASCII, potete consultare la tabella ASCII, dove sono elencati i valori binari, decimali ed esadecimali corrispondenti a ogni carattere.
Esempio: caratteri ASCII
Con l’ASCII, il sistema converte i numeri binari in caratteri stampabili o non stampabili a seconda di un determinato standard. Dando un’occhiata alla tabella ASCII, si troveranno i caratteri corrispondenti per i diversi valori numerici.
Esempio:
Il numero binario 01000001 può essere scritto in decimi come 65, in numeri esadecimali come 41. La lettera codificata con questo numero è una “A”. Se continuate a contare verso il basso, troverete le lettere maiuscole elencate in ordine alfabetico. La parola “ASCII”, presa ad esempio, corrisponderebbe quindi ai seguenti valori numerici:
A | S | C | I | I | |
Binario | 01000001 | 01010011 | 01000011 | 01001001 | 01001001 |
Decimale | 65 | 83 | 67 | 73 | 73 |
Esadecimale | 41 | 53 | 43 | 49 | 49 |
Con Windows è possibile digitare i caratteri Unicode – e quindi anche quelli ASCII – attraverso una combinazione di tasti. Tenete premuto il tasto Alt e digitate il valore decimale del carattere attraverso il blocco dei numeri della tastiera.
Codice ASCII: utilizzo e applicazioni
Ancora oggi ASCII ha vari utilizzi, sebbene l’UTF-8 abbia nel frattempo acquisito maggiore importanza nella rappresentazione dei testi. A partire dal 2008 Unicode ha soffiato il titolo di codifica più utilizzata nel World Wide Web alla vecchia codifica a caratteri. Il vantaggio dell’UTF-8 è che il codice è quasi compatibile verso il basso: ASCII è un sottoinsieme di UTF-8 e quindi i primi 128 caratteri sono identici. Poiché l’ASCII può essere visto come il minimo comune denominatore delle forme di codifica più recenti, la vecchia codifica trova ancora utilizzo nelle e-mail e negli URL.
Gli utenti possono utilizzare naturalmente anche Unicode per la creazione di e-mail, e persino dotare i domini di accenti grazie all’IDN (Internationalized Domain Names). Tuttavia, in entrambi i casi, il testo deve essere convertito nel formato ASCII prima della trasmissione, ma gli utenti non se ne accorgono, poiché il processo avviene automaticamente.
Da diverso tempo ormai, la codifica ASCII viene utilizzata meno per fini tecnici quanto per scopi artistici: per arte ASCII si intende la creazione di immagini attraverso l’utilizzo di caratteri stampabili della tabella ASCII. La gamma è sufficientemente larga per scritte, figure stilizzate e anche dipinti veri e propri. Gli artisti ASCII sfruttano varie luminosità dei singoli caratteri, riuscendo così a realizzare anche delle ombreggiature.
Breve storia del codice ASCII
La American Standards Association (ASA), anche conosciuta come American National Standards Institute (ANSI), ha approvato l’American Standard Code for Information Interchange (ASCII) già nel 1963, fornendo così le disposizioni necessarie per la mappatura dei caratteri da parte dei dispostivi elettronici. Trattandosi di uno standard puramente statunitense, si parla spesso anche di US-ASCII.
I suoi predecessori includono il codice Morse o le codifiche utilizzate per il telegrafo: un codice standardizzato (come, ad esempio, una sequenza di segnali acustici) viene tradotto sotto forma di testo. ASCII fu introdotto perché i computer non possono funzionare con il nostro alfabeto, essendo i loro processi interni basati sul sistema binario.
Fino a oggi, solo raramente sono state apportate modifiche allo standard dei caratteri, ovvero quando è stato necessario adattarlo a nuove esigenze. Esistono ad esempio delle estensioni che utilizzano anche un ottavo bit, così da poter rappresentare anche le peculiarità nazionali, come gli accenti (à, è, ò). La versione più popolare in Italia è quella dell’Europa occidentale, chiamata “alfabeti latini no. 1” (ISO 88591-1), basata sul codice ASCII.
Un passaggio dall’alfabeto latino ai caratteri di scrittura arabi va tuttavia escluso. Perciò nel frattempo sono state abbondantemente utilizzate le codifiche di caratteri basati su Unicode come l’UTF-8: Unicode offre spazio per più di un milione di caratteri diversi, ed è inoltre compatibile con ASCII; infatti, i due sistemi codificano i primi 128 caratteri nello stesso modo.