Domini IDN: una spiegazione sui nomi di dominio internazionalizzati

Secondo dati forniti dall’International Telecommunication Union (ITU), più di tre miliardi di persone in tutto il mondo sfruttano le numerose possibilità del World Wide Web, sempre più spesso offerte nella loro lingua madre. A rendere possibile tutto questo sono i nomi di dominio internazionalizzati (IDN), a disposizione degli utenti dal 2003. Ti spieghiamo come funzionano i domini IDN.

Che cos’è un nome di dominio internazionalizzato (IDN)?

L’IETF (Internet Engineering Task Force) definisce IDN i nomi di dominio che contengono caratteri speciali oltre alle lettere dell’alfabeto latino, come dieresi o caratteri di altri alfabeti. Tuttavia, questi nomi di dominio non sono compresi dal Domain Name System (DNS), responsabile della traduzione degli URL in indirizzi IP. Il DNS si basa sull’insieme limitato di caratteri standard ASCII.

Per rendere gli IDN comprensibili al DNS e ad altri protocolli internet, nel 2003 è stato creato lo standard internet “Internationalizing Domain Names in Applications” (IDNA). Questo standard definisce una traduzione standardizzata da Unicode ad ASCII, consentendo così l’uso di caratteri non ASCII nei nomi di dominio.

Dominio
Registra il tuo dominio
  • Certificato SSL Wildcard incluso
  • Registrazione di dominio sicura
  • Indirizzo e-mail professionale da 2 GB

Come funziona lo standard IDNA

Per garantire che i nomi di dominio internazionalizzati possano essere elaborati su internet da molti sistemi, che supportano il codice ASCII, ogni dominio IDN, scritto in Unicode, viene convertito in una stringa ACE, che si basa su caratteri ASCII. Ad esempio, gli URL nel browser vengono visualizzati con le dieresi, mentre il server elabora gli indirizzi esclusivamente in formato ASCII. Nello specifico, questa procedura diventa lo standard con IDNA 2003 e la sua successiva modifica IDNA 2008, rilasciata nel 2010. La conversione da Unicode ad ASCII avviene lato client (browser, e-mail, programmi, ecc.) e si basa su Punycode, un sistema di codifica standard.

Punycode

Il sistema di codifica Punycode, definito nella specifica RFC 3492, è stato sviluppato al fine di poter rappresentare le stringhe Unicode in maniera chiara e senza perdite di qualità nei caratteri ASCII. Per farlo, tutti i caratteri non ASCII vengono rimossi dal nome del dominio, codificati e separati da un trattino. Questo codice spiega di quale simbolo Unicode si tratti e la sua posizione nel nome del dominio. Inoltre, ogni stringa ACE creata viene preceduta dal prefisso xn–, che indica chiaramente la stringa che codifica il dominio IDN in conformità allo standard IDNA e a Punycode. Per ottenere una spiegazione dettagliata della procedura di codifica con alcuni esempi, consulta il nostro articolo su Punycode.

Differenze tra IDNA 2003 e IDNA 2008

Nel 2003, prima della codifica con Punycode, gli URL internazionalizzati venivano normalizzati con una procedura Nameprep. In questo processo le maiuscole venivano convertite nelle minuscole, i caratteri speciali eliminati e i simboli di equivalenza uniformati. Ma con l’introduzione di IDNA 2008, Nameprep non fa più parte del processo di conversione. IDNA non impone più alcuna normalizzazione, ma consiglia un algoritmo che trasforma le maiuscole in minuscole.

Per questo circa 8000 simboli, che erano consentiti con il processo IDNA 2003, non vengono più supportati dallo standard IDNA2008. Rispetto a prima, molti simboli vengono interpretati diversamente dopo la modifica dello standard. Se ti interessa, trovi una discussione dettagliata della differenza tra IDNA 2003 e IDNA 2008 in Unicode Technical Standard 46#. La tabella seguente riassume le principali differenze.

IDNA2003 IDNA2008
È necessaria una procedura Nameprep Nessuna normalizzazione specificata
Valido per Unicode 3.2 Valido per le versioni di Unicode 5.2 e successive
Regole rigorose per i font da destra a sinistra Regole più chiare per i font da destra a sinistra
Le lettere maiuscole e minuscole sono considerate caratteri distinti Le lettere maiuscole vengono convertite in minuscole
Molti simboli sono vietati, ad esempio i simboli grafici che non appartengono ad alcun sistema di scrittura e alcuni segni di punteggiatura
Viene eliminato il “remapping” (“rimappatura” in italiano) di alcuni caratteri Unicode, che potrebbe portare a irregolarità

Problemi con i domini IDN

Oggi tutti i programmi internet contemporanei dovrebbero riuscire a comprendere i domini IDN. Ma, tra i problemi dei nomi di dominio internazionalizzati, talvolta c’è ancora il passaggio dallo standard IDNA 2003 a quello IDNA 2008, di cui si subiscono ancora le conseguenze, oltre a questioni relative alla sicurezza. Ad esempio, un malintenzionato può ingannare un utente rinviandolo a un sito web falso allo scopo di carpire le sue informazioni personali. Una possibile soluzione per far fronte a queste difficoltà può essere quella di registrare più varianti di uno stesso nome di dominio e reindirizzare la variante secondaria al dominio principale tramite un reindirizzamento del dominio.

Hai trovato questo articolo utile?
Per offrirti una migliore esperienza di navigazione online questo sito web usa dei cookie, propri e di terze parti. Continuando a navigare sul sito acconsenti all’utilizzo dei cookie. Scopri di più sull’uso dei cookie e sulla possibilità di modificarne le impostazioni o negare il consenso.
Page top