Tag canonical: una spiegazione degli URL canonici
Se il contenuto di una pagina è accessibile da più URL, viene classificato come contenuto duplicato (“duplicate content” in inglese), il che può comportare che la pagina in questione non venga indicizzata dal motore di ricerca. Ciò rappresenta una sfida, ad esempio, per i progetti web che offrono contenuti quasi identici nella stessa lingua sotto domini nazionali diversi, come è il caso di un sito in italiano per l’Italia e per la Svizzera. Una possibile soluzione a questo problema è il tag canonical: grazie al suo aiuto è possibile indicare un URL o un URI come risorsa principale per l’indicizzazione.
Cos’è il tag canonical?
Nel 2009, Yahoo, Microsoft e Google hanno introdotto un tag canonical per i link, che è diventato rapidamente uno degli strumenti più importanti per la SEO e, dal 2012, è entrato a far parte della specifica RFC 6596 degli standard web ufficiali. Il link canonico implementato in una pagina web fa riferimento a un URL o URI specifico, chiamato URL canonico, il quale viene utilizzato come risorsa per l’indicizzazione della pagina.
La corretta canonizzazione di un URL permette di aumentare la popolarità del link e la reputazione di un sito web, generando così un buon ranking. Dato che gli URL contrassegnati con il tag non vengono inclusi nell’indice, non sorgerà alcun problema di contenuto duplicato. Tuttavia, l’implementazione del link canonico in una pagina web rappresenta soltanto un suggerimento ai motori di ricerca, i quali non sono tenuti a includere l’attributo del link nella loro valutazione. Se l’implementazione del tag è eseguita in modo scorretto o incompleto, si può correre il rischio che i motori di ricerca ignorino l’intero sito. Per questo motivo è molto importante inserire correttamente il tag canonical.
- Migliore posizionamento su Google senza agenzie esterne
- Risposte veloci a commenti o recensioni sui social media
- Nessuna conoscenza SEO o di marketing online richiesta
Come funziona il tag canonical?
Per far sì che il tag canonical funzioni, sono necessari due passaggi preliminari: prima di tutto bisogna conoscere l’URL esatto della pagina web da canonizzare, poiché questa verrà definita come risorsa principale. Successivamente è necessario un elemento link a cui affiancare l’URL canonico, utilizzando il codice esatto. Di seguito un esempio di tag canonical:
<link rel="canonical" href="URL/URI della pagina web canonica">
htmlL’elemento link, che nel linguaggio HTML è sprovvisto di un tag finale, contiene gli attributi rel e href in qualità di elemento vuoto. Il primo tag è necessario per specificare la relazione tra il documento corrente e quello collegato, mentre il secondo tag serve a indicare dove si trova il documento collegato. I valori riportati tra le virgolette indicano che l’URL collegato è canonico, come è specificato dall’attributo href.
Per fare in modo che le pagine alternative si riferiscano alla risorsa principale, il codice deve essere inserito nell’area di intestazione dei rispettivi documenti HTML. Se il contenuto non è disponibile in HTML, come capita ad esempio per un file PDF, il tag può essere implementato anche nell’header HTTP. Ovviamente, in questo caso la sintassi HTML è leggermente diversa:
Link: <URL/URI della pagina web canonica>; rel="canonical"
htmlQuando è utile utilizzare il tag canonical?
I motori di ricerca non sono obbligati a prendere in considerazione il tag canonical. Dato che il codice deve essere implementato singolarmente per ogni contenuto presente più volte e per ogni URI alternativo, ci si chiede se ne valga realmente la pena. Di seguito ti presentiamo quattro scenari in cui dovresti sicuramente prendere in considerazione l’utilizzo del tag canonical.
I contenuti sono distribuiti su URL dinamici
Oggi gli URL dinamici giocano un ruolo fondamentale, soprattutto per i siti internet dei negozi online. Le pagine web che interagiscono con l’utente, mostrando dei contenuti specifici, fanno sì che diversi utenti possano visualizzare risultati simili (incluse alcune piccole variazioni), eppure queste pagine sono considerate problematiche dai crawler dei motori di ricerca. In questo caso per evitare i contenuti duplicati è consigliabile utilizzare il tag canonical.
Stessi contenuti accessibili da diversi URL
Per motivi strutturali, alcuni progetti web come blog, negozi online o portali di consulenza offrono contenuti in più categorie contemporaneamente e quindi spesso con URL diversi. Ad esempio, un negozio online potrebbe presentare lo stesso riepilogo dell’articolo dedicato alle camicie verdi sui seguenti URL:
-
il-mio-ecommerce.shop/abbigliamento/camicia-verde
-
il-mio-ecommerce.shop/abbigliamento-estivo/camicia-verde
-
il-mio-ecommerce.shop/abbigliamento-invernale/camicia-verde
Il fatto che URL diversi possano rimandare a contenuti uguali tra loro può capitare soprattutto nel momento in cui viene modificata la struttura di un sito web oppure se si è verificato un trasferimento di dominio. In questi casi si ricorre generalmente al reindirizzamento 301, ma se questo risulta impossibile per motivi tecnici, allora si può utilizzare link rel="canonical"
.
Stessi contenuti disponibili su domini differenti
Puoi utilizzare il tag canonical non solo per i collegamenti interni, ma anche per fare riferimento a un dominio esterno. In questo modo i contenuti saranno presenti su un altro dominio senza creare duplicati, mentre i segnali positivi degli utenti, i link e gli altri fattori rilevanti per il ranking verranno trasferiti all’URL originale, migliorando in questo modo le sue prestazioni.
Stessi contenuti in formati differenti
In certi casi specifici è bene curarsi di rendere disponibile uno stesso contenuto in formati diversi: ad esempio, se si deve visualizzare un modulo, sarà meglio non mostrarlo solo in versione HTML, ma anche come file PDF adatto alla stampa. Pertanto, per fare sì che i motori di ricerca non valutino in modo distinto le due versioni, assegnando al sito web un ranking errato, si consiglia di ricorrere al tag canonical.
Se si dispone di un certificato SSL/TLS, bisogna trasformare gli URL HTTPS sicuri in URL canonici. Inoltre, anche le varianti non sicure (HTTP) devono rimandare agli URL canonici. Lo stesso vale anche per le pagine mobili o AMP.
Tag canonical: errori frequenti
In linea di massima, utilizzare un URL canonico resta la soluzione ideale per evitare la presenza di contenuti duplicati all’interno del proprio sito web. Infatti, durante l’indicizzazione di un sito internet i motori di ricerca tendono a riconoscere il tag canonical e riescono a distinguere l’intenzione di non voler assegnare un ranking anche a questo contenuto simile o uguale. In questo frangente i segnali positivi dei motori di ricerca vengono associati a quell’URL specifico, migliorandone il ranking. Tuttavia, va notato che se il tag canonico viene implementato in maniera errata o viene applicato in modo scorretto, può diventare rapidamente un fattore negativo. Nei prossimi paragrafi ti mostriamo gli errori più comuni che si verificano con il tag canonical.
Con lo strumento gratuito SEO Check di IONOS puoi valutare le prestazioni SEO del tuo sito in modo rapido e semplice.
Le pagine numerate rimandano a un URL canonico
Per preparare i contenuti nel migliore dei modi, molti webmaster ricorrono alla cosiddetta paginazione dei dati. In particolare, i giornali e i periodici online ricorrono a questo metodo per ripartire i contenuti e numerare le pagine. Tuttavia, se per i contenuti in serie viene utilizzato il tag canonical implementando link rel="canonical"
su pagine successive a quella iniziale, si commette un grave errore: le pagine numerate non sono duplicati. Ciò che avviene realmente è che i motori di ricerca non indicizzano affatto quel sito web. Se desideri comunque fornire ai motori di ricerca informazioni sul layout di pagina, ti consigliamo di seguire una di queste due procedure:
-
Rimanda in ogni URL sia alla pagina precedente che alla successiva. A questo scopo hai bisogno dell’attributo link
rel
, ma in questo caso devi sostituire il valore"canonical"
con"prev"
o con"next"
. - Con
link rel="canonical"
fai riferimento a una singola versione del contenuto che unisce tutti i contenuti impaginati.
Gli URL relativi non rimandano alla pagina canonica desiderata
Come per la maggior parte dei tag HTML, anche l’elemento <link>
fa riferimento sia agli URL relativi che agli URL assoluti. Mentre gli URL assoluti indicano il percorso completo (“http://” e così via), gli URL relativi rimandano a una cartella specifica del sito web in questione, senza che ci sia bisogno di specificare l’URL completo. Ad esempio, un percorso relativo "immagini/immagine.jpg"
indica che l’immagine immagine.jpg si trova nella sottocartella immagini della directory corrente. Tuttavia, l’utilizzo del tag canonical in percorsi di questo tipo potrebbe causare alcune complicazioni; nel peggiore dei casi i crawler potrebbero completamente ignorare il tag.
Al riguardo Google fa riferimento all’esempio seguente:
< link rel="canonical" href="example.com/cupcake.html" >
htmlData l’assenza del prefisso HTTP, il crawler valuterà l’URL example.com/cupcake.html
come un URL relativo, presumendo poi che l’URL canonico desiderato sia invece http://example.com/example.com/cupcake.html
. Dunque, se si utilizza il tag canonical è sempre preferibile indicare l’URL completo o, in alternativa, fare riferimento almeno a un URL assoluto senza dominio:
< link rel="canonical" href="/cupcake.html" />
htmlL’implementazione di una strategia SEO non corretta può talvolta avere gravi conseguenze per il ranking del tuo sito. Ti mostriamo gli errori più comuni della SEO così da poterli evitare.
Le pagine si riferiscono a più URL canonici
Gli URL canonici non prevedono che una sottopagina si riferisca contemporaneamente a più pagine principali. Tuttavia, è possibile creare rapidamente collegamenti multipli quando si lavora con un Content Management System o con un software per e-commerce. Ciononostante, i plugin e i template utilizzano tag canonici automaticamente, anche se hai già contrassegnato un URL canonico. In particolare, quando si utilizzano tali estensioni e quando si apportano modifiche alla struttura della pagina, è essenziale controllare il codice sorgente e, se necessario, correggere tutte le voci. In caso contrario tutti i tuoi sforzi saranno probabilmente vani, in quanto è probabile che i motori di ricerca ignorino tutti i tag canonical invece di preferirne uno.
- Editor facile e intuitivo con supporto IA
- Immagini e testi d'effetto in pochi secondi
- Dominio, indirizzo e-mail e certificato SSL inclusi
Il tag canonical non è presente nella versione mobile
Se oltre alla versione desktop si vuole diffondere in rete anche la versione mobile del proprio sito web, può capitare che si incappi in molteplici errori quando si tratta di segnalare la struttura corretta. Anche se le pagine in versione mobile vengono indicizzate nonostante gli errori e i dati mancanti, dovresti comunque supportare i motori di ricerca nell’inserimento dei tag e nella classificazione. Ad esempio, Google consiglia di contrassegnare la versione mobile come variante alternativa utilizzando il tag rel="alternate"
e di rimandare agli URL desktop delle pagine mobili tramite il tag canonical. Trovi tutti i consigli e i possibili metodi per non commettere questo tipo di errori suggeriti dal leader dei motori di ricerca nella guida “Best practice per l’indicizzazione di siti mobile e mobile-first”.
La SEO comprende molti componenti delle pagine web, strategie di ottimizzazione e termini tecnici. Pertanto, per chi è agli inizi è spesso difficile orientarsi. Nel nostro glossario per l’ottimizzazione SEO ti insegniamo i termini dell’ottimizzazione per i motori di ricerca dalla A alla Z.
I tag canonical e hreflang si contraddicono
I siti internet internazionali con domini nazionali diversi rappresentano una grande sfida per la SEO. Mentre da un lato tutte le varianti di una pagina web devono ottenere un buon ranking ed essere contemporaneamente disponibili per l’utente giusto, dall’altro bisogna fare sì che i contenuti duplicati siano ridotti al minimo. A tale scopo uno degli strumenti principali è l’attributo hreflang, con cui è possibile contrassegnare ogni variante di una pagina come alternativa equivalente. A tal fine, tuttavia, è necessario che ogni pagina rimandi a sé stessa. Infatti, se un URL rimanda a un URL canonico tramite tag canonical i crawler dei motori di ricerca rilevano una contraddizione.
Il risultato è che il motore di ricerca ignora i segnali e indicizza le pagine web in base ad altre caratteristiche. È pertanto essenziale non utilizzare i due tag nello stesso momento.
Non è soltanto la combinazione tra URL canonici e hreflang a creare incongruenze e conseguenziali effetti negativi sul ranking, bensì anche l’utilizzo simultaneo di tag canonical e istruzioni come nofollow
,noindex
o disallow*
non sono ben visti da Google.
Le differenze tra tag canonical e reindirizzamento 301
A una prima analisi il tag canonical e il reindirizzamento 301 sembrano essere del tutto simili, eppure presentano delle differenze sostanziali. I reindirizzamenti basati sul codice di stato HTTP 301 (Moved Permanently) segnalano ai motori di ricerca che le pagine web con diversi URL ma con contenuto simile devono essere valutate come pagine uniche: in questo caso gli utenti vengono indirizzati all’URL principale, mentre tutte le altre varianti di quella determinata pagina verranno eliminate. Invece, i motori di ricerca riconoscono le pagine implementate con il tag canonical come delle copie: queste rimarranno accessibili e consultabili in qualsiasi momento.
Un’altra differenza importante tra questi due fattori consiste nel fatto che i motori di ricerca non ignorano mai un reindirizzamento, al contrario di quanto a volte avviene con le pagine implementate con l’elemento link. Infine, per concludere, i due metodi differiscono anche in termini di funzionalità riguardo i domini multipli: mentre i reindirizzamenti 301 spostano una pagina da un dominio A a un dominio B, il tag canonical indica soltanto che il dominio B è equivalente al dominio A.