I motori di ricerca e la localizzazione dei siti web: considerazioni sui dialetti inglesi degli Stati Uniti e del Regno Unito per l'internazionalizzazione dei siti

Considerazioni sui dialetti inglesi degli Stati Uniti e del Regno Unito per l’internazionalizzazione dei Siti

Mentre ci sono poche differenze fra i dialetti inglesi degli Stati Uniti e del Regno Unito che potrebbero causare fraintendimenti, la riforma ortografica di Noah Webster conduce ad aspetti interessanti che devono essere presi in considerazione nel momento in cui ti accingi a progettare siti per un pubblico internazionale.

Si tratta del «my favorite color» o «my favourite colour»?

Questa domanda può sembrare accademica ed obsoleta. Tuttavia, il modo in cui fai lo spelling del tuo contenuto di lingua inglese può determinare la visibilità del tuo sito nei motori di ricerca e come il tuo sito viene percepito dai tuoi visitatori.

Con circa due terzi degli anglofoni nativi negli Stati Uniti, l’ortografia americana ha la predominanza nel web. Non sorprende, quindi, che un’indagine non-scientifica delle espressioni di ricerca che usi sia le ortografie del Regno Unito che degli Stati Uniti trovi un numero maggiore di risultati per la variante americana:

Ricerca Google per «my favorite color» (2006-01-17)
Ricerca (tenta!)Risultati Google% Totale
US: my favorite color36.100.00084,9
GB: my favourite colour6.430.00015,1
42.530.000
Ricerca Google per «search engine optimization» (2006-01-17)
Ricerca (tenta!)Risultati Google% Totale
US: search engine optimization33.300.00089,9
GB: search engine optimisation3.760.00010,1
37.060.000

Numerosi elementi interessanti emergono dai risultati della ricerca sopraelencati:

  • Google non risponde con suggerimenti alternativi del tipo Forse cercavi… come generalmente accade con gli errori d’ortografia
  • Non sembra che Google utilizzi un dizionario di equivalenze — i risultati sono chiaramente diversi.
  • Il British Council ha bisogno di aumentare i suoi investimenti per ridurre l’egemonia linguistica degli Stati Uniti: -).

NotaSi noti che alcune pagine con l’ortografia degli Stati Uniti risultano nelle ricerche che utilizzano l’ortografia britannica e viceversa. Ciò è probabilmente dovuto all’uso dell’ortografia degli Stati Uniti o del Regno Unito nel testo di collegamenti (link) presso siti terzi che puntano a questo contenuto, cioè un link Search Engine Optimisation Resources indicherà un documento redatto usando l’inglese americano, cioè Search Engine Optimization Resources.

Dovrei usare l’Inglese Americano o quello Britannico?

Se il tuo pubblico si limita principalmente agli Stati Uniti o al Regno Unito, la scelta è facile: usa il dialetto che risulterà più familiare alla maggior parte dei tuoi visitatori; perché questo sarà il dialetto che essi usano per fare ricerche in Internet e sarà quello che si aspettano di trovare quando sfogliano il tuo sito.

Per i siti mirati ad un pubblico internazionale, la scelta è una po’ più difficile. Poiché l’inglese degli Stati Uniti risuonerà più vicino ai due terzi dei madrelingua, sceglierlo potrebbe essere la cosa migliore. L’inglese americano viene insegnato spesso come il dialetto preferito in molte zone dell’Asia. L’inglese britannico dovrebbe essere considerato quando il sito si orienta ai paesi del Commonwealth e/o soprattutto dell’Europa. La ricerca e l’analisi di parole chiave contribuiranno a rispondere a questa domanda. Per cominciare, una volta identificate, le tue parole chiave sono esattamente le stesse in inglese americano e britannico?

Devo Mescolare l’Inglese Americano con quello Britannico?

Un problema inerente al restringere il contenuto del tuo sito al dialetto americano o britannico è che, così facendo, limiterai la tua visibilità nei motori di ricerca — è meno probabile che gli utenti che cercano con i termini specifici in un dialetto o nell’altro ti trovino (il tuo contenuto può comparire tranquillamente se i collegamenti presso siti terzi che puntano al tuo contenuto contengono i termini della ricerca nello stesso dialetto come il quesito della ricerca).

Una soluzione consiste nell’utilizzare termini sia americani sia britannici nel tuo contenuto del sito. Puoi scegliere se mescolare i dialetti nella stessa pagina o scrivere alcune pagine in inglese americano ed altre in inglese britannico, tutto ciò rischiando di apparire incoerente a un visitatore attento.

La Localizzazione dei siti e la Penalità per il Contenuto Duplicato in Google

Una soluzione orientata verso l’utilizzatore per parlare ad un pubblico internazionale è quella di mantenere un sito .com per il dialetto americano e un sito .co.uk per il dialetto britannico. Se dal punto di vista dell’usabilità tale scelta appare sensata, quest’approccio si scontra con l’algoritmo Google, recentemente raffinato (cambiamenti sono stati apportati l’autunno scorso nel cosiddetto aggiornamento Jagger), che rileva un contenuto ripetuto.

Essenzialmente, Google tenta di identificare e penalizzare i siti che sono per lo più copie carta carbone di altri siti. Se decidi di offrire il tuo contenuto sia nel dialetto britannico che in quello americano, ti suggeriamo di evitare l’«ira» potenziale di Google, concentrando i tuoi sforzi di commercializzazione su uno dei due siti. Deve dire a Google di ignorare l’altro sito con un file robots.txt per l’esclusione a livello del sito o una modifica dei tag meta per l’esclusione dei robot a livello della pagina. Anche se il consiglio di tenere il tuo contenuto «duplicato» lontano da Google sembra draconiano, al momento questa strategia pare essere l’unica soluzione disponibile per evitare di subire una penale per contenuto duplicato di Google.

ConsiglioStudia la possibilità di ostruire l’accesso al tuo sito inglese secondario a tutti i crawlers dei motori di ricerca. Così facendo, sarai in grado di evitare problemi futuri con Yahoo, MSN ed altri che hanno o prevedono una penale per contenuto duplicato come accade con Google. Tuttavia, le tue ortografie inglesi alternative non saranno trovate….

Etichettare il tuo Contenuto col Dialetto di Lingua per facilitarne l’indicizzazione nei Motori di Ricerca

Puoi aiutare un motore di ricerca ad identificare il dialetto di lingua del contenuto della pagina utilizzando l’etichetta Html lang nella dichiarazione di Html, cioè

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-US" lang="en-US">

o

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-GB" lang="en-GB">

secondo il caso. Fai riferimento alla documentazione etichette di Lingua W3c in Html e Xml per ulteriori informazioni.

Visto che siamo in tema, nota che i codici di lingua possono anche essere regolati a livello dell’intestazione di Http. Questo è soprattutto usato dai browser.

per il server di Apache, aggiungere una riga simile a

AddLanguage en-GB .html

al tuo file di configurazione di server o file .htaccess. Il tuo server inserirà poi

Content-Language: en-GB

nelle relative intestazioni HTTP. Le intestazioni http possono essere osservate in Firefox usando l’estensione livehttpheaders. Gli utilizzatori Microsoft possono considerare lo strumento wfetch.exe di Microsoft.

Raccontaci la tua Esperienza

Qual è la tua esperienza in merito a problematiche di internazionalizzazione?

Contattaci per raccontarcela.

Per capire meglio le sfumature dell’Ottimizzazione siti per i Motori di Ricerca, lascia che Antezeta ti aiuti! Contattaci oggi!

Ti potrebbero interessare:

Sono aperte le iscrizioni per il prossimo corso Seo e per il corso Google Analytics. Cosa aspettate?


A proposito di Sean Carlos

Sean Carlos aiuta le aziende nell'ottimizzare i loro risultati di business online. La sua carriera spazia dalla gestione di campagne di telemarketing e direct mailing presso un'organizzazione con più di 10.000 soci ad una significativa esperienza a livello mondiale maturata presso la Hewlett-Packard. Nei primi anni 90 Sean ha sviluppato un applicativo enterprise search, comprensivo di tutte le fasi, dall'indicizzazione alla ricerca dei testi, per il Los Angeles County Museum of Art. Dal 2000 al 2004 Sean è stato IT Manager del sito immobiliare CasaClick.it, parte del gruppo Pirelli. Sean è un docente ufficiale della Digital Analytics Association. È Chairman dello SMX Search and Social Media Conference, 12 & 13 novembre p.v. a Milano. Collabora inoltre con l'Università Bocconi. Nato a Providence, RI, USA, Sean Carlos si è laureato in Fisica. Parla inglese, italiano e tedesco.

Lascia un commento

Avviso: i tuoi commenti sono i benvenuti se sono costruttivi. L'amministratore si riserva la facoltà di cancellare i commenti anonimi, con secondi fini e/o con toni non civili.