Un argomento che la maggior parte dei Webmaster internazionali devono affrontare è come gestire correttamente i caratteri speciali I documenti Html devono contenere sia le parole con le lettere accentate sia quelle senza per poter essere trovate nei motori di ricerca?
Continuando la nostra serie di articoli sull’internazionalizzazione di siti per la visibilità nei motori di ricerca, daremo ora uno sguardo su come possono essere specificati in un documento Html i caratteri speciali e come questi caratteri sono gestiti dai motori di ricerca come Google, Yahoo, Ask e Microsoft MSN.
Agli albori dell’informatica, i tecnici hanno fatto corrispondere ognuna delle lettere dell’alfabeto latino utilizzato dalla lingua inglese ad un codice numerico specifico. Questa corrispondenza è diventata nota come il set di caratteri Ascii. Sfortunatamente, non sono state previste le vocali accentate e i simboli semigrafici che si possono trovare in molte lingue che condividono l’uso dell’alfabeto romano.
Alla fine diversi produttori di computer hanno aggiunto la gestione dei caratteri speciali, ciascun utilizzando un sistema di corrispondenza diverso. Sfortunatamente, queste corrispondenze non sono generalmente compatibili da un sistema ad un altro. Oggi questo problema si manifesta talvolta quando i caratteri strani appaiano in un file di testo, messaggi e pagine web visualizzati su computer diversi da quelli in cui sono stati scritti.
Suggerimenti per inserire Caratteri Speciali nei documenti Html
I siti che contengono pagine in lingue diverse dall’inglese devono prestare particolare attenzione a come gestiscono i caratteri speciali. L’impiego corretto dei caratteri incide infatti sia sull’usabilità sia sul posizionamento nei motori di ricerca.
Sono disponibili differenti soluzioni, tutte compatibili con i motori di ricerca. Possono essere raggruppate come:
- Evitare l’uso di caratteri speciali.
- Inserire caratteri direttamente dalla tastiera.
- Utilizzare Riferimenti di Entità Html.
Evitare l’uso di Caratteri Speciali.
Invece di utilizzare un carattere accentato, l’accento è messo dopo il carattere, cioè sara’ o sara` invece di sarà. Questo approccio è spesso utilizzato in Italia. Anche se questo approccio può andare bene, l’uso di caratteri accentati può dare un aspetto più professionale ad un documento. Comunque, è possibile solo per quelle lingue che hanno lettere accentate solo come ultima lettera della parola, come l’italiano. Per il francese, lo spagnolo o il tedesco non è applicabile.
Inserire caratteri direttamente dalla tastiera.
Spesso il contenuto di un sito web è copiato dal software di elaborazione testi – come il Writer di OpenOffice – in Html o inserito direttamente in un modulo Html. In queste situazioni, i caratteri speciali saranno spesso determinati da una codifica specifica dal sistema operativo dell’utente. Se la codifica di carattere corretta non è specificata nella pagina web o dal web server, un utente che utilizza un sistema operativo diverso può trovarsi con la visualizzazione di molti caratteri “strani”
La soluzione è di assicurarsi di specificare, nella pagina web, la codifica di caratteri utilizzata. La soluzione migliore è farlo a livello di web server. Apache, a tal fine, prevede la direttiva AddCharset. Una soluzione meno elegante è quella di aggiungere un’etichetta meta nella pagina Html:
Questa etichetta dovrebbe trovarsi nella sezione
, prima di altre etichette come ilUtilizzare riferimenti di entità Html.
L’approccio migliore è quello di utilizzare una notazione speciale per indicare i caratteri particolari in Html. Questa notazione utilizza i caratteri Ascii di base per riferirsi ai caratteri speciali, eliminando così i problemi associati al dover assicurare che la serie di caratteri di un documento html sia quella corretta. La notazione speciale di base è chiamata Riferimento di carattere numerico (non ancora disponibile in Italiano). Ogni carattere speciale è specificato utilizzando un prefisso composto dell’e commerciale e il cancelletto, , un numero di 3 o 4 cifre per indicare il carattere di interesse, e un punto virgola “;” come suffisso. Così, “è” è rappresentato da “è”. Alcune delle entità numeriche hanno anche valori corrispondenti come entità del carattere, cioè possono essere scritti come “è” (egrave sostituisce #232). Allo stesso modo “é” può essere scritto sia come é sia come é.
Mentre i valori di entità di carattere sono molto più facili da ricordare e leggere, raccomandiamo vivamente l’uso di riferimenti di carattere numerici per evitare qualunque tipo di problemi:
- Non tutti i valori di entità di caratteri che fanno parte dello standard 4.0 di Html sono riconosciuti da tutti i software e i programmi utilizzati nel mondo del selvaggio web. Ciò è particolarmente vero con i simboli più recenti come quello per l’euro, €.
- Molti contenuti Html sono utilizzati in file Xml, come blog e feed sitemap RSS. Lo standard Xml riconosce solo entità di 5 caratteri (", &, ', <, >), uno di cui, ', non fa nemmeno parte del standard Html.
Preferenze dei Motori di Ricerca
I motori di ricerca sono progettati per trattare qualsiasi tipo di Html disponibile sul web. Finché gli utenti del sito vedono i caratteri giusti sui computer Windows, Macintosh e Linux, si può essere abbastanza certi che i motori di ricerca non avranno particolari difficoltà con il modo in cui si sono utilizzati i caratteri speciali nei documenti Html. Sembra che Yahoo abbia difficoltà con il trattamento di alcuni dei caratteri più nuovi nello standard 4.0 Html come le virgolette di freccia sinistre e destra, « e ». Tuttavia, questo problema è limitato a Yahoo ed è indipendente dall’uso di riferimenti di entità numerici o di carattere.
Che dire dei caratteri speciali e delle richieste ai Motori di Ricerca?
Se state ancora digerendo quanto letto poco sopra su come i caratteri speciali possono essere indicati in un documento Html, sarete sicuramente sollevati dal sapere che i motori di ricerca non sono influenzati da questi problemi quando un utente esegue una ricerca.
In generali, tutti i motori di ricerca principali restituiscono correttamente i risultati per parole contenenti caratteri speciali, anche se un utente non ha immesso un carattere speciale! Per illustrare questo concetto, considereremo un esempio specifico.
Dopo la riforma ortografica tedesca, strada si scrive Strasse o Straße? Non c’è da preoccuparsi. Tutti i principali motori di ricerca riconoscono entrambe le varianti. Si può verificare facilmente osservando che entrambe le varianti sono evidenziate nei risultati della ricerca.
Motore di ricerca | Ascii Semplice | Caratteri speciale |
---|---|---|
Ask.com | Strasse | Straße |
Ask Deutschland | Strasse | Straße |
Google.de | ||
Google.com | ||
Windows Live | Strasse | Straße |
Windows Live Deutschland | Strasse | Straße |
Yahoo! Deutschland | ||
Yahoo! |
Non siete ancora convinti? Confrontate le ricerche su Google per e . Entrambi le richieste probabilmente indicheranno il Ministero delle Attività Produttive come risultato principale.
Dietro le quinte, i motori di ricerca hanno fatto corrispondere, dove possibile, i caratteri accentati e speciali con i loro equivalenti Ascii semplici. Così ö è di solito equivalente a oe, à a a etc.
Enfasi leggermente diversa può essere data a parole con e senza caratteri speciali in base a una combinazione di fattori che tengono conto della lingua di ricerca dell’utente. Quest’ultima può essere rilevata dalla lingua della interfaccia di ricerca e dalla variante di paese del motore di ricerca utilizzato, cioè o it.ask.com per l’Italia.
Solitamente è possibile specificare la lingua della propria interfaccia di ricerca e il numero di risultati da restituire. Tutti i motori di ricerca principali, , , Ask e Live Search, offrono la possibilità di personalizzazione l’interfaccia di ricerca.
Risoluzione delle ambiguità: meta vs. metà
Ci sono casi dove un accento o un carattere speciale possono cambiare il significato di una parola, tale è ad esempio il caso delle parole italiane meta/metà. Per fortuna, è possibile specificare il termine esatto in Google, impiegando un operatore di ricerca anticipato come prefisso alla parola. Per specificare metà e non meta, è sufficiente premettere un +, cioè o . Yahoo afferma che basta mettere la parola fra le virgolette doppie, o . In realtà non sembra funzionare davvero: provare e .
Maggiori informazioni sull’Internazionalizzazione dei Siti
Chi fosse interessato ad altri articoli relativamente al posizionamento sui motori di ricerca e la localizzazione di siti..
- Come i motori di ricerca rilevano la lingua dei documenti Html
- I Motori di Ricerca e la Localizzazione dei Siti Web: Considerazioni sui dialetti Inglesi degli Stati Uniti e del Regno Unito per l’Internazionalizzazione dei Siti
Ti potrebbero interessare:
- L’internazionalizzazione di siti web presso ZenaCamp, Genova
- Software gratuito per creare una sitemap per il posizionamento sul motore di ricerca Yahoo!
- Come specificare la lingua di un documento Html
- L’indicizzazione nei motori di ricerca di siti web in più lingue
- Riconoscimento da parte dei motori di ricerca degli attributi link rel=”” – il bigliettino
Sono aperte le iscrizioni per il prossimo corso Seo del 16 e 17 gennaio e per il del 12 e 13 gennaio. Cosa aspettate?
0 risposte finora ↓
Non ci sono ancora commenti. Rompi il ghiaccio compilando il modulo qui sotto..