Logo AntezetaAntezeta Web Marketing

Riflessioni sul marketing online, SEO e Web Analytics compresi

Antezeta Web Marketing header image 2

Caratteri accentati, simboli e caratteri speciali in documenti Html: considerazioni per il Posizionamento nei Motori di Ricerca, Usabilità e Feed Xml

Scritto da parte di sean · Nessun Commento

Un argomento che la maggior parte dei Webmaster internazionali devono affrontare è come gestire correttamente i caratteri speciali I documenti Html devono contenere sia le parole con le lettere accentate sia quelle senza per poter essere trovate nei ?

Continuando la nostra serie di articoli sull’internazionalizzazione di siti per la visibilità nei motori di ricerca, daremo ora uno sguardo su come possono essere specificati in un documento Html i caratteri speciali e come questi caratteri sono gestiti dai come Google, Yahoo, Ask e Microsoft MSN.

Agli albori dell’informatica, i tecnici hanno fatto corrispondere ognuna delle lettere dell’alfabeto latino utilizzato dalla lingua inglese ad un codice numerico specifico. Questa corrispondenza è diventata nota come il set di caratteri Ascii. Sfortunatamente, non sono state previste le vocali accentate e i simboli semigrafici che si possono trovare in molte lingue che condividono l’uso dell’alfabeto romano.

Alla fine diversi produttori di computer hanno aggiunto la gestione dei caratteri speciali, ciascun utilizzando un sistema di corrispondenza diverso. Sfortunatamente, queste corrispondenze non sono generalmente compatibili da un sistema ad un altro. Oggi questo problema si manifesta talvolta quando i caratteri strani appaiano in un file di testo, messaggi e pagine web visualizzati su computer diversi da quelli in cui sono stati scritti.

Suggerimenti per inserire Caratteri Speciali nei documenti Html

I siti che contengono pagine in lingue diverse dall’inglese devono prestare particolare attenzione a come gestiscono i caratteri speciali. L’impiego corretto dei caratteri incide infatti sia sull’usabilità sia sul posizionamento nei motori di ricerca.

Sono disponibili differenti soluzioni, tutte compatibili con i . Possono essere raggruppate come:

  1. Evitare l’uso di caratteri speciali.
  2. Inserire caratteri direttamente dalla tastiera.
  3. Utilizzare Riferimenti di Entità Html.

Evitare l’uso di Caratteri Speciali.

Invece di utilizzare un carattere accentato, l’accento è messo dopo il carattere, cioè sara’ o sara` invece di sarà. Questo approccio è spesso utilizzato in Italia. Anche se questo approccio può andare bene, l’uso di caratteri accentati può dare un aspetto più professionale ad un documento. Comunque, è possibile solo per quelle lingue che hanno lettere accentate solo come ultima lettera della parola, come l’italiano. Per il francese, lo spagnolo o il tedesco non è applicabile.

Inserire caratteri direttamente dalla tastiera.

Spesso il contenuto di un sito web è copiato dal software di elaborazione testi – come il Writer di OpenOffice – in Html o inserito direttamente in un modulo Html. In queste situazioni, i caratteri speciali saranno spesso determinati da una codifica specifica dal sistema operativo dell’utente. Se la codifica di carattere corretta non è specificata nella pagina web o dal web server, un utente che utilizza un sistema operativo diverso può trovarsi con la visualizzazione di molti caratteri “strani”

La soluzione è di assicurarsi di specificare, nella pagina web, la codifica di caratteri utilizzata. La soluzione migliore è farlo a livello di web server. Apache, a tal fine, prevede la direttiva AddCharset. Una soluzione meno elegante è quella di aggiungere un’etichetta meta nella pagina Html:


Questa etichetta dovrebbe trovarsi nella sezione , prima di altre etichette come il , che possono contenere caratteri speciali. Il sito dedicato agli sviluppatori Microsoft elenca i <a href="http://msdn.microsoft.com/workshop/database/tdc/reference/charset.asp" hreflang="en">valori più utilizzati per i set di caratteri</a>.</p> <h3 id="HE5">Utilizzare riferimenti di entità Html.</h3> <p>L’<strong>approccio migliore</strong> è quello di utilizzare una <strong>notazione speciale</strong> per indicare i caratteri particolari in Html. Questa notazione utilizza i caratteri <acronym title="Codice Standard Americano per lo Scambio di Informazioni">Ascii</acronym> di base per riferirsi ai caratteri speciali, eliminando così i problemi associati al dover assicurare che la serie di caratteri di un documento html sia quella corretta. La notazione speciale di base è chiamata <a href="http://en.wikipedia.org/wiki/Numeric_character_reference" hreflang="en">Riferimento di carattere numerico</a> (non ancora disponibile in Italiano). Ogni carattere speciale è specificato utilizzando un prefisso composto dell’<em>e commerciale</em> e il <em>cancelletto</em>, &#, un numero di 3 o 4 cifre per indicare il carattere di interesse, e un punto virgola “;” come suffisso. Così, “è” è rappresentato da “è”. Alcune delle entità numeriche hanno anche valori corrispondenti come <a href="http://www.w3.org/TR/html401/sgml/entities.html" hreflang="en">entità del carattere</a>, cioè possono essere scritti come “è” (<em>egrave</em> sostituisce <em>#232</em>). Allo stesso modo “é” può essere scritto sia come <em>é</em> sia come <em>é</em>.</p> <p>Mentre i valori di entità di carattere sono molto più facili da ricordare e leggere, <strong>raccomandiamo vivamente</strong> l’uso di <strong>riferimenti di carattere numerici</strong> per evitare qualunque tipo di problemi:</p> <ul> <li>Non tutti i valori di entità di caratteri che fanno parte dello <a href="http://www.w3.org/TR/REC-html40/" hreflang="en">standard 4.0 di Html</a> sono riconosciuti da tutti i software e i programmi utilizzati nel mondo del <em>selvaggio</em> web. Ciò è particolarmente vero con i simboli più recenti come quello per l’euro, €. </li> <li>Molti contenuti Html sono utilizzati in file Xml, come <a href="/blog/tema/blog" class="st_tag internal_tag" rel="tag" title="Posts tagged with Blog">blog</a> e feed sitemap RSS. Lo standard <acronym title="linguaggio estensibile di marcatura dalle proprietà">Xml</acronym> riconosce solo entità di 5 caratteri (", &, ', <, >), uno di cui, ', non fa nemmeno parte del standard <acronym lang="en" title="Hypertext Markup Language">Html</acronym>. </li> </ul> <h3 id="HE6">Preferenze dei <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">Motori di Ricerca</a> </h3> <p>I <strong><a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a></strong> sono progettati per trattare qualsiasi tipo di <acronym lang="en" title="Hypertext Markup Language">Html</acronym> disponibile sul web. Finché gli utenti del sito vedono i caratteri giusti sui computer Windows, Macintosh e Linux, si può essere abbastanza certi che i <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a> non avranno particolari difficoltà con il modo in cui si sono utilizzati i caratteri speciali nei documenti Html. Sembra che <a href="/yahoo/">Yahoo</a> abbia difficoltà con il trattamento di alcuni dei caratteri più nuovi nello <strong>standard 4.0 Html</strong> come le virgolette di freccia sinistre e destra, « e ». Tuttavia, questo problema è limitato a Yahoo ed è indipendente dall’uso di riferimenti di entità numerici o di carattere.</p> <h2 id="HE7">Che dire dei caratteri speciali e delle richieste ai <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">Motori di Ricerca</a>?</h2> <p>Se state ancora digerendo quanto letto poco sopra su come i caratteri speciali possono essere indicati in un documento Html, sarete sicuramente sollevati dal sapere che i <strong><a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a></strong> non sono influenzati da questi problemi quando un utente esegue una ricerca.</p> <p>In generali, tutti i <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a> principali restituiscono correttamente i risultati per parole contenenti caratteri speciali, anche se un utente non ha immesso un carattere speciale! Per illustrare questo concetto, considereremo un esempio specifico.</p> <p>Dopo la <a href="http://it.wikipedia.org/wiki/Riforma_ortografica_tedesca">riforma ortografica tedesca</a>, strada si scrive <em>Strasse</em> o <em>Straße</em>? Non c’è da preoccuparsi. Tutti i principali <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a> riconoscono entrambe le varianti. Si può verificare facilmente osservando che entrambe le varianti sono evidenziate nei risultati della ricerca.</p> <table align="center" border="1" width="40%" summary="Esempio del utilizzo di caratteri speciali nei motori di ricerca"> <caption> Confrontate i risultati della ricerca per Strasse e Straße su Google, Yahoo!, Ask e Microsoft Windows Live. </caption> <colgroup> <col width="40%"> <col width="30%"> <col width="30%"> </colgroup> <thead> <tr> <th class="ctr">Motore di ricerca</th> <th class="ctr">Ascii Semplice</th> <th class="ctr">Caratteri speciale</th> </tr> </thead> <tbody> <tr> <td>Ask.com</td> <td> <a href="http://www.ask.com/web?q=strasse" title="Ricerca di Strasse su Ask.com">Strasse</a> </td> <td> <a href="http://www.ask.com/web?q=stra%C3%9Fe" title="Ricerca di Straße su Ask.com">Straße</a> </td> </tr> <tr> <td>Ask Deutschland</td> <td> <a href="http://de.ask.com/web?q=strasse" title="Ricerca di Strasse su Ask Deutschland">Strasse</a> </td> <td> <a href="http://de.ask.com/web?q=stra%C3%9Fe" title="Ricerca di Straße su Ask Deutschland">Straße</a> </td> </tr> <tr> <td> </td> <td> </td> <td> </td> </tr> <tr> <td>Google.de</td> <td> </td> <td> </td> </tr> <tr> <td>Google.com</td> <td> </td> <td> </td> </tr> <tr> <td> </td> <td> </td> <td> </td> </tr> <tr> <td>Windows Live</td> <td> <a href="http://search.live.com/results.aspx?q=strasse&FORM=QBRE" title="Ricerca di Strasse su Windows Live">Strasse</a> </td> <td> <a href="http://search.live.com/results.aspx?q=stra%C3%9Fe&FORM=QBRE" title="Ricerca di Straße su Windows Live">Straße</a> </td> </tr> <tr> <td>Windows Live Deutschland</td> <td> <a href="http://search.live.com/results.aspx?q=strasse&mkt=de-DE" title="Ricerca di Strasse su Windows Live Deutschland">Strasse</a> </td> <td> <a href="http://search.live.com/results.aspx?q=stra%C3%9Fe&mkt=de-DE" title="Ricerca di Straße su Windows Live Deutschland">Straße</a> </td> </tr> <tr> <td> </td> <td> </td> <td> </td> </tr> <tr> <td>Yahoo! Deutschland</td> <td> </td> <td> </td> </tr> <tr> <td>Yahoo!</td> <td> </td> <td> </td> </tr> </tbody> </table> <p>Non siete ancora convinti? Confrontate le ricerche su Google per e . Entrambi le richieste probabilmente indicheranno il <a href="http://www.attivitaproduttive.gov.it/">Ministero delle Attività Produttive</a> come risultato principale.</p> <p>Dietro le quinte, i <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a> hanno fatto corrispondere, dove possibile, i caratteri accentati e speciali con i loro equivalenti <acronym lang="en" title="American Standard Code for Information Interchange">Ascii</acronym> semplici. Così <em>ö</em> è di solito equivalente a <em>oe</em>, <em>à</em> a <em>a</em> etc.</p> <p>Enfasi leggermente diversa può essere data a parole con e senza caratteri speciali in base a una combinazione di fattori che tengono conto della lingua di ricerca dell’utente. Quest’ultima può essere rilevata dalla lingua della interfaccia di ricerca e dalla variante di paese del motore di ricerca utilizzato, cioè o <a href="http://it.ask.com/">it.ask.com</a> per l’Italia.</p> <p>Solitamente è possibile specificare la lingua della propria interfaccia di ricerca e il numero di risultati da restituire. Tutti i <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">motori di ricerca</a> principali, , , <a href="http://it.ask.com/webprefs">Ask</a> e <a href="http://www.live.it/settings.aspx">Live Search</a>, offrono la possibilità di personalizzazione l’interfaccia di ricerca.</p> <h2 id="HE8">Risoluzione delle ambiguità: meta vs. metà</h2> <p>Ci sono casi dove un accento o un carattere speciale possono cambiare il significato di una parola, tale è ad esempio il caso delle parole italiane <em>meta/metà</em>. Per fortuna, è possibile specificare il termine esatto in Google, impiegando un <strong>operatore di ricerca anticipato</strong> come prefisso alla parola. Per specificare <em>metà</em> e non <em>meta</em>, è sufficiente premettere un +, cioè o . Yahoo afferma che basta mettere la parola fra le virgolette doppie, o . In realtà non sembra funzionare davvero: provare e .</p> <h2 id="HE9">Maggiori informazioni sull’<a href="/blog/tema/internazionalizzazione" class="st_tag internal_tag" rel="tag" title="Posts tagged with Internazionalizzazione">Internazionalizzazione</a> dei Siti</h2> <p>Chi fosse interessato ad altri articoli relativamente al posizionamento sui motori di ricerca e la localizzazione di siti..</p> <ul> <li> Come i motori di ricerca rilevano la lingua dei documenti Html </li> <li>I <a href="/blog/tema/motori-di-ricerca" class="st_tag internal_tag" rel="tag" title="Posts tagged with Motori di Ricerca">Motori di Ricerca</a> e la Localizzazione dei Siti Web: Considerazioni sui dialetti Inglesi degli Stati Uniti e del Regno Unito per l’Internazionalizzazione dei Siti </li> </ul> <h3>Post correlate:</h3> <ul class="similar-posts"> <li> <a href="/blog/linternazionalizzazione-di-siti-web-presso-zenacamp-genova" rel="bookmark" title="2007-04-30">L’Internazionalizzazione di Siti Web presso ZenaCamp, Genova</a> </li> <li> <a href="/blog/yahoo-creare-mappasito" rel="bookmark" title="2006-08-29">Software gratuito per creare una sitemap per il posizionamento sul motore di ricerca Yahoo!</a> </li> <li> <a href="/blog/lingua-documenti" rel="bookmark" title="2006-08-17">Come specificare la lingua di un documento Html</a> </li> <li> <a href="/blog/domini-siti" rel="bookmark" title="2008-04-14">L’indicizzazione nei motori di ricerca di siti web in più lingue</a> </li> <li> <a href="/blog/seo-multimediale-audio-video" rel="bookmark" title="2007-04-12">SEO per Multimediale Audio e Video</a> </li> </ul> <p></p> <div class="wikio-share"></div> <span style="float:left;margin:1px 2px 1px 4px;"> </span> </div> <p class="tagged"><strong>Originariamente pubblicato</strong> <span style="color:black;">6 Sep 2006</span></p> <ul class="addaut"> <li> <img alt="" src="http://1.gravatar.com/avatar/b0220ca0cece8f0f3dfd02?s=96&d=http%3A%2F%2F1.gravatar.com%2Favatar%2Fad516503a11cd5ca435acc9bb6523536%3Fs%3D96&r=G" class="avatar avatar-96 photo" height="96" width="96"><strong>Sean Carlos</strong> aiuta le aziende nell'ottimizzare i loro risultati di business online. La sua carriera spazia dalla gestione di campagne di <strong>telemarketing</strong> e <strong>direct mailing</strong> presso un'organizzazione con più di 10.000 soci ad una significativa esperienza a livello mondiale maturata presso la <strong>Hewlett-Packard</strong>. Nei primi anni 90 Sean ha sviluppato un applicativo <em><strong>enterprise search</strong></em>, comprensivo di tutte le fasi, dall'indicizzazione alla ricerca dei testi, per il <strong>Los Angeles County Museum of Art</strong>. Dal 2000 al 2004 Sean è stato <acronym title="Information Technology">IT</acronym> Manager del sito immobiliare <strong>CasaClick.it</strong>, parte del gruppo <strong>Pirelli</strong>. Sean è un docente <!-- antezeta.it <a href="http://www.tech.ubc.ca/webanalytics/intro_course.html" title="Continuing Studies Computers, Media and Technology - UBC Award of Achievement in Web Analytics"> -->ufficiale<!-- antezeta.it </a> --> della <strong>Web Analytics Association</strong>. Collabora inoltre con l'<strong>Università Bocconi</strong>. Nato a Providence, RI, USA, Sean Carlos si è laureato in Fisica. Parla inglese, italiano e tedesco. <div class="clear"></div> </li> </ul> <div class="clear"></div> <div id="comments"> <h3 class="comments_headers">0 risposte finora ↓</h3> <ul id="comment_list"> <li class="comment"> <div class="entry"> <p>Non ci sono ancora commenti. Rompi il ghiaccio compilando il modulo qui sotto..</p> </div> </li> </ul> <h3 id="respond" class="comments_headers">Lascia un commento</h3> <p id="commentwarn">Avviso: commenti sono benvenuti nella misura in cui essi aggiungono qualcosa al discorso. Commenti senza nome e cognome e/o con toni negativi senza giustificazione razionale di una propria posizione e/o per terzi fini, corrono il rischio di essere cancellati senza pietà ad imprescindibile discrezione dell'amministratore. Ebbene sì, la vita è dura.</p> </div> <div class="clear flat"></div> </div> <div id="sidebar"> <ul class="sidebar_list"> <li id="text-476575891" class="widget widget_text"> <h2 class="widgettitle">Cerca nel sito</h2> <div class="textwidget"> </div> </li> <li id="text-455739581" class="widget widget_text"> <div class="textwidget"> </div> </li> <li id="text-476575892" class="widget widget_text"> <h2 class="widgettitle">Abbonati al feed!</h2> <div class="textwidget"> <div style="margin-left:auto;margin-right:auto;text-align:center;"> <img src="/i/Feed-icon.png" alt="Icona Rss" style="border:0;"><br> <hr style="color:black;margin-top:10px;margin-bottom:10px;"> <!-- antezeta.it <a href="http://searchmarketingexpo.com/west/2010/full_agenda2#348" title="Meet me at Search Marketing Expo 2010, Santa Clara California"> --><img src= "<!-- antezeta.it http://searchmarketingexpo.com/_images/badges/west10/smxw10_ism_tall.jpg --> "alt="I am speaking at SMX West"><!-- antezeta.it </a> --> </div> </div> </li> <li id="recent-posts-3" class="widget widget_recent_entries"> <h2 class="widgettitle">Post Recenti</h2> <ul> <li> </li> <li> <a href="/blog/testo-come-immagini-superato-con-font-face" title="Testo come Immagini: Problema SEO Ormai Superato con @font-face">Testo come Immagini: Problema SEO Ormai Superato con @font-face</a> </li> <li> </li> <li> </li> <li> </li> </ul> </li> <li id="text-456378191" class="widget widget_text"> <div class="textwidget"> </div> </li> </ul> </div> </div> <div id="multi_col"> <div id="col_1"> <ul class="sidebar_list"> <li id="recent-comments-3" class="widget widget_recent_comments"> <h2 class="widgettitle">Commenti recenti</h2> <ul id="recentcomments"> <li class="recentcomments"> <a href="http://www.stilegames.com" rel="external nofollow" class="url">Stilegames</a> on </li> <li class="recentcomments">Giuseppe on Libri gratuiti, via con la pulizia di primavera! </li> <li class="recentcomments"> <a href="http://www.giacomopelagatti.it/" rel="external nofollow" class="url">Giacomo Pelagatti</a> on </li> <li class="recentcomments">Fausto on 7 fonti di informazione sui link dei concorrenti e considerazioni per la ricerca di link a scopo SEO </li> <li class="recentcomments"> <a href="http://www.goanalytics.info" rel="external nofollow" class="url">Marco Cilia</a> on </li> </ul> </li> </ul> </div> <div id="col_2"> <ul class="sidebar_list"></ul> </div> <div id="col_3"> <ul class="sidebar_list"></ul> </div> <div id="col_4"> <ul class="sidebar_list"> <li id="linkcat-2" class="widget widget_links"> <h2 class="widgettitle">Blogroll</h2> <ul class="xoxo blogroll"> <li> <a href="http://aziendeconleorecchie.wordpress.com/" title="Chi practica il marketing dell’ascoloto in Italia, e come." target="_blank">Aziende con le orecchie</a> </li> <li> <a href="/blog/crazy-marketing-network-siti">Crazy Marketing Network | Tutti i Blog</a> </li> <li> <a href="http://www.digitalmarketinglab.it/" rel="friend met neighbor" title="Il Blog di Leo Bellini, appassionato di marketing, internet e comunicazione digitale">DigitalMarketingLab | Leonardo Bellini</a> </li> </ul> </li> <li id="linkcat-8" class="widget widget_links"> <h2 class="widgettitle">Corsi</h2> <ul class="xoxo blogroll"> <li> <a href="/corsi/seo.html" title="Corso SEO offerto da Antezeta">Corso SEO – Posizionamento nei motori di ricerca</a> </li> </ul> </li> <li id="linkcat-7" class="widget widget_links"> <h2 class="widgettitle">Consulenza</h2> <ul class="xoxo blogroll"> <li> <a href="/servizi-ottimizzazione-siti-motori-di-ricerca.html" title="Servizi di consulenza SEO offerte da Antezeta">Posizionamento nei motori di ricerca</a> </li> <li> <a href="/servizi-statistiche-siti.html" title="Servizi di consulenza sugli statistiche siti web offerte da Antezeta">Web Analytics</a> </li> </ul> </li> </ul> </div> </div> <script src="/blog/js/blog.js" type="text/javascript"></script> <script src="/j/tablesort.min.js" type="text/javascript"></script> <script src="/j/customsort.js" type="text/javascript"></script> <div id="footer"> <p>Copyright © 2006–2011 Sean Carlos. — <a href="/blog/sitemap/">Sitemap</a> — <a href="/blog/chi-sono/">Chi sono & Crediti</a></p> </div> </div> <script type="text/javascript" src="http://www.antezeta.com/owa/modules/base/js/owa.tracker-combined-min.js"></script> <script type="text/javascript"> _qoptions={ qacct:"p-b8nRsrwsOp-2-" }; </script> <noscript></noscript> <script type="text/javascript"> var pkBaseURL = (("https:" == document.location.protocol) ? "https://www.antezeta.com/piwik/" : "http://www.antezeta.com/piwik/"); document.write(unescape("%3Cscript src='" + pkBaseURL + "piwik.js' type='text/javascript'%3E%3C/script%3E")); </script> <noscript> <p><img src="http://www.antezeta.com/piwik/piwik.php?idsite=2" style="border:0" alt=""></p> </noscript> </body> </html>