Dal momento che l’utilizzo a banda larga cresce a vista d’occhio, molti siti web stanno incrementando il loro contenuto audiovisivo disponibile per attrarre e trattenere i navigatori Internet. Sfortunatamente i file multimediali, come immagini, podcast mp3 e video, presentano tutta una gamma di problemi di visibilità per i motori di ricerca tradizionali.
La tecnologia di indicizzazione e recupero di informazioni utilizzata dai motori di ricerca principali viene regolata da contenuti basati sul testo, come file html, e non da contenuti multimediali. Nel tempo, i motori di ricerca sono diventati molto efficaci nel trovare testo in documenti binari, come file di elaborazione dei testi (.doc, .odt), alcuni pdf e anche, a un livello limitato, gli animati Flash. I file multimediali, come video, presentano ancora un insieme di problemi che vengono considerati in questo articolo.
Un’Immagine vale Mille Parole: Indicizzazione File di Immagini
Come attesta l’articolo del 2003 di Danny Sullivan sui motori di ricerca multimediali, molti motori di ricerca principali, come , hanno cominciato ad indicizzare i file multimedia partendo dalla ricerca di immagini. Quali sono gli elementi principali che i motori di ricerca e di conseguenza, gli specialisti SEO, hanno per identificare un’immagine?
- Il nome del file dell’immagine (cominciando dall’estensione!)
- Il testo “alt” (alternativa) associato all’immagine
- Informazioni nel testo html intorno all’immagine inserita nella pagina
Alcuni tipi di immagini, come i file .gif, permettono al testo «meta» sull’immagine di essere salvato con l’immagine stessa. È improbabile che queste informazioni meta vengano specificate e, se lo sono, spesso risultano inutili. Siete probabilmente già consapevoli delle informazioni meta, informazioni su informazioni, se avete creato un documento html o aggiornato le proprietà di un documento per elaborare testi. I documenti Html possono contenere informazioni sul documento, come la lingua, la descrizione e le parole chiave, incorporate nei meta tag html.
Anche se ci sono stati molti progetti validi per rilevare l’oggetto di un’immagine esaminando i pixel, come nel riconoscimento di una faccia (o per filtrare immagini di nudità), i motori di ricerca hanno bisogno di bilanciare ciò che è possibile con quel che è realistico (considerate, ad esempio, l’ampia gamma di varietà nella gradazione del colore della pelle umana). Ai motori di ricerca piacciono soluzioni scalabili, soluzioni che possono essere applicate all’intero web piuttosto che a un’impostazione semplice di laboratorio.
Come può attestare chiunque che abbia utilizzato la ricerca immagini, si tratta di un processo tutt’altro che perfetto. L’analisi algoritmica automatica del testo nella pagina web intorno ad un’immagine inserita può funzionare la maggior parte delle volte, ma può anche creare alcuni risultati molto imbarazzanti in altre occasioni – non c’è alcuna garanzia che il contenuto del testo su una pagina web sia veramente relativo alle immagini che appaiono su quella pagina.
Controllo Suono: L’Indicizzazione di File Audio
Con i media audio, del tipo podcast, i motori di ricerca dispongono di informazioni di base simili a quelle con immagini:
- Nome del file audio
- Informazioni nel testo html intorno al file audio inserito nella pagina
- Testo del messaggio di attesa (utilizzando l’attributo standby del tag object)
- Le informazioni meta comprese nel file audio
Le informazioni Meta sono supportate nel formato mp3 come etichette/tag ID3. Altri formati audio che supportano i tag meta comprendono ogg, flac, mpc (musepack) ed ape (monkey audio). Visto che le informazioni meta vengono meglio supportate in file audio, è più facile per i motori di ricerca identificare effettivamente il contenuto di un file audio, ma solo finché il creatore di file audio non abbia specificato con precisione le informazioni di etichetta meta creando il file.
Talvolta i creatori di contenuti audio rilasciano una trascrizione del testo per accompagnare l’audio. Consigliamo vivamente questa pratica. Innanzitutto, ci sono considerazioni per l’usabilità: gli utenti Internet che si appoggiano a collegamenti lenti, tipo dial-up, possono scaricare una trascrizione di testo molto più facilmente di un file audio. In più, i motori di ricerca saranno alimentati da informazioni molto più ricche da associare al file audio.
Ciak si gira!: Indicizzazione di File Video
Con il grande aumento del numero di video e spettatori di video sul web, i motori di ricerca hanno rivolto la loro attenzione alla ricerca video, come e, come esemplificato da e , alla condivisione (e hosting) di video. Insieme ai grandi nomi di ricerca Internet, nomi relativamente nuovi stanno tentando di farsi spazio nel business di ricerca video. Uno, Blinkx, ha rilasciato anche una guida al SEO per i video (tanto di cappello ad Andrey Golub per la segnalazione!).
La guida SEO da Blinkx riferisce sugli sforzi pionieristici nell’indicizzazione di video nei motori di ricerca, come Altavista, sfruttando le stesse tecniche di base utilizzate nell’indicizzazione di immagini ed audio:
- Nome del file video
- Informazioni nel testo html intorno al file video inserito nella pagina (comprese trascrizioni)
- Informazioni meta comprese nel file video, come la data di creazione
Sostanzialmente un buon inizio per l’indicizzazione, ma soggetto alle stesse limitazioni come per le immagini che tentano di inferire il contenuto di un oggetto.
E Stop!: Ricerca Video di Seconda Generazione Secondo Blinkx
Blinkx mira a differenziarsi da quello che Blinkx chiama indicizzazione video di prima generazione prendendo in considerazione informazioni rilevate da un’analisi del video stesso: il riconoscimento del parlato, un’analisi visiva ed il riconoscimento ottico dei caratteri (OCR) video permettono al software di ascoltare, guardare, e leggere il testo che appare nel video stesso.
Per testo, ricordate che molti formati video sostengono tracce di sottotitoli, (sia normali che per i sordi, noto come Closed Captioning in Nord America). In alcuni casi, i sottotitoli sono conservati in un formato testuale che potrebbe essere indicizzato direttamente. In altri casi, i sottotitoli vengono salvati come immagini che devono subire trascrizione per mezzo di OCR con tutte le inesattezze che quel processo può comportare.
Blinkx nota in modo particolare i prodotti che mantengono dati meta durante una conversione video. I prodotti consigliati da Blinkx sono:
- Autodesk Cleaner
- CastFire
- Sorenson Squeeze
Dopo una considerazione degli argomenti da affrontare nella promozione dei contenuti multimediali nei motori di ricerca, che cosa possono fare i professionisti di marketing e webmaster per migliorare la visibilità di audio e video nei motori di ricerca? In un articolo correlato, Antezeta suggerisce 8 consigli per l’ottimizzazione dei video per i motori di ricerca.
Post correlate:
- 8 Consigli per la SEO dei Video ed altri File Multimediali
- X-Robots-Tag: Ora ci sono 6 modi per tenere i contenuti dei siti web fuori dai motori di ricerca
- Non entrare: Un aspetto dell’ottimizzazione dei siti per i motori di ricerca spesso trascurato
- Testo come Immagini: Problema SEO Ormai Superato con @font-face
0 risposte finora ↓
Non ci sono ancora commenti. Rompi il ghiaccio compilando il modulo qui sotto..
Lascia un commento
Avviso: commenti sono benvenuti nella misura in cui essi aggiungono qualcosa al discorso. Commenti senza nome e cognome e/o con toni negativi senza giustificazione razionale di una propria posizione e/o per terzi fini, corrono il rischio di essere cancellati senza pietà ad imprescindibile discrezione dell'amministratore. Ebbene sì, la vita è dura.