SEO per audio e video nei motori di ricerca e sui siti di condivisione video

SEO per multimediale audio e video

Dal momento che l’utilizzo a banda larga cresce a vista d’occhio, molti siti web stanno incrementando il loro contenuto audiovisivo disponibile per attrarre e trattenere i navigatori Internet. Sfortunatamente i file multimediali, come , podcast mp3 e video, presentano tutta una gamma di problemi di visibilità per i motori di ricerca tradizionali.

La tecnologia di indicizzazione e recupero di informazioni utilizzata dai motori di ricerca principali viene regolata da contenuti basati sul testo, come file html, e non da contenuti multimediali. Nel tempo, i motori di ricerca sono diventati molto efficaci nel trovare testo in documenti binari, come file di elaborazione dei testi (.doc, .odt), alcuni pdf e anche, a un livello limitato, gli animati Flash. I file multimediali, come video, presentano ancora un insieme di problemi che vengono considerati in questo articolo.

Un’Immagine vale Mille Parole: Indicizzazione File di Immagini

Come attesta l’articolo del 2003 di Danny Sullivan sui motori di ricerca multimediali, molti motori di ricerca principali, come Google, hanno cominciato ad indicizzare i file multimedia partendo dalla ricerca di immagini. Quali sono gli elementi principali che i motori di ricerca e di conseguenza, gli specialisti , hanno per identificare un’immagine?

  • Il nome del file dell’immagine (cominciando dall’estensione!)
  • Il testo “alt” (alternativa) associato all’immagine
  • Informazioni nel testo html intorno all’immagine inserita nella pagina

Alcuni tipi di immagini, come i file .gif, permettono al testo «meta» sull’immagine di essere salvato con l’immagine stessa. È improbabile che queste informazioni meta vengano specificate e, se lo sono, spesso risultano inutili. Siete probabilmente già consapevoli delle informazioni meta, informazioni su informazioni, se avete creato un documento html o aggiornato le proprietà di un documento per elaborare testi. I documenti Html possono contenere informazioni sul documento, come la lingua, la descrizione e le parole chiave, incorporate nei meta tag html.

Anche se ci sono stati molti progetti validi per rilevare l’oggetto di un’immagine esaminando i pixel, come nel riconoscimento di una faccia (o per filtrare immagini di nudità), i motori di ricerca hanno bisogno di bilanciare ciò che è possibile con quel che è realistico (considerate, ad esempio, l’ampia gamma di varietà nella gradazione del colore della pelle umana). Ai motori di ricerca piacciono soluzioni scalabili, soluzioni che possono essere applicate all’intero web piuttosto che a un’impostazione semplice di laboratorio.

Come può attestare chiunque che abbia utilizzato la ricerca immagini, si tratta di un processo tutt’altro che perfetto. L’analisi algoritmica automatica del testo nella pagina web intorno ad un’immagine inserita può funzionare la maggior parte delle volte, ma può anche creare alcuni risultati molto imbarazzanti in altre occasioni – non c’è alcuna garanzia che il contenuto del testo su una pagina web sia veramente relativo alle immagini che appaiono su quella pagina.

Controllo Suono: L’Indicizzazione di File Audio

Con i media audio, del tipo podcast, i motori di ricerca dispongono di informazioni di base simili a quelle con immagini:

  • Nome del file audio
  • Informazioni nel testo html intorno al file audio inserito nella pagina
  • Testo del messaggio di attesa (utilizzando l’attributo standby del tag object)
  • Le informazioni meta comprese nel file audio

Le informazioni Meta sono supportate nel formato mp3 come etichette/tag ID3. Altri formati audio che supportano i tag meta comprendono ogg, flac, mpc (musepack) ed ape (monkey audio). Visto che le informazioni meta vengono meglio supportate in file audio, è più facile per i motori di ricerca identificare effettivamente il contenuto di un file audio, ma solo finché il creatore di file audio non abbia specificato con precisione le informazioni di etichetta meta creando il file.

Talvolta i creatori di contenuti audio rilasciano una trascrizione del testo per accompagnare l’audio. Consigliamo vivamente questa pratica. Innanzitutto, ci sono considerazioni per l’usabilità: gli utenti Internet che si appoggiano a collegamenti lenti, tipo dial-up, possono scaricare una trascrizione di testo molto più facilmente di un file audio. In più, i motori di ricerca saranno alimentati da informazioni molto più ricche da associare al file audio.

Ciak si gira!: Indicizzazione di File Video

Con il grande aumento del numero di video e spettatori di video sul web, i motori di ricerca hanno rivolto la loro attenzione alla ricerca video, come Yahoo! Video e, come esemplificato da Google Video e YouTube, alla condivisione (e hosting) di video. Insieme ai grandi nomi di ricerca Internet, nomi relativamente nuovi stanno tentando di farsi spazio nel business di ricerca video. Uno, Blinkx, ha rilasciato anche una guida al SEO per i video (tanto di cappello ad Andrey Golub per la segnalazione!).

La guida SEO da Blinkx riferisce sugli sforzi pionieristici nell’indicizzazione di video nei motori di ricerca, come Altavista, sfruttando le stesse tecniche di base utilizzate nell’indicizzazione di immagini ed audio:

  • Nome del file video
  • Informazioni nel testo html intorno al file video inserito nella pagina (comprese trascrizioni)
  • Informazioni meta comprese nel file video, come la data di creazione

Sostanzialmente un buon inizio per l’indicizzazione, ma soggetto alle stesse limitazioni come per le immagini che tentano di inferire il contenuto di un oggetto.

E Stop!: Ricerca Video di Seconda Generazione Secondo Blinkx

Blinkx mira a differenziarsi da quello che Blinkx chiama indicizzazione video di prima generazione prendendo in considerazione informazioni rilevate da un’analisi del video stesso: il riconoscimento del parlato, un’analisi visiva ed il riconoscimento ottico dei caratteri (OCR) video permettono al software di ascoltare, guardare, e leggere il testo che appare nel video stesso.

Per testo, ricordate che molti formati video sostengono tracce di sottotitoli, (sia normali che per i sordi, noto come Closed Captioning in Nord America). In alcuni casi, i sottotitoli sono conservati in un formato testuale che potrebbe essere indicizzato direttamente. In altri casi, i sottotitoli vengono salvati come immagini che devono subire trascrizione per mezzo di OCR con tutte le inesattezze che quel processo può comportare.

Blinkx nota in modo particolare i prodotti che mantengono dati meta durante una conversione video. I prodotti consigliati da Blinkx sono:

Dopo una considerazione degli argomenti da affrontare nella promozione dei contenuti multimediali nei motori di ricerca, che cosa possono fare i professionisti di e webmaster per migliorare la visibilità di audio e video nei motori di ricerca? In un articolo correlato, Antezeta suggerisce 8 consigli per l’ottimizzazione dei video per i motori di ricerca.

Ti potrebbero interessare:

Sono aperte le iscrizioni per il prossimo corso Seo e per il corso Google Analytics. Cosa aspettate?


A proposito di Sean Carlos

Sean Carlos aiuta le aziende nell'ottimizzare i loro risultati di business online. La sua carriera spazia dalla gestione di campagne di telemarketing e direct mailing presso un'organizzazione con più di 10.000 soci ad una significativa esperienza a livello mondiale maturata presso la Hewlett-Packard. Nei primi anni 90 Sean ha sviluppato un applicativo enterprise search, comprensivo di tutte le fasi, dall'indicizzazione alla ricerca dei testi, per il Los Angeles County Museum of Art. Dal 2000 al 2004 Sean è stato IT Manager del sito immobiliare CasaClick.it, parte del gruppo Pirelli. Sean è un docente ufficiale della Digital Analytics Association. È Chairman dello SMX Search and Social Media Conference, 13 & 14 novembre p.v. a Milano. Collabora inoltre con l'Università Bocconi. Nato a Providence, RI, USA, Sean Carlos si è laureato in Fisica. Parla inglese, italiano e tedesco.

Lascia un commento

Avviso: i tuoi commenti sono i benvenuti se sono costruttivi. L'amministratore si riserva la facoltà di cancellare i commenti anonimi, con secondi fini e/o con toni non civili.