Una delle grandi promesse del marketing digitale è la presunta disponibilità di statistiche di qualità sull’utilizzo di siti e sui loro utenti. I dati di web intelligence possono essere utilizzati per il confronto con la concorrenza, per valutare nuovi mercati potenziali e per rispondere alle molte domande interessanti che emergono lungo la strada. Molte aziende sono attive in questo settore, in particolare Nielsen, comScore, Experian Hitwise, Compete e Quantcast, anche se non tutte sono operative in Italia. Un fornitore si distingue per la sua capacità di offrire statistiche sui siti web nella maggior parte del mondo ad un prezzo imbattibile: Google.
I fornitori di dati di ricerca di mercato sui siti web sono in genere molto bravi a diffondere dei comunicati stampa che paiono autorevoli e forniscono dei rapporti con una grafica impeccabile, ma l’aspetto autorevole a volte maschera una brutta realtà: il fornitore ha un campione molto limitato di dati su cui lavorare. A titolo di esempio, la dimensione del pannello Nielsen per il mercato italiano nel giugno 2012, come riportato da Audiweb, era di 41.256 persone, vale a dire meno di 0,01% dell’intera popolazione internet potenziale. Se questo campione di dati non è rappresentativo dei visitatori di un sito e dei comportamenti di utilizzo, vi è il rischio molto concreto di prendere delle decisioni di business basate su dei dati discutibili.
Alcuni fornitori di statistiche web fanno affidamento sulla misurazione degli utenti che hanno accettato, consapevolmente o meno, di essere monitorati come condizione per scaricare un software gratuito. Altri reclutano i loro pannelli di utenti in primo luogo attraverso la composizione delle cifre a caso, o con l’acquisto di dati provenienti da alcuni ISP. Ogni metodo comporta delle insidie che possono distorcere il campione dei dati (gli utenti più esperti scaricheranno consapevolmente il software che li traccia? Gli utenti degli ISP che vendono i loro dati sono davvero rappresentativi della popolazione Internet più estesa?).
Quando il presidente e AD dello IAB Randall Rothenberg è arrivato nel 2007, è rimasto inorridito dalla situazione della misurazione. In una lettera indirizzata a Nielsen e comScore, i leader di allora della misurazione mediante i pannelli, egli ha scritto:
Dopo decenni di metodologie di ricerca sui media basate sulle novità nel campionamento statistico della raccolta dell’orzo dell’inizio del 20° secolo, potremmo finalmente darci una mossa … verso un universo basato sul censimento che consentirebbe a coloro che si occupano di marketing di eliminare gli sprechi, alle società mediatiche di realizzare un prezzo equo ed alle agenzie pubblicitarie di mirare al pubblico ed analizzare le loro campagne in modo più efficace.
… i log del server dei nostri utenti continuano a divergere nettamente dalle valutazioni a campione delle vostre società, in misura pari a 2/3 tanto in alcuni casi – ben oltre ogni legittimo margine di errore di campionamento.
(L’enfasi è mia). I nostri colleghi del settore IT descrivono il problema senza tanti giri di parole: spazzatura dentro, spazzatura fuori.
Google entra in scena con DoubleClick Ad Planner e Google Tendenze per i Siti Web
Nel 2008 Google è entrato nella baruffa della misurazione del pubblico digitale con l’introduzione di due strumenti gratuiti: Google Ad Planner, in seguito ribattezzato Doubleclick Ad Planner, ora Google Display Network Ad Planner e Google Trends for Websites, perlopiù una versione più limitata di AdPlanner.
In seguito alla lettera di Rothenberg, i protagonisti della misurazione digitale, Google compreso, hanno fatto domanda per l’l’accreditamento ad un ente che riunisce l’industria pubblicitaria statunitense, il Media Rating Council (MRC). La maggior parte delle domande rimane aperta; quella di Google ha languito per anni – il che mette in dubbio l’efficienza del processo MRC .
Vari fornitori, come Compete e Quantcast, mettono a disposizione un codice di monitoraggio che i siti possono installare direttamente nelle loro pagine web, potenzialmente consentendo un buono, se non eccellente, monitoraggio di questi siti specifici (la qualità dei dati rilevati dipende ancora da diversi fattori, tra cui il tipo di codice di monitoraggio (sincrono o asincrono) e la completezza dell’installazione del codice). Nel 2009 comScore ha cominciato pure a muoversi verso questo modello di rilevazione diretta. Il suo comunicato stampa è interessante in quanto aveva bisogno di descrivere un processo che stava per migliorare in modo significativo la qualità dei dati, cercando di minimizzare le preoccupazioni dei suoi clienti circa la qualità delle statistiche presentate in precedenza. Purtroppo comScore discute in un modo piuttosto malizioso i problemi percepiti con le statistiche derivate da una raccolta di dati da server web, il che poteva aver senso nel 2000, ma nel 2010 la maggior parte delle aziende, incoraggiate dai fornitori di sistemi di web analytics, si è spostata verso sistemi di misurazione orientati ai browser (tag), esattamente il nuovo approccio che comScore stava per attuare. Inutile dire che il comunicato stampa è una lettura “interessante” per coloro che sanno come funzionano le cose. Inizialmente comScore pretendeva che le aziende misurate pagassero per essere misurate con maggiore precisione. La logica di far pagare alle aziende per contribuire a migliorare i dati che comScore stesso vendeva poi ad altre società non stava in piedi e comScore ha ceduto .
Ciò che distingue dagli altri gli strumenti Google per l’inteligenza competitiva
Gli strumenti di intelligenza competitiva Ad Planner e Trends for Websites di Google spiccano su diversi fronti:
- Tra tutti i fornitori di dati di analisi in merito a siti web, nessuno può eguagliare la capacità di raccogliere dati di Google.
- Molti strumenti concentrano la loro copertura su un numero limitato di mercati. Google offre una copertura quasi mondiale.
- Google non pretende compensi dalle aziende per raccogliere, né per consultare i dati.
- Google ha una forte cultura di ingegneria, una cultura data-driven (spinta dai dati) che premia la raccolta dei dati e il loro utilizzo come attività. Google ha continuato, nel corso del tempo, a migliorare la qualità dei dati Ad Planner e Trends per i siti web. Non è chiaro fino a che punto i concorrenti di Google in questo spazio mettano la stessa enfasi sulla qualità dei dati.
Alcune limitazioni di Google Ad Planner e Trends for Websites
- Google fornisce pochi dati storici. La visualizzazione principale di Google Ad Planner è quella dei dati del mese precedente; non è possibile consultare una fotografia dei dati in un altro punto precedente nel tempo, un problema per i siti che subiscono delle variazioni stagionali in un mese determinato. Un grafico visualizza i visitatori unici giornalieri nel tempo per più mesi, il che mitiga un po’ il problema. Le correlate Trends for websites di Google offrono lo stesso grafico con opzioni aggiuntive per filtrare in base all’anno ed alla geografia.
- Google raccoglie pochi dati demografici in proprio. In confronto, Facebook sa l’età di un utente e il suo genere, e forse il suo livello di istruzione, la sua professione, le affiliazioni religiose e politiche e anche l’orientamento sessuale. Ad eccezione dei pochi mercati in cui Orkut è / era forte, Google non sa molto dei suoi utenti. Google può eventualmente raccogliere queste informazioni attraverso i profili di Google+ più estesi, ma per ora sembra che Google sia molto cauto. I dati demografici disponibili, forniti principalmente da soggetti indeterminati, sono limitati a 10 paesi (Australia, Brasile, Francia, Italia, Giappone, Germania, Spagna, Svizzera, Regno Unito e gli Stati Uniti).
- Google non è esplicito in merito alla metodologia che utilizza per calcolare le varie statistiche che offre, e non è chiaro quale livello di precisione ci si deve aspettare.
- Google non visualizza i dati per i siti di “nicchia” per i quali crede di avere dati insufficienti.
- Google non svela il traffico su domini *.google.*. Tanto per correttezza e trasparenza.
Confrontare i benchmark: quanto sono attendibili i dati sui visitatori e la visualizzazione delle pagine da parte di Google Ad Planner?
Google raccoglie i dati sull’utilizzo dei siti web da una moltitudine di servizi, ma Google li usa? Non è detto. Le politiche di utilizzo Google per i dati possono vietare la condivisione dei dati all’interno di Google a meno che un utente non abbia esplicitamente acconsentito, come nel caso delle Google Analytics. Ci possono essere conflitti interni (la soppressione delle parole chiave di ricerca organica per gli utenti registrati (il [not provided], per intendersi) è solo un esempio) che ostacolano la condivisione, come in tutte le grandi imprese, e una parte può non sapere ciò che un’altra sta facendo (come ci è stato detto, è il caso che si è verificato con la raccolta dati WiFi da parte della squadra Street View).
Quello che possiamo fare è scegliere una serie di siti e confrontare i loro dati di traffico da una fonte di rilevazione diretta come Quantcast o le Google Analytics con le statistiche Google Ad Planner. Quantcast dice che ha più di 100 milioni di siti che vengono misurati direttamente, anche se non tutti i dati sono accessibili al pubblico.
| Sito | Google Ad Planner | Misura diretta | Note |
|---|---|---|---|
| AdAge | 910K / 420K visitatori unici 2,9 milioni di pagine viste | 632.230 visitatori unici (persone) 1.233.473 visite 4.961.970 Pagine viste | Misura diretta: Quantcast |
| 230/98 M visitatori unici 2,7 miliardi di pagine viste | 108.993.456 visitatori unici 317.647.168 visite 2.707.373.056 di pagine viste | Misura diretta: Quantcast | |
| Anonimo sito di riferimento (Italia) | 48K / 20K visitatori unici 510K di pagine viste | 56.619 visitatori unici 493.524 di pagine viste | Misura diretta: Google Analytics |
| Wired.it | 820 / 350K visitatori unici 2,9 milioni di pagine viste | 30.629 visitatori unici 65.000 di pagine viste | Misura diretta: Nielsen / Audiweb |
I dati si riferiscono alla copertura in tutto il mondo per il giugno 2012
Strumenti eccezionali richiedono sempre grandi analisti
Nessuno strumento di analisi competitiva racconta tutta la storia. Grandi intuizioni richiedono grandi persone. Un analista di social media dovrebbe sapere che c’è una grave carenza nella seguente presentazione delle statistiche Twitter da parte di Google DoubleClick Ad Planner:
Il problema? La maggior parte dell’utilizzo di Twitter è tramite la sua API e le applicazioni di terze parti (molte delle quali Twitter ora possiede, ma questa è un’altra storia). Alla conferenza degli sviluppatori Chirp nel 2010, Twitter ha affermato che solo il 25% del suo traffico è rappresentato da twitter.com. Un analista grande questo lo sa. Gli strumenti di misura no.
Nubi all’orizzonte per Google Ad Planner
In una e-mail del 22 agosto 2012 agli inserzionisti AdSense/AdWords, Google ha delineato diverse modifiche previste per Ad Planner. Google dice che a partire dal 5 settembre 2012,
- i dati saranno disponibili solo per i siti che ospitano la pubblicità Google, conosciuta come la Rete Display di Google
- meno dati demografici saranno disponibili, vale a dire Parole cercate, Video guardati, reddito familiare e livello d’istruzione saranno rimossi
- Non meglio specificati “aggiustamenti” ad alcune delle voci di traffico, come utenti unici e reach; la rimozione di pagine viste
- Publisher Center, la funzionalità che consente ai proprietari dei siti di rivendicare i propri siti sarà deprecata, vale a dire, come ho inteso,rimossa
- Il nome dello strumento diventerà Google Display Network Ad Planner
Un punto di vista potrebbe essere che Google dà e Google toglie. Pur comprendendo che la chiacchierata fra Larry e Steve ha portato a uno sfoltimento significativo dei prodotti, il che è comprensibile, questo è uno di quei casi che trovo un po’ infelice (la Google Browser Size è un altro strumento preferito destinato al cestino, anche se una certa funzionalità limitata è migrata alle Google Analytics).
Le nuove restrizioni introdotte su Ad Planner sembrano andare contro la missione dichiarata di Google: organizzare le informazioni a livello mondiale e renderle universalmente accessibili e utili.Se sei d’accordo, lascia che i tuoi contatti in Google sappiano il tuo punto d’vista – forse qualcuno di competenza ripenserà i piani attuali. La messa a disposizione delle Google Trends for Websites dovrebbe in qualche modo attenuare le riduzioni previste nella disponibilità dei dati di Ad Planner. A meno che Google non decida di rimuoverle altrettanto.
Ti potrebbero interessare:
- Google Trends per i siti web, ora con meno dati
- Slides sulle statistiche Twitter presentate al Chirp, convegno per gli sviluppatori
- Quello che Google sa su Google e su alcune altre cose
- Statistiche Web per le ricerche di mercato in Internet: Prendi una carta, una carta qualsiasi
- Le pagine viste importano poco nella monetizzazione di un sito web
Sono aperte le iscrizioni per il prossimo corso Seo e per il corso Google Analytics. Cosa aspettate?




da Giadascript 2012-08-30 - 12:01
Ottimo post. La maggior parte della gente che lavora nel nostro campo non ha la minima idea di come certi dati spacciati per verità assolute siano invece inaffidabili.
Aggiungerei che nessuna società, neanche Google, può dichiarare di divulgare dati corretti. Come hai specificato, ormai tutti i dati vengono raccolti tramite strumenti di tagging e il tagging è soggetto a moltissimi errori da parte degli utenti.
Anche se lasciassimo perdere i dati provenienti dai tag di Web Analytics e ci basassimo sulle statistiche di un singolo Ad Server universale (quindi guarderemmo le impression calcolate sempre allo stesso modo), qualcuno barerebbe inserendo pop-under, redirect e refresh di pagina.
Alla fine dei conti, penso che la cosa migliore sia quella di guardare meno ai dati altrui e concentrarsi sui propri, soprattutto sui risultati in termini di profitto (non di fatturato) che arrivano dagli investimenti in advertising. Peccato che molte aziende (quelle che investono e sono interessate a questi dati) ragionino in termini di “Ho un budget e devo essere sicuro di spenderlo tutto fino all’ultimo cent, altrimenti il capo mi taglia la testa e i fondi, quindi investo su chi fa più traffico. Stop”.
Evidentemente il problema non è solo italiano, ma la cosa non mi consola affatto.
da Sean Carlos 2012-08-30 - 12:16
Grazie per il commento Giada, concordo a pieno.
Noto solo che Google ha molti dati oltre le tag, vale a dire i toolbar, il public DNS etc.