A cura di Sean Carlos
Pubblicato da O'Reilly Media come Analyzing Web Logs with AWStats.
La prima parte di questa serie indica come realizzare un'installazione di base dello strumento di analisi del log AWStats, creare relazioni e capire la terminologia di base delle statistiche internet - Web Analytics. Questo secondo articolo esamina a fondo le relazioni, prendendo in considerazione le misure da tenere sott'occhio per il personale commerciale e tecnico.
AWStats fornisce parecchie relazioni di sommario che mostrano le tendenze generali di un sito web in intervalli di tempo diversi nel periodo di riferimento, di solito mensilmente.
La relazione Sommario Generale si suddivide in Visitatori diversi, Numero di visite, Pagine, Accessi e Banda per i visitatori umani e non, il tutto relativamente al Periodo di riferimento. Le Metriche da controllare sono:
Ciò fornisce l'analisi di visitatori e pagine mese per mese per l'anno in corso. Nel confrontare i mesi tra loro, non dimenticare di aggiustare sulla base del numero variabile di giorni in un mese. Tieni d'occhio i Visitatori diversi / Numero di Visite e la relazione Pagine / Visitatori che devi calcolare manualmente.
Suggerimento: Alcuni preferiscono una visualizzazione degli ultimi 12 mesi piuttosto che dell'anno in corso. Cerca nella lista di patch per AWStats per awstats.pl-1.783_last_12_months.patch o una versione più nuova.
Tendenze giorno per giorno e mese per mese sono utili nella valutazione dell'effetto delle iniziative di vendita e/o delle spinte esterne al traffico.
AWStats offre funzionalità per specificare intervalli annuali utilizzando sintassi dei dati sulla linea di comando -month=all -year=AAAA
o con l'opzione di configurazione AllowFullYearView per l'interfaccia su richiesta CGI. Le relazioni quotidiane sono disponibili come funzionalità non ufficiale. I cambiamenti progettati per la versione 6.5 dovrebbero facilitare la scelta di intervalli di tempo diversi.
La costruzione (e controllo) di traffico qualificato è un'attività di vendita essenziale per la maggior parte dei siti, senza riguardo al modello di affari. Tecnicamente, i cambiamenti nei modelli di traffico sono utili per la pianificazione e l'amministrazione di capienza. Il traffico viene da:
Le relazioni di AWStats pertinenti sono nella sezione Provenienza delle connessioni.
AWStats considera come accessi diretti o via segnalibro i visitatori ai quali manca una URL di provenienza nella prima richiesta di pagina durante una visita/sessione. Alcuni software di privacy, come Norton Internet Security, possono oscurare il trasferimento della URL di provenienza; tali visitatori appariranno in questa relazione anche se sono venuti tramite un collegamento presso altro sito o motore di ricerca.
Le relazioni dei motori di ricerca mostrano quali motori di ricerca e quali quesiti abbiano portato i visitatori al sito. La relazione principale contiene i dati più frequenti; ogni sezione possiede un collegamento ad un elenco completo per il periodo di riferimento.
Le informazioni di attività di ricerca sono estremamente utili a convalidare e a raffinare gli sforzi di ottimizzazione per i motori di ricerca in base al merito™. Le frasi di parole chiave identificano la lingua usata dai visitatori del sito, una lingua che è, di solito, piuttosto famigliare, se paragonata al lessico professionale spesso prevalente nei testi di un sito. Considera l'eventualità di rivedere i testi del sito per assicurare che essi contengano una lingua usata dal pubblico comune pur mantenendo un tono professionale. L'assenza di sinonimi di parole chiave indica più probabilmente che queste parole non sono presenti nel contenuto del sito e non tanto che esse mancano nell'uso dei visitatori del sito.
Mentre la maggior parte del traffico indiretto proviene dai motori di ricerca, il traffico può provenire anche da collegamenti presso siti esterni –– collegamenti dovuti al contenuto irresistibile, accordi pubblicità, ecc. Controlla i collegamenti dai siti esterni:
Per difetto, AWStats mostra la pagina specifica che ha fatto riferimento al nostro sito. È inoltre possibile aggregare i referrers dal dominio approfittando della funzionalità relazione su misura (ExtraSection) di AWStats. Aggiungi semplicemente la seguente logica al tuo file di configurazione AWStats:
ExtraSectionName1="Siti di provenienza per dominio - Primi 25"
ExtraSectionCodeFilter1="200 304"
# Prende tutti i siti tranne "miosito". Cambi "miosito" nel nome del tuo domino.
ExtraSectionCondition1="REFERER,^(?!http:\/\/www\.miosito\.it)"
ExtraSectionFirstColumnTitle1="Sito"
ExtraSectionFirstColumnValues1="REFERER,^[hH][tT][tT][pP]:\/\/([^\/]+)\/"
ExtraSectionFirstColumnFormat1="%s"
ExtraSectionStatTypes1=PHL
ExtraSectionAddAverageRow1=1
ExtraSectionAddSumRow1=1
MaxNbOfExtra1=25
MinHitExtra1=1
Questa sezione comparirà solo a partire dal momento in cui il file di configurazione viene aggiornato. Per elaborare con effetto retroattivo questa relazione, devi cancellare i file di statistica AWStats ed elaborarli come pure relazioni derivanti da questi.
Essendo possibile associare il nome del Host del visitatore ad un'ubicazione fisica, risulta anche possibile segnalare la sua provenienza geografica. Per difetto, AWStats offre una relazione a livello di Nazione.
Parecchie relazioni di vendita aiutano a comprendere il comportamento degli utenti una volta arrivati al tuo sito.
Suggerimento: Considera la possibilità di estendere AWStats utilizzando le relazioni su misura ExtraSection per controllare pagine specifiche del sito e/o cartelle. Il seguente esempio, inserito nel tuo file di configurazione AWStats, traccerà le cartelle di primo e secondo livello più visitate del sito. Per i siti che hanno organizzato il contenuto negli elenchi distinti, questo tipo di relazione fornisce a colpo d'occhio l'andamento globale.
ExtraSectionName2="Le prime 50 cartelle di primo e secondo livello" ExtraSectionCodeFilter2="200 304"
ExtraSectionCondition2="URL,^\/.*"
ExtraSectionFirstColumnTitle2="Cartella"
ExtraSectionFirstColumnValues2="URL,(^(\/[\w]+\/[\w]+\/)|^(\/[\w]+\/))"
ExtraSectionStatTypes2=PHB
ExtraSectionAddAverageRow2=0
ExtraSectionAddSumRow2=0
MaxNbOfExtra2=50
MinHitExtra2=1
Per ogni riga, cambia 2=
con 1=
se non hai già un ExtraSection
. Oltre al secondo esempio qui presente, ci sono altri sei esempi nella documentazione AWStats su ExtraSection nonché esempi addizionali nella zona di risorsa AWStats.
Parecchie relazioni tecniche assistono lo sviluppo e controllo della qualità di un sito.
La maggior parte delle relazioni di AWStats elaborano richieste di successo –– lo stato 200 o 304. Questa relazione contiene gli altri stati. Controllala per possibili problemi. I più comuni sono:
Suggerimento: Considera di elaborare una relazione su misura sul campo agente-utente (user agent, browser) nel log file per incrociare le combinazioni di browser e sistemi operativi.
Tendiamo a pensare ad attività interattiva quando pensiamo alle richieste al nostro sito web, ma, dietro le quinte, c'è anche molto traffico automatizzato, non umano. Ciò si ripartisce in quattro tipi fondamentali:
Il termine robot, implicando automazione, fa riferimento a qualunque dei quattro tipi. Il termine ragno/spider/crawler fa riferimento all'attività tipica di attrezzi di indicizzazione utilizzati dai motori di ricerca: seguono i collegamenti da un sito ad un altro e all'interno del sito nella ricerca di contenuto nuovo ed altri siti. Gli attacchi provano, di solito, a dare comandi nel tentativo di accedere al sistema.
La buona notizia è che AWStats può riconoscere automaticamente la maggior parte del traffico non umano e separarlo dalle relazioni di attività interattive generali.
Il traffico di Ragni/spider/crawler è altamente favorevole –– è l'aggiornamento continuo del tuo contenuto negli indici dei motore di ricerca. La capacità di controllare questo traffico è essenziale come componente di una strategia di ottimizzazione di un sito per i motori di ricerca. Molte organizzazioni investono nella pubblicità a pagamento nei motori senza avere sfruttato i più notevoli benefici di ottimizzazione organica per i motori di ricerca in base al merito™. Controlla questo traffico per assicurare che Googlebot e altri ragni stiano aggiornando i loro indici regolarmente. La relazione AWStats pertinente è Accessi di robot e spider.
Gli strumenti per scaricare e di uso locale (off-line), quali wget e httrack, scaricheranno il contenuto intero di un dominio o di una sotto-cartella di un dominio, come specificato dalla persona che lancia lo strumento. Mentre il tuo server soddisfa queste richieste, non si sa se una persona guarderà mai tutte le pagine né quante volte l'operatore consulterà le pagine in locale. Da un punto di vista commerciale, lo scaricamento del sito potrebbe rappresentare un controllo da parte della tua concorrenza. Le relazioni AWStats pertinenti sono Browser (wget) e Accessi di robot e spider (httrack, se robots.pm è aggiornato).
Un certo traffico del sito consiste in tentativi automatizzati di sfruttare le debolezze dei server web nel tentativo di dirottare il server. AWStats attualmente rintraccia cinque tipi di attacchi a Microsoft IIS. Se non utilizzi IIS, puoi disabilitare la relazione. La relazione di AWStats pertinente è gli attacchi di Worm.
Molti siti impiegano le transazioni virtuali automatizzate per controllare i processi specifici nel loro sito web. La pratica usuale è di filtrare questo traffico dalla tua statistica web. A questo fine, AWStats fornisce due direttive di configurazione. Puoi utilizzare lo SkipHosts, se tutto il traffico (e solo quel traffico) viene da uno specifico indirizzo IP o lo SkipUserAgents, se il robot, eseguendo le transazioni, si identifica con un nome particolare.
Una critica all'analisi di dati di log file di server web è che la presenza di traffico non-umano altera la statistica. Il metodo alternativo primario, pagina con etichette (page tagging), funziona con JavaScript che dovrebbe richiamare il server di statistiche soltanto quando un browser normale, non un robot, visita una pagina. In teoria, questo esclude il traffico non-umano. I venditori dei sistemi, utilizzando le etichette di pagina, cercano di attirare clienti perché propongono questo aspetto come vantaggioso. Purtroppo, con questo approccio, mancano delle informazioni essenziali alla gestione della maggior parte dei siti. In particolare manca la visibilità delle attività di ragni dei motori di ricerca, un ingrediente essenziale a una strategia di ottimizzazione per i motori di ricerca. AWStats offre il meglio di entrambi i mondi –– registra il traffico automatizzato, lo considera nelle relazioni, ma mantiene questi dati separati dalle relazioni sulle attività interattive umane. L'analisi di log web comprende anche gli oggetti che non sono facili da tracciare con etichette, come le immagini e tutti i file da scaricare, come documenti .doc o .pdf.
Questi articoli hanno trattato soltanto superficialmente ciò che è possibile effetuare mediante l'analitica web ed AWStats. Le risorse seguenti possono aiutarti nell'integrazione dell'analisi di log web con AWStats con la tua gestione del sito web.
Le seguenti risorse forniscono maggiori informazioni sulla terminologia della statistiche web e sul suo utilizzo.
La purtroppo frequente gestione errata di cache, può riguardare sia la consegna corretta di contenuto web sia la statistica web.
Ci sono due alternative significative ad AWStats nel mondo open source:
Nessuno degli strumenti open source per l'analisi di statistiche siti web comprende l'analisi clickstream, cioè il sentiero di navigazione, una caratteristica disponibile di solito nelle soluzioni commerciali di "classe Enterprise". StatViz - l'Analisi Visuale di Clickstream, disponibile per più piattaforme, può aiutarti a riempire questo vuoto. Ho scritto le istruzioni per l'installazione e configurazione rudimentali di StatViz su Linux per facilitare la valutazione di StatViz.
L'autore principale di AWStats è Laurent Destailleur, . Affinché egli possa dedicare il suo tempo in modo proficuo al miglioramento di AWStats, ti consiglio di contattarlo tramitte il forum invece di scrivergli direttamente.
Lascia che Antezeta ti aiuti nella selezione, implementazione ed utilizzo di una soluzione per i tuoi Web Analytics! Contattaci per saperne di più su Statistiche Internet - Web Analytics e sul resto dell'ecosistema web.
Indice completo