Guida all'Analisi delle Statistiche di Siti Web con AWStats, parte 2

Antezeta Servizi di Statistiche per Siti Web

Scelta della soluzione, implementazione e formazione

Mettete un segnalibro a questa risorsa!

AWStats Logo

A cura di Sean Carlos
Pubblicato da O'Reilly Media come Analyzing Web Logs with AWStats.

La prima parte di questa serie indica come realizzare un'installazione di base dello strumento di analisi del log AWStats, creare relazioni e capire la terminologia di base delle statistiche internet - Web Analytics. Questo secondo articolo esamina a fondo le relazioni, prendendo in considerazione le misure da tenere sott'occhio per il personale commerciale e tecnico.

I report fondamentali... continuato

Relazioni AWStats "Sommari" e "Quando"

AWStats fornisce parecchie relazioni di sommario che mostrano le tendenze generali di un sito web in intervalli di tempo diversi nel periodo di riferimento, di solito mensilmente.

Sommario

La relazione Sommario Generale si suddivide in Visitatori diversi, Numero di visite, Pagine, Accessi e Banda per i visitatori umani e non, il tutto relativamente al Periodo di riferimento. Le Metriche da controllare sono:

Visitatori diversi
Il numero generale di utenti che vengono ad un sito è utile per osservare la tendenza generale col tempo. I cali, a meno che sia dovuto alle fluttuazioni stagionali, sono gli indicatori di difficoltà. Un concorrente sta portando via il tuo traffico potenziale? Cambiamenti al tuo sito hanno rimosso il sito dai motori di ricerca? Hai operato cambiamenti nella tua attività di vendita?
Ratio [Visitatori diversi / Numero visite]
Ciò risponde alla domanda "Ritornano i visitatori?" Se non tornano, forse è perché non potevano trovare quello che cercavano –– hai detto ad un motore di ricerca che offri il poker quando vendi i gadget? È in grado una persona comune di cavarsela nel tuo sistema di navigazione?
Pagine
Sono più significative se confrontate col numero di visitatori. Vedi sotto.
Ratio [Pagine / Visitatori]
Ciò indica il livello di coinvolgimento del visitatore nei confronti del tuo sito. Generalmente, più alto è il numero, meglio è, ma un alto numero può indicare anche la presenza dei flussi e dei processi complessi del sito che forzano i visitatori motivati a sfogliare pagina dopo che pagina per raggiungere il loro obiettivo.
Riepilogo mensile

Ciò fornisce l'analisi di visitatori e pagine mese per mese per l'anno in corso. Nel confrontare i mesi tra loro, non dimenticare di aggiustare sulla base del numero variabile di giorni in un mese. Tieni d'occhio i Visitatori diversi / Numero di Visite e la relazione Pagine / Visitatori che devi calcolare manualmente.

Suggerimento: Alcuni preferiscono una visualizzazione degli ultimi 12 mesi piuttosto che dell'anno in corso. Cerca nella lista di patch per AWStats per awstats.pl-1.783_last_12_months.patch o una versione più nuova.

Giorni del mese
Durante un mese, i picchi insoliti possono indicare che il tuo sito sta ricevendo promozione da altrove –– rivedi la provenienza del traffico. Un traffico inusualmente basso, se non durante una festa, può indicare difficoltà nell'accesso al tuo sito –– se questo era giù o a basse prestazioni. Consulta gli strumenti di monitoraggio, se disponibili.
Giorni della settimana
Ciò è utile per vedere quali giorni siano più popolari. Per la vendita, indica quando il pubblico è più numeroso. Per il personale tecnico, questo può suggerire quando sia da effettuare una manutenzione pianificata. Ci può essere una leggera discrepanza in quanto ciascuno dei sette giorni non è costantemente presente in ogni mese (30 e 31 che non sono uniformemente divisibili per 7).
Ore
Ciò è una ripartizione più dettagliata dei picchi generali in confronto alla relazione Giorni della settimana. I picchi orari sono utili al personale tecnico responsabile della pianificazione di capienza. A volte una ripartizione oraria per un giorno specifico è necessaria. Per fare questo, vedi le istruzioni per la configurazione delle relazioni quotidiane nel FAQ AWStats.

Tendenze giorno per giorno e mese per mese sono utili nella valutazione dell'effetto delle iniziative di vendita e/o delle spinte esterne al traffico.

AWStats offre funzionalità per specificare intervalli annuali utilizzando sintassi dei dati sulla linea di comando -month=all -year=AAAA o con l'opzione di configurazione AllowFullYearView per l'interfaccia su richiesta CGI. Le relazioni quotidiane sono disponibili come funzionalità non ufficiale. I cambiamenti progettati per la versione 6.5 dovrebbero facilitare la scelta di intervalli di tempo diversi.

Provenienza degli Utenti: Costruzione e Verifica del Traffico

La costruzione (e controllo) di traffico qualificato è un'attività di vendita essenziale per la maggior parte dei siti, senza riguardo al modello di affari. Tecnicamente, i cambiamenti nei modelli di traffico sono utili per la pianificazione e l'amministrazione di capienza. Il traffico viene da:

Le relazioni di AWStats pertinenti sono nella sezione Provenienza delle connessioni.

Accessi diretti o via segnalibro

AWStats considera come accessi diretti o via segnalibro i visitatori ai quali manca una URL di provenienza nella prima richiesta di pagina durante una visita/sessione. Alcuni software di privacy, come Norton Internet Security, possono oscurare il trasferimento della URL di provenienza; tali visitatori appariranno in questa relazione anche se sono venuti tramite un collegamento presso altro sito o motore di ricerca.

Le relazioni dei motori di ricerca mostrano quali motori di ricerca e quali quesiti abbiano portato i visitatori al sito. La relazione principale contiene i dati più frequenti; ogni sezione possiede un collegamento ad un elenco completo per il periodo di riferimento.

Accessi dai motori di ricerca
Ciò risponde alla domanda "Quali motori di ricerca ci inviano traffico?". Vedi la relazione Accessi di robot e spider per assicurare che i motori di ricerca stiano indicizzando il tuo sito.
Frasi cercate
Le prime combinazioni di parola multiple cercate dai visitatori.
Parole cercate
Le prime parole individuali immesse dai visitatori. Questo elenco risulta dalla riduzione di intere frasi a parole singole.

Le informazioni di attività di ricerca sono estremamente utili a convalidare e a raffinare gli sforzi di ottimizzazione per i motori di ricerca in base al merito™. Le frasi di parole chiave identificano la lingua usata dai visitatori del sito, una lingua che è, di solito, piuttosto famigliare, se paragonata al lessico professionale spesso prevalente nei testi di un sito. Considera l'eventualità di rivedere i testi del sito per assicurare che essi contengano una lingua usata dal pubblico comune pur mantenendo un tono professionale. L'assenza di sinonimi di parole chiave indica più probabilmente che queste parole non sono presenti nel contenuto del sito e non tanto che esse mancano nell'uso dei visitatori del sito.

Accessi da pagina esterna

Mentre la maggior parte del traffico indiretto proviene dai motori di ricerca, il traffico può provenire anche da collegamenti presso siti esterni –– collegamenti dovuti al contenuto irresistibile, accordi pubblicità, ecc. Controlla i collegamenti dai siti esterni:

Per difetto, AWStats mostra la pagina specifica che ha fatto riferimento al nostro sito. È inoltre possibile aggregare i referrers dal dominio approfittando della funzionalità relazione su misura (ExtraSection) di AWStats. Aggiungi semplicemente la seguente logica al tuo file di configurazione AWStats:


ExtraSectionName1="Siti di provenienza per dominio - Primi 25"
ExtraSectionCodeFilter1="200 304"
# Prende tutti i siti tranne "miosito". Cambi "miosito" nel nome del tuo domino.
ExtraSectionCondition1="REFERER,^(?!http:\/\/www\.miosito\.it)"
ExtraSectionFirstColumnTitle1="Sito"
ExtraSectionFirstColumnValues1="REFERER,^[hH][tT][tT][pP]:\/\/([^\/]+)\/"
ExtraSectionFirstColumnFormat1="%s"
ExtraSectionStatTypes1=PHL
ExtraSectionAddAverageRow1=1
ExtraSectionAddSumRow1=1
MaxNbOfExtra1=25
MinHitExtra1=1

Questa sezione comparirà solo a partire dal momento in cui il file di configurazione viene aggiornato. Per elaborare con effetto retroattivo questa relazione, devi cancellare i file di statistica AWStats ed elaborarli come pure relazioni derivanti da questi.

Provenienza geografica

Essendo possibile associare il nome del Host del visitatore ad un'ubicazione fisica, risulta anche possibile segnalare la sua provenienza geografica. Per difetto, AWStats offre una relazione a livello di Nazione.

Nazioni
La relazione Nazioni generalmente indica i paesi di origine del traffico. Come notato prima, alcuni visitatori possono accedere ad Internet tramite proxy cache nelle grandi società, mascherando la loro vera posizione. Tuttavia, le informazioni del Paese possono assistere la pianificazione strategica relativa ai mercati stranieri –– ma, un sito di commercio elettronico dovrebbe accettare i metodi di pagamento stranieri? Vale la pena tradurre il sito nelle lingue locali? Siete forti in Giappone?
Suggerimento: Se le informazioni per le nazioni mancano, probabilmente non è stato effettuato il DNSLookup sui tuoi file di log. In alternativa, puoi utilizzare il Plugin Maxmind Geoip.
Regione
Città
ISP
Organizzazione
Maggiori dettagli geografici sono in teoria possibili acquistando i plugin commerciali per AWStats da Maxmind. Ci sono tuttavia limitazioni derivanti dalle modalità con le quali i visitatori si collegano ad Internet attraverso gli ISP. Ad esempio, un numero sproporzionato di visitatori degli Stati Uniti può apparire come proveniente dalla sola Virginia, essendo entrato in Internet tramite i proxy di AOL là localizzati.

Relazioni sul comportamento dei visitatori nel sito

Parecchie relazioni di vendita aiutano a comprendere il comportamento degli utenti una volta arrivati al tuo sito.

Durata delle visite
Per durata delle visite si intende il tempo dalla prima richiesta di una pagina fino all'ultima richiesta di una pagina, senza che ci sia una pausa superiore a 60 minuti (= tempo di scadenza di sessione). In generale, più lungo è il tempo, più il tuo sito coinvolge il visitatore. La durata effettiva sarà sempre più lunga poiché i server web non possono tracciare quanto tempo il visitatore sia rimasto sulla pagina finale prima di digitare una nuova URL o chiudere il loro browser. Le visite brevi significano che il tuo sito non attira l'attenzione dei suoi visitatori.
Pagine-URL
La relazione principale mostra le prime 10 pagine viste; la lista completa per il periodo di riferimento è disponible mediante un collegamento. Ciò indica quali pagine siano più o meno popolari.
Pagine iniziali
Le pagine iniziali di accesso al sito indicano quali pagine attirano l'attenzione dei motori di ricerca e dei siti esterni. Assicurati che queste pagine parlino ad un pubblico che vi arriva direttamente.
Pagine di uscita
Queste sono le pagine principali in cui un visitatore ha abbandonato il sito. Nel migliore dei casi, le pagine rappresentano la conclusione di un processo naturale ed indicano semplicemente le opportunità per invitare il visitatore ad esplorare il sito ulteriormente. Se la pagina è all'inizio o nel mezzo di un flusso di processo logico, hai la prova diretta che qualcosa impedisce che un visitatore si converta in un cliente. Riesamina la pagina per determinare ciò che disorienta i visitatori –– c'e' per caso un modulo con 30 campi o manca un bottone visibile "continua" quando si utilizza Firefox?

Suggerimento: Considera la possibilità di estendere AWStats utilizzando le relazioni su misura ExtraSection per controllare pagine specifiche del sito e/o cartelle. Il seguente esempio, inserito nel tuo file di configurazione AWStats, traccerà le cartelle di primo e secondo livello più visitate del sito. Per i siti che hanno organizzato il contenuto negli elenchi distinti, questo tipo di relazione fornisce a colpo d'occhio l'andamento globale.

ExtraSectionName2="Le prime 50 cartelle di primo e secondo livello" ExtraSectionCodeFilter2="200 304"
ExtraSectionCondition2="URL,^\/.*" 
ExtraSectionFirstColumnTitle2="Cartella"
ExtraSectionFirstColumnValues2="URL,(^(\/[\w]+\/[\w]+\/)|^(\/[\w]+\/))"
ExtraSectionStatTypes2=PHB
ExtraSectionAddAverageRow2=0
ExtraSectionAddSumRow2=0
MaxNbOfExtra2=50
MinHitExtra2=1

Per ogni riga, cambia 2= con 1= se non hai già un ExtraSection. Oltre al secondo esempio qui presente, ci sono altri sei esempi nella documentazione AWStats su ExtraSection nonché esempi addizionali nella zona di risorsa AWStats.

Relazione per lo sviluppo e gestione dei siti

Parecchie relazioni tecniche assistono lo sviluppo e controllo della qualità di un sito.

I Sistemi Operativi e le Versioni
Ciò fornisce informazioni sui sistemi operativi e, nella relazione dettagliata, sulle loro versioni utilizzate dai visitatori per accedere al tuo sito. Utilizza questa relazione unitamente a quella di browser per evidenziare in quale ambito concentrare gli sforzi nel collaudo del sito.
Browser
I primi browser utilizzati per visitare il sito. Utilizza questa per dare la priorità a quale Browser collaudare con il sito.
Codici di stato Http

La maggior parte delle relazioni di AWStats elaborano richieste di successo –– lo stato 200 o 304. Questa relazione contiene gli altri stati. Controllala per possibili problemi. I più comuni sono:

401 Non Autorizzato
Per i siti con un server login per accedere ad un'area di sito riservata, questo indica login falliti.
404 Documento non Trovato
Ciò indica una richiesta per un oggetto non trovato sul server web. Questo può essere un file dimenticato durante un passaggio nella produzione, un collegamento inesatto, un collegamento sorpassato da un sito esterno (considera l'eventualità di contattare il sito per aggiornare il collegamento), o un tentativo di attacco.
500 Errore di Server Interno
Ciò indica di solito che un server web è configurato in modo errato oppure il fallimento del server web durante una chiamata verso un'applicazione esterna.

Suggerimento: Considera di elaborare una relazione su misura sul campo agente-utente (user agent, browser) nel log file per incrociare le combinazioni di browser e sistemi operativi.

Relazioni AWStats di Attività non Umane

Tendiamo a pensare ad attività interattiva quando pensiamo alle richieste al nostro sito web, ma, dietro le quinte, c'è anche molto traffico automatizzato, non umano. Ciò si ripartisce in quattro tipi fondamentali:

Il termine robot, implicando automazione, fa riferimento a qualunque dei quattro tipi. Il termine ragno/spider/crawler fa riferimento all'attività tipica di attrezzi di indicizzazione utilizzati dai motori di ricerca: seguono i collegamenti da un sito ad un altro e all'interno del sito nella ricerca di contenuto nuovo ed altri siti. Gli attacchi provano, di solito, a dare comandi nel tentativo di accedere al sistema.

La buona notizia è che AWStats può riconoscere automaticamente la maggior parte del traffico non umano e separarlo dalle relazioni di attività interattive generali.

Ragni/spider dei motori di ricerca

Il traffico di Ragni/spider/crawler è altamente favorevole –– è l'aggiornamento continuo del tuo contenuto negli indici dei motore di ricerca. La capacità di controllare questo traffico è essenziale come componente di una strategia di ottimizzazione di un sito per i motori di ricerca. Molte organizzazioni investono nella pubblicità a pagamento nei motori senza avere sfruttato i più notevoli benefici di ottimizzazione organica per i motori di ricerca in base al merito™. Controlla questo traffico per assicurare che Googlebot e altri ragni stiano aggiornando i loro indici regolarmente. La relazione AWStats pertinente è Accessi di robot e spider.

Attrezzi per scaricare ed uso locale (off-line)

Gli strumenti per scaricare e di uso locale (off-line), quali wget e httrack, scaricheranno il contenuto intero di un dominio o di una sotto-cartella di un dominio, come specificato dalla persona che lancia lo strumento. Mentre il tuo server soddisfa queste richieste, non si sa se una persona guarderà mai tutte le pagine né quante volte l'operatore consulterà le pagine in locale. Da un punto di vista commerciale, lo scaricamento del sito potrebbe rappresentare un controllo da parte della tua concorrenza. Le relazioni AWStats pertinenti sono Browser (wget) e Accessi di robot e spider (httrack, se robots.pm è aggiornato).

Attacchi

Un certo traffico del sito consiste in tentativi automatizzati di sfruttare le debolezze dei server web nel tentativo di dirottare il server. AWStats attualmente rintraccia cinque tipi di attacchi a Microsoft IIS. Se non utilizzi IIS, puoi disabilitare la relazione. La relazione di AWStats pertinente è gli attacchi di Worm.

Programmi di Verifica e Controllo

Molti siti impiegano le transazioni virtuali automatizzate per controllare i processi specifici nel loro sito web. La pratica usuale è di filtrare questo traffico dalla tua statistica web. A questo fine, AWStats fornisce due direttive di configurazione. Puoi utilizzare lo SkipHosts, se tutto il traffico (e solo quel traffico) viene da uno specifico indirizzo IP o lo SkipUserAgents, se il robot, eseguendo le transazioni, si identifica con un nome particolare.

Una nota sulla misurazione del traffico non-umano ed i sistemi con pagine etichettate

Una critica all'analisi di dati di log file di server web è che la presenza di traffico non-umano altera la statistica. Il metodo alternativo primario, pagina con etichette (page tagging), funziona con JavaScript che dovrebbe richiamare il server di statistiche soltanto quando un browser normale, non un robot, visita una pagina. In teoria, questo esclude il traffico non-umano. I venditori dei sistemi, utilizzando le etichette di pagina, cercano di attirare clienti perché propongono questo aspetto come vantaggioso. Purtroppo, con questo approccio, mancano delle informazioni essenziali alla gestione della maggior parte dei siti. In particolare manca la visibilità delle attività di ragni dei motori di ricerca, un ingrediente essenziale a una strategia di ottimizzazione per i motori di ricerca. AWStats offre il meglio di entrambi i mondi –– registra il traffico automatizzato, lo considera nelle relazioni, ma mantiene questi dati separati dalle relazioni sulle attività interattive umane. L'analisi di log web comprende anche gli oggetti che non sono facili da tracciare con etichette, come le immagini e tutti i file da scaricare, come documenti .doc o .pdf.

Ultime Parole

Questi articoli hanno trattato soltanto superficialmente ciò che è possibile effetuare mediante l'analitica web ed AWStats. Le risorse seguenti possono aiutarti nell'integrazione dell'analisi di log web con AWStats con la tua gestione del sito web.

Consigli finali

Risorse addizionali

Opzioni per l'Assistenza

Linee guida di misurazione

Le seguenti risorse forniscono maggiori informazioni sulla terminologia della statistiche web e sul suo utilizzo.

Ragni Conosciuti

Caching web

La purtroppo frequente gestione errata di cache, può riguardare sia la consegna corretta di contenuto web sia la statistica web.

Stumenti open source alternativi all'analisi di log web

Ci sono due alternative significative ad AWStats nel mondo open source:

Nessuno degli strumenti open source per l'analisi di statistiche siti web comprende l'analisi clickstream, cioè il sentiero di navigazione, una caratteristica disponibile di solito nelle soluzioni commerciali di "classe Enterprise". StatViz - l'Analisi Visuale di Clickstream, disponibile per più piattaforme, può aiutarti a riempire questo vuoto. Ho scritto le istruzioni per l'installazione e configurazione rudimentali di StatViz su Linux per facilitare la valutazione di StatViz.

AWStats è grazie a...

L'autore principale di AWStats è Laurent Destailleur, . Affinché egli possa dedicare il suo tempo in modo proficuo al miglioramento di AWStats, ti consiglio di contattarlo tramitte il forum invece di scrivergli direttamente.

Lascia che Antezeta ti aiuti nella selezione, implementazione ed utilizzo di una soluzione per i tuoi Web Analytics! Contattaci per saperne di più su Statistiche Internet - Web Analytics e sul resto dell'ecosistema web.

Indice completo

  1. Guida all'Analisi delle Statistiche dei Siti con AWStats
    1. Installare AWStats
    2. Preparazione di un log di un web server
    3. Creazione di un file di configurazione AWStats
    4. Costruire ed aggiornare la base dati Statistica di AWStats
      1. Suggerimenti per Log Corrotti
      2. Suggerimento per la conservazione dei log
    5. Produzione dei primi Report
      1. Suggerimento per le immagini incluse nei report
    6. I report fondamentali: Accessi, Pagine, Sessioni e Visitatori
      1. Anatomia di un log file di un web server
      2. Accessi Ovunque
      3. Passiamo alle Pagine
      4. Suggerimenti per il Conteggio delle Pagine
      5. Visitatori e Sessioni
      6. Banda Utilizzata
      7. Relazioni AWStats "Sommari" e "Quando"
      8. Provenienza degli Utenti: Costruzione e Verifica del Traffico
        1. Accessi diretti o via segnalibro
        2. Utilizzo dei motori di ricerca
        3. Accessi da pagina esterna
        4. Provenienza geografica
      9. Relazioni sul comportamento dei visitatori nel sito
      10. Relazione per lo sviluppo e gestione dei siti
      11. Relazioni AWStats di Attività non Umane
        1. Ragni/spider dei motori di ricerca
        2. Attrezzi per scaricare ed uso locale (off-line)
        3. Attacchi
        4. Programmi di Verifica e Controllo
        5. Una nota sulla misurazione del traffico non-umano ed i sistemi con pagine etichettate
    7. Ultime Parole
      1. Consigli finali
    8. Risorse addizionali
      1. Opzioni per l'Assistenza
      2. Linee guida di misurazione
      3. Ragni Conosciuti
      4. Caching web
      5. Stumenti open source alternativi all'analisi di log web
      6. AWStats è grazie a...
Home · Contattaci · Mappa e Ricerca nel sito · Tasti di scelta rapida ‹k› · Su ‹j›