Informazioni ed estensioni per AWStats

Dal nostro blog

Antezeta Servizi di Statistiche per Siti Web

Scelta della soluzione, implementazione e formazione

Mettete un segnalibro a questa risorsa!

AWStats Logo

Questa area è dedicata alle risorse utili per migliorare le funzionalità di AWStats uno dei migliori pacchetti open source per la web analytics.

Quanto segue è il risultato di quanto abbiamo sviluppato partendo proprio dai bisogni dei nostri clienti e le riproponiamo qui come contributo liberamente riutilizzabile. Alcuni di questi contributi saranno inclusi in una delle prossime versioni di AWStats!

Avvertimento Le informazioni qui fornite sono rilasciate secondo la politica "a me funzione". Vale a dire che possono essere liberamente riutilizzate per fare dei test, delle verifiche o per un utilizzo vero e proprio ma Antezeta non fornisce alcuna forma di garanzia.

· Contattateci con suggerimenti.

Report personalizzati: esempi delle sezioni ExtraSection

AWStats implementa un'eccellente sintassi per creare un report custom denominato ExtraSection che permette ad un'organizzazione sia di estendere AWStats standard sia di aggiungere report specifici. Nel seguito diamo alcuni esempi di ExtraSection utili per siti particolarmente attenti al e/o al controllo del traffico proveniente dai siti esterni.

Avvertimento L'analisi del log file del web server può essere molto gravosa per le risorse di memoria della CPU. La documentazione di AWStats avverte che ogni ExtraSection riduce la velocità di AWStats dell'8% circa. Si raccomanda dunque di procedere con cautela.

Consiglio Le nuove sezioni dei report compariranno solo per i dati dei log elaborati dopo che il file di configurazione AWStats è stato aggiornato. Per elaborare i report con effetto retroattivo, occorre cancellare i file di statistiche di AWStats e i relativi report, e dunque rigenerare il tutto.

Posizionamento nei motori di ricerca

Tranne alcuni siti "di destinazione abituale" sulla rete (ad esempio Google stesso), solitamente è utile ricorrere alle tecniche di posizionamento nei motori di ricerca ossia all'ottimizzazione del sito in base al merito™ (SEO) come guida per l'attività di progettazione, controllo e miglioramento continuo. Di serie, AWStats fornisce:

Chi si occupa di posizionamento nei motori di ricerca ha inoltre necessità di verificare:

Esempio di attività derivate dai motori di ricerca

La verifica ed il controllo delle ricerche andate a buon fine in funzione delle parole chiave o delle frasi di parole chiave mostrano con precisione quali parole stanno portando traffico al sito. Le differenze fra i motori di ricerca spingono a valutare fattori multipli – come le attività dei crawler, l'impianto e il contenuto del sito stesso.

Per vedere quali parole chiave e frasi di parole chiave stanno portando traffico da un determinato motore di ricerca, è sufficiente aggiungere il seguente codice alla sezione ExtraSection in fondo al file di configurazione di AWStats.

Avvertimento Nel caso in cui si abbiano già delle ExtraSections, occorre cambiare tutte le occorrenze di 5= con il successivo numero disponibile (es. 6).

ExtraSectionName5="Ricerche Google - Primi 50"
ExtraSectionCodeFilter5="200 304"
ExtraSectionCondition5="REFERER,(.*www\.google.*)"
ExtraSectionFirstColumnTitle5="Ricerca"
ExtraSectionFirstColumnValues5="REFERER,p=([^&]+)||REFERER,q=([^&]+)||REFERER,as_p=([^&]+)||REFERER,as_q=([^&]+)"
ExtraSectionFirstColumnFormat5="%s"
ExtraSectionStatTypes5=PHBL
ExtraSectionAddAverageRow5=0
ExtraSectionAddSumRow5=1
MaxNbOfExtra5=50
MinHitExtra5=1

2006-04-25: aggiunto il link per cercare con frasi di parole chiave direttamente da Google Italia.

Consiglio Il nocciolo della questione è esemplificato da p= in REFERER,p=([^&]+). Si tratta del separatore delle parole di ricerca. Anche se la maggior parte dei motori di ricerca ne possiede solamente uno, Google è più complesso e ne sono stati individuati almeno quattro. I separatori più comuni sono p=, q=, key=, query=. Controllando il file search_engine.pm è possibile trovare la sintassi utilizzata dal motore di ricerca di interesse.

Download di un file di testo con esempi di AWStats ExtraSection per Google, Yahoo, Ask, MSN/Windows Live e altri.

Nota Nella migliore delle ipotesi, ExtraSectionCondition5 costituirebbe una condizionale AND, forse mediante &&, (non supportato da AWStats) per canalizzare tutto il traffico di *.google.* ma non mail.google.* che è gmail. Tuttavia, non siamo ancora in grado di dirlo con sicurezza. Scriveteci se avete un suggerimento..

Esempio per controllare i robot dei motori di ricerca

La verifica ed il controllo delle attività dei crawler dei motori di ricerca è importante per stabilire se un motore di ricerca conosca o meno il nostro sito e possa dunque percorrere e indicizzare tutte le pagine.

ExtraSectionName1="Scansione Google - Primi 50"
ExtraSectionCodeFilter1="200 304"
ExtraSectionCondition1="UA,(.*Googlebot.*)"
ExtraSectionFirstColumnValues1="URL,(.*)"
ExtraSectionFirstColumnFormat1="%s"
ExtraSectionStatTypes1=PHBL
ExtraSectionAddAverageRow1=0
ExtraSectionAddSumRow1=1
MaxNbOfExtra1=50
MinHitExtra1=1

Alcuni utenti e crawler fingono di essere Googlebot quando navigano in un sito web, simulando il valore dello useragent inviato al web server. Per rendere più attendibile il tracciamento delle visite da Googlebot, è possibile cambiare la riga sopra ExtraSectionCondition1="UA,(.*Googlebot.*)" a ExtraSectionCondition1="HOST,(\.googlebot\.com$)". In questo modo saranno tracciati tutti gli oggetti (pagine, JavaScript, immagini) scaricati da qualcuno o da , cioè Googlebot, che accedono al nostro sito dall'indirizzo IP *.googlebot.com. Per Yahoo! si può utilizzare ExtraSectionCondition1="HOST,(\.inktomisearch\.com$)"; Per Microsoft utilizzare ExtraSectionCondition1="HOST,(msnbot\.msn\.com)"; Per Ask utilizzare ExtraSectionCondition1="HOST,(egspd.*\.ask\.com)". Per iniziare è possibile utilizzare anche lo useragent, ma AWStats accetta (per ora) due sole condizioni.

Abbiamo dovuto modificare AWStats per far funzionare il parametro HOST come condizione Extra Section. Abbiamo modificato questa riga


     if ($HostResolved =~ /$conditiontypeval/) { $conditionok=1; last; }

in awstats.pl a


     if ($field[$pos_host] =~ /$conditiontypeval/) { $conditionok=1; last; }

Aggiunto: 2006-08-24.

Nota Se AWStats gira su una macchina differente da quella che ospita il sito, occorre sostituire http://www.ilnostrosito.it con il nome del proprio sito. Altrimenti rimuovere completamente http://www. ilnostrosito.it.

Consiglio La chiave del puzzle è qui costituita da Googlebot che identifica il bot di Google. Questa parte varia da motore di ricerca a motore di ricerca. Controlla il file AWStats robots.pm per trovare il nome del robot per il motore di ricerca di interesse. Oltre a Googlebot, i principali sono Yahoo! Slurp (Yahoo!), Ask Jeeves/Teoma (Ask), msnbot (Microsoft Msn / Windows Live).

È possibile scaricare un file di testo con esempi di AWStats ExtraSection per Google, Yahoo, Ask, MSN/Windows Live e altro ancora.

Nota Ora, si può dire: "Ottimo, ma avrei bisogno comunque dei report dettagliati per ogni motore di ricerca". Purtroppo la sintassi attuale di ExtraSection non lo consente ancora.

Esempio di sitemap.xml usato dai motori di ricerca

Recentemente Google ha introdotto il concetto di file xml per rappresentare la mappa di un sito. Particolarmente utile per siti con una navigazione complessa, è inoltre efficace per facilitare i motori di ricerca nella rapida identificazione dei contenuti nuovi e/o aggiornati. Per maggiori approfondimenti si può consultare anche il nostro articolo su , detto anche Google Sitemaps.

La seguente ExtraSection permette di controllare chi sta utilizzando la mappa del nostro sito.

ExtraSectionName13="Scaricamenti di sitemap.xml.gz per Useragent"
ExtraSectionCodeFilter13="200 304"
ExtraSectionCondition13="URL,(^\/sitemap\.xml\.gz)"
ExtraSectionFirstColumnTitle13="UA"
ExtraSectionFirstColumnValues13="UA,(.*)"
ExtraSectionStatTypes13=HBL
ExtraSectionAddAverageRow13=0
ExtraSectionAddSumRow13=1
MaxNbOfExtra13=10
MinHitExtra13=1

Report simili possono essere creati per e A9 / Alexa Site Info siteinfo.xml da Amazon.

Provenienza delle connessioni

AWStats fornisce un report "Provenienza delle connessioni" (referrer), che indica sia il dominio sia la pagina che hanno portato un visitatore in un sito. Per le campagne pay per click è particolarmente importante conoscere la provenienza – in termini di dominio – del traffico generato. Il seguente ExtraSection elenca ogni dominio tranne il nostro. Per utilizzarlo è sufficiente cambiare www\.miosito\.it con il proprio dominio, aggiungendo \ prima di ogni punto.

ExtraSectionName1="Siti di provenienza per dominio - Primi 25"
ExtraSectionCodeFilter1="200 304"
# Prende tutti i siti tranne "miosito". Cambi "miosito" nel nome del tuo domino.
ExtraSectionCondition1="REFERER,^(?!http:\/\/www\.miosito\.it)"
ExtraSectionFirstColumnTitle1="Sito"
ExtraSectionFirstColumnValues1="REFERER,^[hH][tT][tT][pP]:\/\/([^\/]+)\/"
ExtraSectionFirstColumnFormat1="%s"
ExtraSectionStatTypes1=PHL
ExtraSectionAddAverageRow1=1
ExtraSectionAddSumRow1=1
MaxNbOfExtra1=25
MinHitExtra1=1

2006-01-13: è stata aggiunta la capacità di filtrare gli accessi al proprio sito grazie ad un suggerimento di Jean-Luc Halleux.

2005-09-20: è stato aggiunto rel='nofollow' al collegamento di provenienza per minimizzare i problemi dello Spam di referrer. Questo passo non è necessario per versioni recenti di AWStats; nofollow è inserito nei meta tag delle pagine globali.

I principali Lettori RSS e i Ragni

Se il nostro sito offre Feed RSS, è possibile tracciare quale browser e quali ragni sono utilizzati per leggerli. Il codice riportato permette di ottenere i Lettori RSS e i Ragni (Reader e Spider) per ciascun file con il suffisso .xml, .rdf o .rss. Cambiando il parametro URL con un file specifico si può creare un "content group" per tracciare un singolo flusso.

ExtraSectionName2="Primi 30 Lettori e Ragni RSS"
ExtraSectionCodeFilter2="200 304"
ExtraSectionCondition2="URL,\.xml|\.rdf|\.rss"
ExtraSectionFirstColumnTitle2="Lettore o Ragno RSS"
ExtraSectionFirstColumnValues2="UA,(.*)"
ExtraSectionStatTypes2=HBL
ExtraSectionAddAverageRow2=1
ExtraSectionAddSumRow2=1
MaxNbOfExtra2=30
MinHitExtra2=1

Aggiunto il 2005-12-22.

Monitorare pagine specifiche

Spesso si ha l'esigenza di tenere sotto controllo una pagina particolare. In questo esempio mostriamo le statistiche per tutte le pagina che contengono javascript nell'URL. Apparirà una riga per ogni pagina.

ExtraSectionName24="Pages con javascript nel nome"
ExtraSectionCodeFilter24="200 304"
# Filter on specific URL, including possible jsessionid
ExtraSectionCondition24="URL,(^\/.*javascript.*\.html)"
ExtraSectionFirstColumnTitle24="URL"
ExtraSectionFirstColumnValues24="URL,(.*)"
ExtraSectionStatTypes24=PBL
ExtraSectionAddAverageRow24=0
ExtraSectionAddSumRow24=0
MaxNbOfExtra24=1
MinHitExtra24=1

Aggiunto il 2006-03-22.

Monitorare i file scaricati

L'esempio seguente permette di tracciare i tipi di file scaricati. È possibile modificarne l'elenco per adattarlo alle proprie necessità.

ExtraSectionName15="File scaricarti (diff,doc,pdf,rtf,sh,tgz,zip) - Primi 10"
ExtraSectionCodeFilter15="200 304"
ExtraSectionCondition15="URL,(.*((\.diff)|(\.doc)|(\.pdf)|(\.rtf)|(\.sh)|(\.tgz)|(\.zip)))"
ExtraSectionFirstColumnTitle15="File"
ExtraSectionFirstColumnValues15="URL,(.*)"
ExtraSectionFirstColumnFormat15="%s"
ExtraSectionStatTypes15=HBL
ExtraSectionAddAverageRow15=0
ExtraSectionAddSumRow15=1
MaxNbOfExtra15=10
MinHitExtra15=1

Aggiunto il 2006-03-22.

Limiti noti

Attualmente, ExtraSections presenta le seguenti limitazioni:

È possibile contribuire con patch per rimuovere questi limiti.

Risorse di Perl REGEXP

La sintassi delle espressioni regolari è, nella migliore delle ipotesi, ostica per coloro che non la usano abitualmente. Abbiamo trovato alcune rapide lezioni che possono essere di aiuto.

Avete sviluppato una ExtraSection che volete condividere?

Se avete creato delle ExtraSection che consentono un'analisi non specifica per un determinato sito, incollatela nel nostro modulo di contatto e noi, se la riterremo generalmente applicabile, la pubblicheremo.

Altri interessanti miglioramenti per AWStats

Chi contribuisce al progetto sviluppa plugin e patch per AWStats. Abbiamo riportato nel seguito i tentativi che abbiamo giudicato più interessanti.

Una panoramica dei 12 mesi

Se non specificato altrimenti, AWStats segnala il mese corrente sulla base delle statistiche generali per l'anno in corso fino al giorno attuale. Risulta più difficile individuare tendenze generali all'inizio di un nuovo anno solare poiché ci sono a disposizione solo i dati di pochi mesi. È quindi necessario aprire una seconda finestra di AWStats per esaminare i dati dell'anno precedente.

Un contributo di rkodey risolve questo problema sostituendo alla vista di default una vista degli ultimi dodici mesi. La patch originale è stata inviata come patch 1103597 di AWStats. Ci sono versioni diverse per AWStats 6.2, 6.4 e 6.5:

Versione AWStats Versione Patch awstats.pl aggiornato con patch
6.2 awstats.pl-1.783_last_12_months.patch
6.4 awstats.pl-1.814_last_12_months.patch
6.5 awstats.pl-1.857_last_12_months.patch awstats.pl.gz
6.6 (1.887) awstats.pl-1.857_last_12_months.patch

Ordinare le tabelle per colonne

nettoyeur25 ha segnalato un ottimo miglioramento per AWStats che aggiunge la funzionalità di tabelle ordinabile nei ExtraSection. Questo è compiuto mediante un plugin JavaScript.

  1. Scaricate il codice sorgente Javascript, mettendola nella vostra cartella web principale, sul server che gira AWStats (o modificate il percorso in awstats.pl, dopo avere applicato il patch sotto, per specificare una cartella migliore.)
  2. Scaricate e applicatevi nostro awstats.pl.sortable.diff patch per awstats.pl, dopo avere fatto un backup della vostra copia attuale.

Abbiamo modificato diversi passi dell'istruzioni originali di nettoyeur25:

Consultate la documentazione del plugin per maggior dettagli.

Nota Non abbiamo verificato la compatibilità con i report PDF prodotti da htmldoc. Se controllate questo, fateci sapere.

Filtrate Richieste HEAD

Per default, AWStats traccia numerosi tipi di richieste http. Oltre alle richieste GET e POST comuni, AWStats traccia anche le richieste HEAD – richieste per informazioni sulle testate HTTP senza prelevare l'intera pagina html o altro oggetto.

Queste richieste sono utilizzate da strumenti legittimi tale lo strumento di convalida di link W3. Sfortunatamente, le richieste HEAD sono spesso schierate da quelli con intenzioni meno virtuose, come spamer che vogliano aggiungere i loro link a blog.

Un lettore, Che Dong, ha suggerito di filtrare richieste HEAD. Per fortuna, questo è facile da implementare. Scaricate e applicatevi nostro awstats.pl.head.diff patch per awstats.pl, dopo avere fatto un backup della vostra copia attuale. Per AWStats 6.5..

Gli utenti di AWStats 6.6 dovrebbero commentare la riga 6322, || $field[$pos_method] eq 'HEAD'. Potete volere commentare anche altre richieste non POST e GET.

Tracciare visitatori per IP e useragent

Per difetto AWStats traccia visitatori in base dell'indirizzo IP dell'Host. Questo può portare a un riconoscimento sbagliato di un visitatore, ad esempio quando un ISP cambia l'IP di un utente durante una sessione di navigazione. Anche se la soluzione definitiva è da utilizzare un SESSION ID, un patch da Antoine EMERIT tenta di migliorare il riconoscimento aggiungendo l'useragent (browser e il sistema operativo, compreso numero di versione) all'IP.

Questo patch comprende anche codice per riconoscere visitatori per richieste d'immagini e altri oggetti. Dal momento che questo può essere utile per le visualizzazioni di pagine cache nei motori di ricerca (un utente richiederà immagini dal nostro server ma la pagina sarà servita dal motore di ricerca,) conterà anche come una visita su un file sul nostro server scaricato da un altro sito. Poiché il visitatore non ha esaminato in effetti contenuto sul nostro sito, può non essere una buona idea di contarli come un visitatore. Per questa ragione, non stiamo utilizzando in effetti questo patch.

Riconoscimento dei domini di primo livello

Il dominio di primo livello .cat è stato lanciato nel 2005 per fornire un dominio specifico per siti che in lingua catalana o che trattano della cultura catalana.

Francesc Roca Tugas ha preparato una bandiera per supportare il dominio .cat in AWStats.

  1. Bandiera catalana Fate click con il pulsante destro per salvare cat.png nella vostra cartella delle icone AWStats, cioè awstats/wwwroot/icon/flags o simile.
  2. Individuate il file AWStats domains.pm (di solito nella cartella lib sotto il programma awstats.pl). Fate una copia di riserva del file. Con un editor di testi, sostituite la riga
    'bz','Belize','ca','Canada','cc','Cocos (Keeling) Islands',
    
    con
    'bz','Belize','ca','Canada','cat','Catalan Linguistic and Cultural Community','cc','Cocos (Keeling) Islands',
    
    e salvate il file.

Vedi istruzioni per applicare la patch a un file se non si ha dimestichezza con questo tipo di operazioni.

Per rendere le cose più semplici, forniamo la versione AWStats che utilizziamo noi, da scaricare, scompattare ed utilizzare per sostituire l'awstats.pl attuale dopo averne fatto il backup. Gli utenti MS Windows possono richiedere 7 Zip o gzip per decomprimere il file.

Vedi AWStats patch ID 1103597 per le istruzioni complete. Aggiornato: 2006-11-27.

Visitatori unici e numero di visite disponibili nella tabella dei paesi

AWStats 6.5 visitatori e visite nella tabella del paese Grazie ad un contributo di Josep Ruano, ora è possibile consultare le visite e i visitatori unici suddivisi per singolo paese nella tabella dei paesi. Per permettere che il paese venga segnalato per esteso, occorre modificare il file di configurazione di awstats.miosito.conf, aggiungendo le lettere U e V (utenti e visite) a ShowDomainsStats:

# Show domains/country chart
# Context: Web, Streaming, Mail, Ftp
# Default: PHB, Possible column codes: PHB
ShowDomainsStats=UVPHB

Il cambiamento è retroattivo ed è operativo non appena inserita la modifica.

Più accurato riconoscimento degli oggetti

Antezeta ha migliorato AWStats per aumentare il numero di sistemi operativi, robot e motori di ricerca riconosciuti. Alcuni dei cambiamenti descritti sotto sono stati inclusi nella versione 6.5. Gli ultimi robot e i cambiamenti dei motore di ricerca devono essere applicati manualmente.

Riconoscimento dei robot

Abbiamo reso disponibile un file da scaricare per aggiornare la base dati robots.pm per il riconoscimento dei robot da AWStats.

Riconoscimento dei motori di ricerca

Abbiamo reso disponibile un file da scaricare per aggiornare la base dati per il riconoscimento dei motori di ricerca da AWStats.

Nota AWStats aggrega tutti i riferimenti di una ricerca da ogni versione locale dei motori di ricerca principali in un'unica voce per quel motore di ricerca, cioè i riferimenti da google.ca e google.co.uk compariranno come "Google". Le eccezioni attuali sono AOL.de, AOL.fr e tutte le varianti ASK.com. Stiamo pensando di apportare un significativo miglioramento che suddivida Google, Yahoo! e MSN/Windows Live per i singoli paesi.

Riconoscimento dei Browser

Abbiamo reso disponibile un browsers.pm.tgz file da scaricare per aggiornare la base dati per il riconoscimento dei browser. L'installazione è simile a quella di robots.pm.

Riconoscimento del sistema operativo

Visto che Linux sta cominciando a diffondersi anche come client, abbiamo creato delle patch per raggruppare i sistemi Linux – come già avviene per Windows e Macintosh – nel report principale di AWStats. Inoltre abbiamo suddiviso, nel report dei sistemi operativi, i sistemi Linux in base alle diverse distribuzioni. Per questo è sufficiente inserire le seguenti istruzioni nel file operating_systems.pm. I sistemi supplementari conosciuti sono:

Per ogni distribuzione abbiamo aggiunto inoltre il logo e, come documentazione, un link alla pagina principale del sistema operativo. Il collegamento compare nel report di dettaglio dei sistemi operativi di AWStats. Abbiamo inoltre aggiunto i link per ciascuno degli altri sistemi operativi attualmente noti. Tali link compariranno nel report principale di AWStats se il sistema operativo non fa parte delle famiglie Windows, Macintosh o Linux; altrimenti compariranno nel report dettagliato.

Nota Aggiornamento: questo miglioramento è stato incorporato nel rilascio definitivo di AWStats 6.5.

Riconoscimento delle versioni

Come applicare una patch a un file

Molti miglioramenti comportano modifiche al programma AWStats. Un patch file contiene semplicemente linee per aggiungere e/o cancellare righe da un file di testo esistente, come il programma principale awstats.pl. I curiosi, possono semplicemente aprire un file patch decompresso in un editore di testo.

  1. Dal prompt di comando, cambiare la propria cartella di lavoro con quella che contiene il file da aggiustare, cioè awstats.pl.
  2. Scaricare il file patch nella directory corrente.
  3. Decomprimere il file patch, cioè gunzip awstats.pl.search.patch.gz. Gli utenti MS Windows possono utilizzare 7 Zip o gzip per decomprimere il file.
  4. Fare una copia del file da aggiustare, cioè cp awstats.pl awstats.pl.bck.
  5. Applicare il patch, cioè patch -i . Gli utenti MS Windows possono scaricare una versione delle patch per il loro sistema.

In alcuni casi è possibile vedere un messaggio che avverte che non è stato possibile applicare la patch al primo hunk (sezione). Questo accade in genere se la patch contiene commenti introduttivi dopo il numero di versione interna AWStats. Nella maggior parte dei casi, è possibile ignorare l'errore. Se non si è sicuri, ripristinare la copia originale del file.

È possibile utilizzare anche una sintassi di prova, cioè patch --dry-run -i per verificare se la patch può essere applicata senza errori.

Nuove caratteristiche in AWStats 6.5

Ecco una panoramica delle nuove funzionalità della versione 6.5

Escludere i referrer spam (Provenienza delle connessioni)

Alcuni webmaster senza scrupoli tentano di aumentare la visibilità dei propri siti sui Motori di ricerca generando automaticamente dei link al proprio sito su altri siti. L'obiettivo primario sono i siti che ospitano blog che pubblicano l'ultimo Url di provenienza. L'obiettivo secondario sono invece i siti che pubblicano le proprie statistiche di accesso.

Consideriamo un esempio fittizio: un sito chiamato www.dreamingdamsels.xxx possiede un programma automatizzato che richiede l'home page di www.miosito.it. Se www.miosito.it pubblica la provenienza delle connessioni più recenti al suo sito, con questa azione, www.dreamingdamsels.xxx ha appena creato un link a www.dreamingdamsels.xxx da www.miosito.it. Allo stesso modo, un programma automatizzato fa un numero di richieste sufficienti verso www.dreamingdamsels.xxx in modo da diventare uno dei primi referrer, risultando primo nei report AWStats. Se un sito pubblica i propri accessi sui report di statistiche web, www.dreamingdamsels.xxx apparirà sul sito. Nell'uno o nell'altro caso, il fine del gioco è quello di procurare un link automatico, gratuito, dal proprio sito al loro, in un avvicinamento parassitico al Posizionamento nei motori di ricerca per essere primo su Google.

Grazie ad un contributo di Rod Begbie, la versione 6.5+ di AWStats può ora filtrare questo tipo di Spam.

Per permettere tale attività di filtraggio è sufficiente aggiungere una SkipReferrerBlackList al proprio file di configurazione di awstats.mydomain.conf:

# Use SkipReferrersBlackList if you want to exclude records coming from a SPAM
# referrer. Parameter must receive a local file name containing rules applied
# on referrer field. If parameter is empty, no filter is applied.
# An example of such a file is available in lib/blacklist.txt
# You can download updated version at Need new site.  Old list is no longer available.
# Change : Effective for new updates only
# Example: "/mylibpath/blacklist.txt"
# Default: ""
#
SkipReferrersBlackList="/usr/share/awstats/wwwroot/cgi-bin/lib/blacklist.txt"

Cambia il percorso di blacklist.txt con quello per il proprio sistema. I file correnti possono essere ottenuti da ... la lista vecchia non è più disponibile.

Nota

Note:

  1. Occorre rivedere i filtri per accertarsi che non vi siano falsi positivi. Più lunga è la stringa di esclusione, meglio è. Se è corta, si rischia di tralasciare traffico valido. Per esempio, i referrer che includono "analysis".
  2. "Il log file dei cambiamenti" nella versione beta 1.845 2005/09/19 di AWStats connota la nuova caratteristica come SkipReferrersBlackList. La sintassi corretta è senza la seconda s in questa versione. Le versioni successive usano SkipReferrersBlackList.
  3. Impatto sulle prestazioni: ogni riga nel file di log del web server verrà confrontata con ogni riga del file della black list. Una piccola porzione del log ha richiesto 5 volte più tempo di elaborazione rispetto alla black list fornita da AWStats.

Ci sono parecchie tattiche per il controllo degli Spam referral:

Gestione report orari, quotidiani (e annuali?)

AWStats ha seguito tradizionalmente un modello di segnalazione mensile – tranne il dettaglio mensile presente nelle sezioni che descrivono l'attività per un dato mese – il mese corrente fin ad oggi o un mese precedente. Anche se questa politica può andare bene per molti siti, molto spesso si ha bisogno di vedere che cosa stia accadendo ad un livello più dettagliato. Con la versione 6.5, sarà possibile creare report con cadenza oraria, quotidiana, mensile e/o annuale.

Migliorando una funzionalità non confermata precedentemente, documentata nelle FAQ di AWStats (identificazione FAQ-COM600), la versione 6.5 introduce una nuova opzione di configurazione, il DatabaseBreak.

Il DatabaseBreak automatizza il processo di generazione dei file intermedi di statistiche AWStats necessarie per la generazione di report orari, quotidiani, mensili ed annuali. Pur essendo tale funzionalità ancora "grezza", se ne possono intuire le potenzialità.

1. Generazione dei file di database per le statistiche orarie, giornaliere, mensili e annuali.

Attualmente, il supporto per elaborare i file intermedi funziona correttamente.

Per siti che utilizzano l'interfaccia a riga di comando, c'è un cambiamento da apportare: la nuova opzione DatabaseBreak dovrebbe essere specificata per ogni dettaglio di segnalazione voluta. Il DatabaseBreak può assumere valori di anno, mese, giorno ed ora.

awstats.pl -config=antezeta_com -configdir=/etc/awstats -update -debug=0 -LogFile=access_log -DatabaseBreak=month
awstats.pl -config=antezeta_com -configdir=/etc/awstats -update -debug=0 -LogFile=access_log -databasebreak=day
awstats.pl -config=antezeta_com -configdir=/etc/awstats -update -debug=0 -LogFile=access_log -DatabaseBreak=year
awstats.pl -config=antezeta_com -configdir=/etc/awstats -update -debug=0 -LogFile=access_log -DatabaseBreak=hour

Ciò creerà i file dati per le statistiche per il file di configurazione awstats.antezeta_com.conf.

Tabella 1: I files intermedi di AWStats creati utilizzando il DatabaseBreak
File Descrizione
awstats2005.antezeta_com.txt File annuale 2005
awstats082005.antezeta_com.txt Agosto 2005 mensile
awstats08200515.antezeta_com.txt 15 agosto 2005 quotidiano
awstats.antezeta_com.txt 15 agosto 2005 orario dalla mezzanotte alla una
awstats.antezeta_com.txt 15 agosto 2005 all'ora dalla una alle due
… file orari supplementari…
awstats.antezeta_com.txt 15 agosto 2005 all'ora dalle 22 alle 23
awstats.antezeta_com.txt 15 agosto 2005 all'ora dalle 23 alla mezzanotte

Nota DatabaseBreak non è sensibile alle maiuscole e minuscole; il mese è il valore preimpostato.

Avvertimento Non mettere DatabaseBreak nel proprio file di awstats.ilmiosito.conf. Specificare DatabaseBreak sulla riga di comando attualmente non sembra escludere il valore del file di configurazione; non sarà generato alcun file di statistiche se i valori della riga di comando non concordano con i valori del file di configurazione.

Consiglio Abbiamo disposto tutti i file di statistiche nella stessa cartella. Visto che questo non sembra confondere AWStats, è possibile assegnare DirData=" __VarDirData__" nel proprio file di configurazione AWStats, attribuendo un valore appropriato a VarDirData ogni volta che si ha intenzione di elaborare le statistiche con valori differenti di DatabaseBreak, ad esempio esportare VarDirData=/awstatsdata/month per tenere unito ogni gruppo di statistiche in cartelle separate.

Non abbiamo ancora verificato la generazione di statistiche utilizzando la cgi di aggiornamento su richiesta. Dovrebbe funzionare con la sintassi databasebreak=hour&hour=18&day=22&month=08&year=2005 descritta nel seguito.

2. Generare i report

Report su richiesta della cgi

La tendina a discesa del report cgi su richiesta non è stata ancora aggiornata per avvalersi dei nuovi file di statistiche, ma c'è una soluzione alternativa mediante l'utilizzo di Url. Per elaborare:

Consiglio Per avviare i report AWStats nelle modalità di funzionamento di databasebreak senza dovere inserire un Url lungo, è possibile usare un file Html con JavaScript per definire l'Url di partenza. Abbiamo creato un esempio di un file Html per avviare AWStats che è possibile salvare e modificare in linea con le proprie necessità.

  1. Salvarlo su disco, con il tasto destro. Aprire il file con un editor di testi.
  2. Sostituire tutti i casi di antezeta_com col nome del proprio file di configurazione di AWStats.
  3. Sostituire il percorso di programma di AWStats da /awstats/awstats.pl al proprio percorso, cioè /cgi-bin/awstats.pl, se differente.

Problemi noti: lo script tenterà di avviare AWStats usando ieri come data di partenza, a meno che oggi non sia il primo del mese. Una logica più elegante posizionerebbe il mese a quello precedente ed il giorno all'ultimo giorno di quel mese (28, 29, 30, 31). Nel caso di gennaio, l'anno risulterebbe ridotto di un giorno. Se qualcuno desidera aggiungere questi miglioramenti può scrivici e li renderemo disponibili.

NotaPer eseguire report orari o giornalieri su dati storici, occorre generare file di statistica orari e giornalieri per i dati storici. Non occorre rigenerare i file di statistica mensili attualmente in uso.

Generazione di report statici

Una volta che i file di statistiche sono stati elaborati, occorre introdurre due cambiamenti per generare i report statici:

  1. Mettere DatabaseBreak=intervallo, cioè hour, day, month o year, sulla riga comandi di awstats_buildstaticpages.pl (o su awstats.pl secondo le circostanze).

    AvvertimentoL'opzione year (anno) non sembra ancora implementata.

  2. Se si utilizza awstats_buildstaticpages.pl, mettere -builddate e/o opzioni -dir così i report orari, quotidiani, mensili e annuale avranno nomi unici

Se si sta generando il PDF sul Linux Fedora Core, suggeriamo di consultare anche il nostro articolo: Istruzioni per creare un RPM HTMLDOC (in inglese).

La cartella dei dati GeoIP diventa configurabile (e deve essere configurata)

Nota Se si sta usando il GeoIP plugin da Maxmind, occorre specificare il percorso completo per GeoIP.dat:

LoadPlugin="geoip GEOIP_STANDARD /usr/local/share/GeoIP/GeoIP.dat"

Mentre si aggiorna il percorso per GeoIP, scaricare la base dati MaxMind GeoLiteCity ed aggiungerla alla propria configurazione:

LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /usr/local/share/GeoIP/GeoLiteCity.dat"

Mentre si fa l'aggiornamento del percorso per il file GeoIP, consultare le Istruzioni per l'installazione di GeoIP per AWstats sotto Windows e Linux per informazioni sul GeoLite City database da poco reso disponibile da MaxMind.

Plugin GeoIP Città, Organizzazione e Paese

I plugin GeoIP Città, Organizzazione e Paese forniscono informazioni sui visitatori ("hosts") che accedono al proprio sito. Potete consultare le istruzioni per l'installazione di GeoIP per AWstats sotto Windows e Linux.

Risorse supplementari per AWStats

Articoli su AWStats

Limiti di AWStats

AWStats è un strumento ideale per i siti web di piccole e medie dimensioni. Imprese di grandi dimensioni possono approfittare del miglior riconoscimento dei visitatori e dell'analisi click-stream (flusso-clic, cioè il percorso di navigazione utente) disponibile solitamente sugli strumenti commerciali.

Analisi Click-stream

Alcuni strumenti open source per l'analisi click-stream sono oramai disponibili, ma non sono integrati con AWStats. Abbiamo preparato le istruzioni per l'installazione e la configurazione di StatViz e Pathalizer (in inglese).

Con le ExtraSections, si può vedere dove i visitatori sono andati dopo che hanno visto una certa pagina, o come siano arrivati a una certa pagina. Ultimo aggiornamento: 2006-04-25.

# Assumes default page is "/" and is always referenced as /, not index.html etc.
# Assumes default page extension is html.  This will thus exclude directory pages which appear as \
# Change html to your page suffix if different, i.e. htm.

ExtraSectionName25="Navigazione dalla pagina Home - Primi 25"
ExtraSectionCodeFilter25="200 304"
ExtraSectionCondition25="REFERER,http:\/\/www\.miosito\.it\/"
ExtraSectionFirstColumnTitle25="URL"
ExtraSectionFirstColumnValues25="URL,(.*html$)"
ExtraSectionFirstColumnFormat25="%s"
ExtraSectionStatTypes25=PHBL
ExtraSectionAddAverageRow25=0
ExtraSectionAddSumRow25=1
MaxNbOfExtra25=25
MinHitExtra25=1

# Assumes default page is always linked to as "/".  Some sites need to add index.html or default.asp as the case may be.

ExtraSectionName26="Navigazione verso la pagina Home al interno del sito - Primi 25"
ExtraSectionCodeFilter26="200 304"
ExtraSectionCondition26="URL,(^\/$)"
ExtraSectionFirstColumnTitle26="REFERER"
ExtraSectionFirstColumnValues26="REFERER,^http:\/\/www\.miosito\.it\/(.*)"
ExtraSectionFirstColumnFormat26="%s"
ExtraSectionStatTypes26=PHBL
ExtraSectionAddAverageRow26=0
ExtraSectionAddSumRow26=1
MaxNbOfExtra26=25
MinHitExtra26=1

Questo documento è stato utile?

Se questo documento è stato utile, aiutateci con il passa-parola. Mettete un link sul vostro sito semplicemente copiando questa riga:

Risorse per AWStats da Antezeta: howto installazione ed uso

Mettete un segnalibro a questa risorsa! (è sufficiente andare sul logo per vedere il nome del servizio):

Il link non funziona? Fatecelo sapere!

Migliorate la qualità di questo documento, inviandoci un riscontro.

Rendere disponibile una traduzione

Se trovate questo documento utile e desiderate fornire una traduzione nella vostra lingua madre, scriveteci.

Antezeta servizi di statistiche per siti – scelta della soluzione, implementazione e formazione

Permettete ad Antezeta di supportarvi nella selezione, nell'implementazione e nell'utilizzo di una soluzione di Web Analytics! Scoprite la nostra gamma di servizi di consulenza per statistiche siti oppure contattateci oggi stesso per approfondire la vostra conoscenza di Web Analytics.

Indice completo

  1. Informazioni ed estensioni per AWStats
  2. Report personalizzati: esempi delle sezioni ExtraSection
    1. Posizionamento nei motori di ricerca
      1. Esempio di attività derivate dai motori di ricerca
      2. Esempio per controllare i robot dei motori di ricerca
      3. Esempio di sitemap.xml usato dai motori di ricerca
    2. Provenienza delle connessioni
    3. I principali Lettori RSS e i Ragni
    4. Monitorare pagine specifiche
    5. Monitorare i file scaricati
    6. Limiti noti
    7. Risorse di Perl REGEXP
    8. Avete sviluppato una ExtraSection che volete condividere?
  3. Altri interessanti miglioramenti per AWStats
    1. Una panoramica dei 12 mesi
    2. Ordinare le tabelle per colonne
    3. Filtrate Richieste HEAD
    4. Tracciare visitatori per IP e useragent
      1. Riconoscimento dei domini di primo livello
    5. Visitatori unici e numero di visite disponibili nella tabella dei paesi
    6. Più accurato riconoscimento degli oggetti
      1. Riconoscimento dei robot
      2. Riconoscimento dei motori di ricerca
      3. Riconoscimento dei Browser
    7. Riconoscimento del sistema operativo
      1. Riconoscimento delle versioni
    8. Come applicare una patch a un file
  4. Nuove caratteristiche in AWStats 6.5
    1. Escludere i referrer spam (Provenienza delle connessioni)
    2. Gestione report orari, quotidiani (e annuali?)
      1. 1. Generazione dei file di database per le statistiche orarie, giornaliere, mensili e annuali.
      2. 2. Generare i report
        1. Report su richiesta della cgi
        2. Generazione di report statici
    3. La cartella dei dati GeoIP diventa configurabile (e deve essere configurata)
  5. Plugin GeoIP Città, Organizzazione e Paese
  6. Risorse supplementari per AWStats
    1. Articoli su AWStats
    2. Limiti di AWStats
      1. Analisi Click-stream
    3. Questo documento è stato utile?
      1. Rendere disponibile una traduzione
    4. Antezeta servizi di statistiche per siti – scelta della soluzione, implementazione e formazione

Home · Contattaci · Mappa e Ricerca nel sito · Su ‹j›