|
Allgemeines
Logdateien und Statistikarten
Statistiken richtig auswerten
Bei besseren Providern gehört es zum Service, daß Sie Zugriff auf Logdateien haben, die Ihren Speicherbereich betreffen. Die meisten Provider bieten auch CGI-Dienste an, mit deren Hilfe Sie die Besucherzahlen nach verschiedenen Kriterien als Statistik aufbereitet bekommen.
Wenn Sie Ihre Homepage bei Discount-Providern wie Compuserve, T-Online usw. haben, stehen Ihnen solche Dienste bislang nicht zur Verfügung. Um in solchen Fällen an genaue Zugriffsstatistiken zu kommen, können Sie einen öffentlichen CGI-Dienst in Anspruch nehmen. Dort bekommen Sie für eine geringe Jahresgebühr einen Zugriffszähler sowie ordentlich aufbereitete Statsitiken für Ihre Homepage, egal wie deren Adresse lautet. Ein Nachteil bei dieser Lösung ist allerdings, daß bei jedem Zugriff auf Ihre Homepage zusätzlich auf den fremden CGI-Dienst zugegriffen werden muß. In diesem Dokument finden Sie öffentliche CGI-Dienste aufgelistet.
Anstelle der beiden Bindestriche im obigen Beispiel können von Fall zu Fall noch Daten stehen. Anstelle des ersten Bindestriches kann der Anwender-Logname stehen (entsprechend der Spezifikation rfc931). Anstelle des zweiten Bindestriches kann ein Anwendername stehen, den der Anwender sich selbst gegeben hat.
Als nächstes zeigt der Eintrag, wann genau der Zugriff erfolgte. Im Beispiel war das am 2. März 1997 um 5.03 Uhr (und 49 Sekunden) morgens, und zwar minus 5 Stunden gerechnet gegenüber GMT (Greenwich Meridian Time) aus Sicht der Systemzeit des Server-Rechners.
Dahinter folgt ein Kurzprotokoll des HTTP-Headerbefehls, mit dem der WWW-Browser des Anwenders die Datei angefordert hat. GET ist dabei die übliche Methode. Dahinter wird die Datei angegeben, auf die der Zugriff erfolgte. Im Beispiel ist das die Datei http://www.netzwelt.com/selfhtml/tg.htm. Da es sich um einen Eintrag aus der Loagdatei von www.netzwelt.com handelt, wird nur der Pfadname relativ zu der Domain-Adresse angezeigt. Schließlich zeigt die HTTP-Anforderung noch die verwendete HTTP-Protokollversion an. Das ist zur Zeit die Version 1.0.
Dahinter folgt eine Codenummer, die darüber Aufschluß gibt, ob die Anforderung erfolgreich war, und wenn nicht, welches der Fehler war. Dabei sind folgende Nummern wichtig:
Die letzte Zahl in der Zeile schließlich gibt an, wieviele Bytes von der Datei an den aufrufenden WWW-Browser übertragen wurden. Wenn Sie die Bytezahl mit der tatsächlichen Dateigröße vergleichen, können Sie feststellen, ob die Datei vollständig übertragen wurde, oder ob die Übertragung vorzeitig abgebrochen wurde. So kommt es zum Beispiel oft vor, daß Grafiken nicht vollständig übertragen werden, weil der Anwender bereits vorher auf einen Verweis zu einer anderen Seite klickt.
Statistiken stellen Ihnen die Zugriffe nach einem bestimmten Kriterium sortiert dar. Folgende Kriterien sind typisch:
Allgemeines
Wenn Sie ein Projekt im WWW plaziert haben, werden Sie sicher auch interessiert sein zu erfahren, wie häufig darauf zugegriffen wird. Um richtig einschätzen zu können, wie gut Ihr Projekt ankommt und was Sie daran verbessern sollten, reichen allerdings reine Zugriffszahlen nicht aus. Um aussagekräftige Ergebnisse über die Abrufe Ihrer WWW-Seiten zu erhalten, sind Statistiken nötig, die Ihnen die Zugriffe nach bestimmten Kriterien aufschlüssen. So gibt es Statistiken, die auflisten, welche Dateien am häufigsten abgerufen wurden, zu welchen Tageszeiten die meisten Besucher zu verzeichnen sind, oder welche WWW-Browser am häufigsten verwendet werden.
Logdateien und Statistikarten
Grundlage aller Zugriffsstatistiken sind Logdateien. Jeder Server-Rechner im Internet führt solche Logdateien, in denen er alle Zugriffe protokolliert. Dazu gibt es ein allgemeines Modell, wie Einträge in einer Logdatei auszusehen haben. Ein Eintrag nach diesem Modell hat folgendes Aussehen:
Beispiel:
ad25-175.compuserve.com - - [02/Mar/1997:05:03:49 -0500] "GET /selfhtml/tg.htm HTTP/1.0" 200 1788
Erläuterung:
Jede Zeile in der Logdatei dokumentiert einen Zugriff auf eine Datei. Am Beginn steht, wer zugegriffen hat. Bei den meisten Zugangsprovidern erhalten die Anwender beim Einwählen ins Internet eine dynamische Session-Nummer, unter der sie dann in den Logdateien der Server auftauchen, die sie besucht haben. Im obigen Beispieleintrag ist erkennbar, daß sich der Anwender über CompuServe ins Internet eingewählt hat. Die Angabe ad25-175 ist eine dynamische Session-Nummer.
200 = Die Anforderung war erfolgreich
4xx, 5xx = Es traten Fehler auf. Zum Beispiel war die angeforderte Datei war nicht vorhanden.
Beachten Sie:
Neben den reinen Zugriffs-Logdateien führen die meisten Server-Rechner auch Herkunfts-Logdateien. Darin wird festgehalten, von welcher anderen Datei aus ein Zugriff auf eine Datei erfolgte. Solche Herkunfts-Logdateien können interessante Aufschlüsse darüber geben, wo offensichtlich Verweise auf Ihr Projekt existieren und wie viele Besucher von dort kamen. Bei den meisten Providern erhalten Sie auch auf solche Logdateien Zugriff. Wenn nicht, fragen Sie ruhig danach.
Statistikarten:
Logdateien sind normalerweise sehr groß und etwa so spannend wie ein Telefonbuch. Um eine aussagekräftige Übersicht über die Zugriffe auf Ihre Seiten zu erhalten, sollte Ihr Provider Statistiken anbieten. Die Statistiken stehen Ihnen meistens als dynamisch generierte HTML-Dateien zur Verfügung, die ein CGI-Programm durch Auslesen der Logdatei erzeugt.
Solche Statistiken sind meistens als gut lesbare Listen aufbereitet. Manche Provider bieten auch grafische Aufbereitungen von Statistiken an.
Beispiel einer Statistik:
3770 10544 : selfhtml/
201 2311 : index.htm
174 0 : godown.gif
174 0 : book.gif
173 86 : goonline.gif
172 0 : gomail.gif
171 0 : goto.gif
169 0 : goup.gif
167 0 : download.gif
165 0 : deu.gif
66 0 : goback.gif
60 0 : goprev.gif
57 0 : gonext.gif
35 0 : netscape.gif
34 0 : eng.gif
29 0 : msie.gif
28 0 : ok.gif
27 0 : netscap2.gif
22 0 : html3.gif
20 0 : os2.gif
17 664 : brevier.htm
17 195 : selfhtml.htm
17 0 : msie3.gif
16 16 : netscap3.gif
15 120 : hinweise.htm
13 254 : software.htm
12 415 : shtmlidx.htm
12 258 : frames.htm
11 11 : mosaic.gif
10 161 : html.htm
10 120 : farbform.htm
10 95 : formausw.htm
Erläuterung:
Das Beispiel zeigt Auflistung nach Dateien. Es handelt sich um einen Ausschnitt aus einem Tagesergebnis der letzten Version dieses Dokuments. Die erste der beiden Zahlen in jeder Zeile stellt die Anzahl der Zugriffe auf die Datei dar, die jeweils zweite Zahl die Anzahl Kilobytes, die dabei insgesamt übertragen wurden. In der ersten Zeile stehen die Summen für alle Dateien des Verzeichnisses. Das obige Beispiel zeigt auch eine Schwäche des zugehörigen Aufbereitungs-Scripts: dieses zählt nämlich keine einzelnen Bytes und weist für Dateien, die kleiner als 1 Kilobyte sind, immer das Übertragungsvolumen 0 aus, obwohl die Datei mehrfach aufgerufen wurde.
Statsitiken richtig auswerten
Die folgende Checkliste soll Ihnen helfen, Statistiken zu interpretieren und Schlüsse daraus zu ziehen:
Wenn Ihr Projekt erst seit wenigen Tagen im Netz steht, ist das normal. Wenn es allerdings schon seit Monaten online ist, haben Sie zu wenig unternommen, um das Projekt bekannt zu machen. Die Zugriffszahlen hängen natürlich auch von den angebotenen Themen ab. Ein Projekt über die neuesten Computerspiele hat nun einmal mehr Zugriffe als ein Projekt über seltene Orchideensorten.
Es ist ganz normal, daß die Einstiegsseite mit Abstand die meisten Zugriffe zu verzeichnen hat. Wenn aber die Unterseiten so gut wie gar nicht besucht werden, deutet das darauf hin, daß vielen Besuchern Ihre Einstiegsseite nicht gefällt, daß bei der Einstiegsseite zu viele Daten (z.B. Grafiken) übertragen werden, oder daß die Einstiegsseite so unübersichtlich ist, daß die Besucher die Verweise zu den Unterseiten nicht finden. In diesem Fall sollten Sie Ihre Einstiegsseite neu, einfacher und übersichtlicher gestalten und überprüfen, ob das Verhältnis anschließend günstiger wird.
Das gilt besonders für Einstiegsseiten. Wenn eine solche Seite ihren Blickfang beispielsweise aus einer 50 Kilobyte großen Grafik bezieht und von dieser Grafik im Schnitt nur die Hälfte übertragen wird, bedeutet das, daß kaum ein Besucher darauf wartet, bis die Seite ihre ganze Pracht entfaltet hat. In diesem Fall sollten Sie die Seite dringend neu gestalten.
Das können Sie am besten direkt an den Logdateien erkennen. Wenn Sie 50 Seiten haben und die Besucher im Schnitt unter einer Minute verweilen, ist das Projekt einfach nicht attraktiv genug. Ausgenommen davon sind Projekte mit dem Charakter von Nachschlagewerken, in denen niemand stöbert, sondern nur eine gezielte Auskunft sucht. Sie können nicht erwarten, daß die Besucher stundenlang bleiben und alles von vorne bis hinten studieren. Aber mehrere Minuten im Schnitt deuten darauf hin, daß die Besucher sich auch mal "verführen" lassen.
Entweder bietet Ihr Provider eine entsprechende Statistik dazu an, oder Sie müssen die Herkunfts-Logdateien ("referrer-files") auswerten. Achten Sie dabei darauf, von welchen fremden Adressen aus auf Ihr Projekt zugegriffen wird. So können Sie beispielsweise erkennen, ob Sie häufig über Themensuchen in Suchdiensten gefunden werden, oder ob eine anklickbare Anzeige, die Sie bei einem Kataloganbieter gegen Gebühr geschaltet haben, sich rentiert.
Blättern:
WWW-Projekte bekannt machen
Adressenwechsel von WWW-Projekten
HTML-Dateien selbst erstellen
Dokumentation: HTML
Projektverwaltung