HTML-Dateien selbst erstellen
Projektverwaltung

Zugriffe kontrollieren


 Allgemeines
 Logdateien und Statistikarten
 Statistiken richtig auswerten


Allgemeines

Wenn Sie ein Projekt im WWW plaziert haben, werden Sie sicher auch interessiert sein zu erfahren, wie häufig darauf zugegriffen wird. Um richtig einschätzen zu können, wie gut Ihr Projekt ankommt und was Sie daran verbessern sollten, reichen allerdings reine Zugriffszahlen nicht aus. Um aussagekräftige Ergebnisse über die Abrufe Ihrer WWW-Seiten zu erhalten, sind Statistiken nötig, die Ihnen die Zugriffe nach bestimmten Kriterien aufschlüssen. So gibt es Statistiken, die auflisten, welche Dateien am häufigsten abgerufen wurden, zu welchen Tageszeiten die meisten Besucher zu verzeichnen sind, oder welche WWW-Browser am häufigsten verwendet werden.

Bei besseren Providern gehört es zum Service, daß Sie Zugriff auf Logdateien haben, die Ihren Speicherbereich betreffen. Die meisten Provider bieten auch CGI-Dienste an, mit deren Hilfe Sie die Besucherzahlen nach verschiedenen Kriterien als Statistik aufbereitet bekommen.

Wenn Sie Ihre Homepage bei Discount-Providern wie Compuserve, T-Online usw. haben, stehen Ihnen solche Dienste bislang nicht zur Verfügung. Um in solchen Fällen an genaue Zugriffsstatistiken zu kommen, können Sie einen öffentlichen CGI-Dienst in Anspruch nehmen. Dort bekommen Sie für eine geringe Jahresgebühr einen Zugriffszähler sowie ordentlich aufbereitete Statsitiken für Ihre Homepage, egal wie deren Adresse lautet. Ein Nachteil bei dieser Lösung ist allerdings, daß bei jedem Zugriff auf Ihre Homepage zusätzlich auf den fremden CGI-Dienst zugegriffen werden muß. In diesem Dokument finden Sie  öffentliche CGI-Dienste aufgelistet.

Logdateien und Statistikarten

Grundlage aller Zugriffsstatistiken sind Logdateien. Jeder Server-Rechner im Internet führt solche Logdateien, in denen er alle Zugriffe protokolliert. Dazu gibt es ein allgemeines Modell, wie Einträge in einer Logdatei auszusehen haben. Ein Eintrag nach diesem Modell hat folgendes Aussehen:

Beispiel:

ad25-175.compuserve.com - - [02/Mar/1997:05:03:49 -0500] "GET /selfhtml/tg.htm HTTP/1.0" 200 1788

Erläuterung:

Jede Zeile in der Logdatei dokumentiert einen Zugriff auf eine Datei. Am Beginn steht, wer zugegriffen hat. Bei den meisten Zugangsprovidern erhalten die Anwender beim Einwählen ins Internet eine dynamische Session-Nummer, unter der sie dann in den Logdateien der Server auftauchen, die sie besucht haben. Im obigen Beispieleintrag ist erkennbar, daß sich der Anwender über CompuServe ins Internet eingewählt hat. Die Angabe ad25-175 ist eine dynamische Session-Nummer.

Anstelle der beiden Bindestriche im obigen Beispiel können von Fall zu Fall noch Daten stehen. Anstelle des ersten Bindestriches kann der Anwender-Logname stehen (entsprechend der Spezifikation rfc931). Anstelle des zweiten Bindestriches kann ein Anwendername stehen, den der Anwender sich selbst gegeben hat.

Als nächstes zeigt der Eintrag, wann genau der Zugriff erfolgte. Im Beispiel war das am 2. März 1997 um 5.03 Uhr (und 49 Sekunden) morgens, und zwar minus 5 Stunden gerechnet gegenüber GMT (Greenwich Meridian Time) aus Sicht der Systemzeit des Server-Rechners.

Dahinter folgt ein Kurzprotokoll des HTTP-Headerbefehls, mit dem der WWW-Browser des Anwenders die Datei angefordert hat. GET ist dabei die übliche Methode. Dahinter wird die Datei angegeben, auf die der Zugriff erfolgte. Im Beispiel ist das die Datei http://www.netzwelt.com/selfhtml/tg.htm. Da es sich um einen Eintrag aus der Loagdatei von www.netzwelt.com handelt, wird nur der Pfadname relativ zu der Domain-Adresse angezeigt. Schließlich zeigt die HTTP-Anforderung noch die verwendete HTTP-Protokollversion an. Das ist zur Zeit die Version 1.0.

Dahinter folgt eine Codenummer, die darüber Aufschluß gibt, ob die Anforderung erfolgreich war, und wenn nicht, welches der Fehler war. Dabei sind folgende Nummern wichtig:
200 = Die Anforderung war erfolgreich
4xx, 5xx = Es traten Fehler auf. Zum Beispiel war die angeforderte Datei war nicht vorhanden.

Die letzte Zahl in der Zeile schließlich gibt an, wieviele Bytes von der Datei an den aufrufenden WWW-Browser übertragen wurden. Wenn Sie die Bytezahl mit der tatsächlichen Dateigröße vergleichen, können Sie feststellen, ob die Datei vollständig übertragen wurde, oder ob die Übertragung vorzeitig abgebrochen wurde. So kommt es zum Beispiel oft vor, daß Grafiken nicht vollständig übertragen werden, weil der Anwender bereits vorher auf einen Verweis zu einer anderen Seite klickt.

Beachten Sie:

Neben den reinen Zugriffs-Logdateien führen die meisten Server-Rechner auch Herkunfts-Logdateien. Darin wird festgehalten, von welcher anderen Datei aus ein Zugriff auf eine Datei erfolgte. Solche Herkunfts-Logdateien können interessante Aufschlüsse darüber geben, wo offensichtlich Verweise auf Ihr Projekt existieren und wie viele Besucher von dort kamen. Bei den meisten Providern erhalten Sie auch auf solche Logdateien Zugriff. Wenn nicht, fragen Sie ruhig danach.

Statistikarten:

Logdateien sind normalerweise sehr groß und etwa so spannend wie ein Telefonbuch. Um eine aussagekräftige Übersicht über die Zugriffe auf Ihre Seiten zu erhalten, sollte Ihr Provider Statistiken anbieten. Die Statistiken stehen Ihnen meistens als dynamisch generierte HTML-Dateien zur Verfügung, die ein CGI-Programm durch Auslesen der Logdatei erzeugt.

Statistiken stellen Ihnen die Zugriffe nach einem bestimmten Kriterium sortiert dar. Folgende Kriterien sind typisch:

Solche Statistiken sind meistens als gut lesbare Listen aufbereitet. Manche Provider bieten auch grafische Aufbereitungen von Statistiken an.

Beispiel einer Statistik:

     3770   10544 :   selfhtml/
      201    2311 :     index.htm
      174       0 :     godown.gif
      174       0 :     book.gif
      173      86 :     goonline.gif
      172       0 :     gomail.gif
      171       0 :     goto.gif
      169       0 :     goup.gif
      167       0 :     download.gif
      165       0 :     deu.gif
       66       0 :     goback.gif
       60       0 :     goprev.gif
       57       0 :     gonext.gif
       35       0 :     netscape.gif
       34       0 :     eng.gif
       29       0 :     msie.gif
       28       0 :     ok.gif
       27       0 :     netscap2.gif
       22       0 :     html3.gif
       20       0 :     os2.gif
       17     664 :     brevier.htm
       17     195 :     selfhtml.htm
       17       0 :     msie3.gif
       16      16 :     netscap3.gif
       15     120 :     hinweise.htm
       13     254 :     software.htm
       12     415 :     shtmlidx.htm
       12     258 :     frames.htm
       11      11 :     mosaic.gif
       10     161 :     html.htm
       10     120 :     farbform.htm
       10      95 :     formausw.htm

Erläuterung:

Das Beispiel zeigt Auflistung nach Dateien. Es handelt sich um einen Ausschnitt aus einem Tagesergebnis der letzten Version dieses Dokuments. Die erste der beiden Zahlen in jeder Zeile stellt die Anzahl der Zugriffe auf die Datei dar, die jeweils zweite Zahl die Anzahl Kilobytes, die dabei insgesamt übertragen wurden. In der ersten Zeile stehen die Summen für alle Dateien des Verzeichnisses. Das obige Beispiel zeigt auch eine Schwäche des zugehörigen Aufbereitungs-Scripts: dieses zählt nämlich keine einzelnen Bytes und weist für Dateien, die kleiner als 1 Kilobyte sind, immer das Übertragungsvolumen 0 aus, obwohl die Datei mehrfach aufgerufen wurde.

Statsitiken richtig auswerten

Die folgende Checkliste soll Ihnen helfen, Statistiken zu interpretieren und Schlüsse daraus zu ziehen:


Blättern:
WWW-Projekte bekannt machen     Adressenwechsel von WWW-Projekten

HTML-Dateien selbst erstellen
Dokumentation: HTML
Projektverwaltung

© 1997  Stefan Münz, s.muenz@euromail.com