Stets wissen, was läuft - Web Logging schafft Abhilfe

Internet-Lösungen werden oft mit viel Tamtam und Aufwand konzipiert, entwickelt und eingeführt.

Doch ob sie ihren Zweck erfüllen, die Zielgruppe erreichen und die gewünschten Informationen transportieren, bleibt oft im Verborgenen - Erfolgskontrolle findet nicht statt. Eine Analyse der Zugriffe auf den Server schafft Abhilfe.
Um Informationen über den Erfolg einer Website zu erhalten, sind drei Schritte notwendig: Daten messen, verdichten, interpretieren. Der erste Schritt liefert überhaupt erst eine Datenbasis, die "Rohmasse". Erst durch Verdichtung auf wesentliche Faktoren entstehen aussagekräftige Zahlen, deren Bedeutung es zu bestimmen gilt.
Messen und Zählen als Standard-Procedere
Das Messen übernimmt der Server selbst: die meisten Produkte bieten die Funktion des Loggings im Standardformat an, vom Apache über den IIS bis zu vergleichsweise proprietären Servern wie der Lotus Domino Server werden diese Logs erzeugt.
Meist wird für das Protokoll nicht eine einzige Datei verwendet, sondern gleich ein ganzes Set, von denen jede Datei eine spezifische Funktion übernimmt. Jeder Zugriff auf eine Datei des Servers generiert einen neuen Eintrag in die Logdateien - bei leistungsfähigen Servern mit vielen Zugriffen entstehen hier also gewaltige Datenmengen. Bedingt durch die verbindungslose Charakteristik des HTTP-Protokolls gilt als "Zugriff" dabei nicht ein einzelner Aufruf, sondern jede Anforderung zur Übertragung einer Datei - also auch für sämtliche Grafiken innerhalb einer HTML-Seite. Geben Sie beispielsweise in Ihrem Browser die URL "www.syntags.de" ein, ist allein das Access-Logfile des Servers um 22 Einträge reicher: für jede HTML-Datei und jede Grafik einen. Insbesondere grafiklastige Seiten kommen dabei leicht auf über 50 Dateien innerhalb einer HTML-Seite.
Beispielhafte Einträge:
Access-Log: 192.168.231.110 merkur athol [28/Feb/2000:11:57:50 -0100] "GET /graphics/logo.gif HTTP/1.1" 304 0

IP-Adresse des Nutzers, Server, Name des Anwenders (sofern authentifiziert), Datum, Uhrzeit, HTTP-Befehl mit der angeforderten Datei, Protokollversion, Status, Übertragungszeit in Millisekunden
Referer-Log:
[28/Feb/2000:11:57:50 -0100] "http://merkur/syntags.htm"
Datum, Uhrzeit, URL der referenzierenden HTML-Seite
Agent-Log:
[28/Feb/2000:11:57:50 -0100] "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)"
Datum, Uhrzeit, Alias und Version des Browsers, exakter Browsertyp, ggf. Betriebssystem

Die Daten über die "referrring URL" ist insbesondere wichtig, um später Zusammenhänge zwischen einzelnen Einträgen herzustellen.
Die vorliegenden Daten können bedingt angereichert werden: die IP-Adresse des Anwenders beispielsweise läßt sich mit einem "handelsüblichen" DNS-Lookup in einen Hostnamen umwandeln - zumindest läßt sich das versuchen, es muß nicht zwingend einen passenden DNS-Eintrag geben.

Masse der Daten zu Aussagen aggregieren
Die Masse der Daten ist unüberschaubar und unlesbar - Anworten auf Fragen erhält man erst, wenn man die Informationen verdichtet. Nun gilt es also, aus den gewonnen Daten sinnvolle Ableitungen von Aussagen zu erzeugen.
Die einfachste Methode ist sicherlich, die Information auf jeweils eine Dimension zu aggregieren, beispielsweise "Zugriffe pro Stunde", "Zugriffe nach Status" etc. Dieses Verfahren gibt bereits einen guten Überblick über die Nutzung des Servers: Wer, wann, womit, wie lange, was wird genutzt?
Mehrdimensionale Analysen visualisieren Abhängigkeiten
Dabei gehen jedoch unweigerlich Zusammenhänge zwischen Dimensionen verloren: treten besonders viele Fehler (Status >400) nach 18:00 Uhr auf, erscheint diese Information weder in der ersten noch in der zweiten angeführten Statistik.
Um Abhängigkeiten zwischen Größen - zum Beispiel Fehlermeldungen von anderen Größen - zu betrachten, sind mehrdimensionale Analysen notwendig: Status nach Zeit, Status nach Browsertyp, Status nach Übertragungszeit etc. Die Anzahl der möglichen Auswertungen steigt dabei exponentiell mit der Zahl der gleichzeitig berücksichtigten Dimensionen, und man sollte immer den Sinn jeder Analyse hinterfragen. Eine interessante und bereits relativ komplexe Betrachtung ist beispielsweise eine Untersuchung der Hits im zeitlichen Verlauf unter Berücksichtigung der angeforderten Seiten: daraus läßt sich beispielsweise ableiten, ob private Nutzer (also solche, die erst abends online gehen) andere Themenschwerpunkte in Ihrem Webangebot setzen als Geschäftskunden (die das Internet überwiegend tagsüber nutzen).
Neben der reinen Aggregierung lassen sich zusätzlich Informationen aus dem Vergleich verschiedener Protokolleinträge untereinander gewinnen: Anhand des Referers und der IP-Adresse lassen sich beispielsweise aufeinanderfolgende Zugriffe eines Anwenders einander zuordnen und sich daraus der Weg des Anwenders durch die Site ableiten. Die Unterschiede der Zeitstempel läßt dabei Rückschlüsse auf die Verweildauer pro Seite zu. Anhand des Referers lassen sich zusätzlich interne und externe Referenzen unterscheiden und somit die zuerst besuchte Seite - bei Links von anderen Seiten aus muß dies nicht zwingend die Startseite der Site sein - bestimmen sowie die Seite, von der aus sie aufgerufen wurde: Suchmaschine, Ihre Partner, manuell eingetippt etc.
Sag mir doch, was mag es bedeuten
Messen fällt dem Server noch leicht, auch das Verdichten zu Übersichten stellt noch keine Herausforderung dar. Doch um die Ergebnisse inhaltlich bewerten und daraus Maßnahmen für die Optimierung der Website ableiten zu können, sind einige grundlegende Kenntnisse über das Web und seine Technologien und Eigenarten erforderlich.
Eine der brennendsten Fragen in Hinsicht auf Websites ist sicherlich die Frage nach dem "Wer": nutzen in erster Linie Interessenten, Kunden, Wettbewerber oder Bewerber die eigene Site, um sich ein Bild über das Unternehmen und seine Produkte zu machen?
Größere Geschäftskunden nutzen das Internet in der Regel über eine Standleitung mit einem zentralen Router, der über eine einzelne statische IP-Adresse verfügt, die meist auch einen DNS-Eintrag besitzt: Hostnamen wie "gatekeeper.firma.de" oder "router.firma2.de" deuten auf ein solches Unternehmen hin. Dabei ist zu beachten, daß alle Mitarbeiter dieses Unternehmens dieselbe IP-Adresse hinterlassen und - sofern zum selben Zeitpunkt zwei oder mehr von ihnen gleichzeitig Ihre Site aufsuchen - mehrere unabhängige Pfade mit derselben IP-Adresse im Log hinterlassen: eine Unterscheidung ist erst durch die referring URL möglich. Hostnamen wie "dial045.provider.net" dagegen lassen vermuten, daß hier wahrscheinlich eine Wählleitung und damit ein kleines Unternehmen oder eine Privatperson zu Besuch war.
Die Uhrzeit der Zugriffe läßt ebenfalls - insbesondere in Verbindung mit dem Hostnamen - Rückschlüsse auf die Art des Zugriffs zu: unaufgelöste IP-Adressen und "dial..."-Einträge zu später Stunde sind höchstwahrscheinlich Nutzer, die vom privaten Online-Zugang aus Ihre Site aufsuchen.
Optimieren der Navigation schafft Vorteile
Das Wissen um die vorwiegend private oder geschäftliche Nutzung Ihrer Site ist sehr wichtig, um die Inhalte entsprechend anzupassen. Insbesondere im Zusammenhang mit der Verweildauer lassen sich so implizit Qualitätsaussagen treffen: Adressieren Sie überwiegend Geschäftskunden, die aber eher unterdurchschnittlich lange bei Ihnen verweilen, haben sie Ihre Adresse wahrscheinlich über Anzeigen oder Suchmaschinen erfahren, aber den gesuchten Inhalt nicht gefunden. Insbesondere sehr kurze Verweilzeiten auf einzelnen Seiten " wenige Sekunden " legen den Schluß nahe, daß die erwarteten Inhalte nicht vorgefunden wurden: Optimieren Sie die Navigation oder ergänzen Sie bereits auf der Startseite eine Volltextsuche, um den Zugang zu Inhalten zu erleichtern.
Meßwerte wie HTTP-Protokollversion und Browsertyp geben Aufschluß über die durchschnittliche technische Ausstattung Ihrer Besucher und erleichtern Ihnen die Entscheidung, beim nächsten Redesign auf neue Technologien wie Cascading Style Sheets oder Dynamic HTML zurückzugreifen, die beide erst seit der 4er Generation der Browser unterstützt werden.
Insbesondere aus administrativer Sicht interessant ist eine Übersicht der HTTP-Status-Meldungen (s. Tabelle), die Informationen über Fehler in der Site und das Lastverhalten des Servers gibt. Auch die durchschnittliche Übertragungszeit der Seiten läßt Aussagen darüber zu, wie sich das System bei Lastspitzen verhält. Damit lassen sich Aussagen über die Dimensionierung des Servers treffen, die ansonsten nur subjektiv zu bewerten sind; außerdem können andere administrative Vorgänge wie beispielsweise das tägliche Backup in Zeiten geringer Auslastung verschoben werden.
Ebenso können aus der Referenz die Verbreitung der eigenen URL in Suchmaschinen und Linklisten sowie deren Nutzungshäufigkeit, aus der Übersicht der authentifizierten Benutzer im Zusammenhang mit der Zeit das Nutzungprofil der Intranet- oder Extranetanwendungen und mögliche erfolgreiche Angriffe abgeleitet werden: die Interpretationsmöglichkeiten sind vielfältig. Nicht zuletzt ist natürlich auch die Verteilung der Zugriffe auf die Inhalte, das Interessenprofil, von maßgeblicher Bedeutung: wenn 90% der Zugriffe die Stellenanzeigen betreffen, kann das nicht im Interesse des Unternehmens sein - es sei denn, Sie sind ein Personalberater.
Proprietäre Formate in Funktion und Wirkung
Selbst wenn das Standard-Log-Format durch den Server unterstützt wird, stoßen gängige Tools bei eher kryptischen URLs an Grenzen. Der Lotus Domino Server beispielsweise referenziert Daten aus Notes-Datenbanken mit Hilfe der ReplicaID und einer UniversalDocID - beides sind 32 Zeichen lange Hex-Zahlen, die keinerlei Bezug zum Inhalt erlauben: aus "jobs.htm" wird "3ad7d89cfb2bd47b41256839002a5c2c?OpenDocument".
Auf Basis des optionalen ebenfalls proprietären Loggings des Domino Servers, der domlog.nsf, die exakt die gleichen Daten protokolliert wie die vergleichbaren ASCII-Files, lassen sich die beschriebenen Analysen in einer Applikation zusammenfassen. SYNTAGS DominoDiary stellt eine solche Applikation dar, die konfigurierbar einmal täglich die Verdichtung der Protokollinformationen und die grafische Aufbereitung der Analysen vornimmt: der Server liefert bereits auf einen Blick Fragen auf die brennendsten Antworten. Gleichzeitig werden die kryptischen URLs zu frei definierbaren und kategorisierten Schlagworten aufgelöst: Messen Sie alle Zugriffe auf "Stellenanzeigen" auf einen Blick.
In Zeiten moderner Content Management Systeme auf Basis von Groupware-Plattformen darf der Faktor Erfolgsmessung nicht unterschätzt werden: eine Website ohne Erfolgsmessung trägt bestenfalls zufällig zum Unternehmenserfolg bei.

Ansprechpartner

Cookies erleichtern die Bereitstellung unserer Dienste. Mit Klick auf "Cookie zulassen" stimmen Sie der Nutzung unserer Dienste zu und erklären Sie sich damit einverstanden, dass wir Cookies verwenden. Hier finden Sie unsere Datenschutzerklärung

 

	object(Joomla\Registry\Registry)#52 (3) {
  ["data":protected]=>
  object(stdClass)#437 (88) {
    ["article_layout"]=>
    string(20) "uniorg:newsanpassung"
    ["show_title"]=>
    string(1) "1"
    ["link_titles"]=>
    string(1) "0"
    ["show_intro"]=>
    string(1) "1"
    ["info_block_position"]=>
    string(1) "0"
    ["show_category"]=>
    string(1) "0"
    ["link_category"]=>
    string(1) "0"
    ["show_parent_category"]=>
    string(1) "0"
    ["link_parent_category"]=>
    string(1) "0"
    ["show_author"]=>
    string(1) "0"
    ["link_author"]=>
    string(1) "0"
    ["show_create_date"]=>
    string(1) "1"
    ["show_modify_date"]=>
    string(1) "0"
    ["show_publish_date"]=>
    string(1) "0"
    ["show_item_navigation"]=>
    string(1) "0"
    ["show_vote"]=>
    string(1) "0"
    ["show_readmore"]=>
    string(1) "1"
    ["show_readmore_title"]=>
    string(1) "0"
    ["readmore_limit"]=>
    string(3) "100"
    ["show_tags"]=>
    string(1) "1"
    ["show_icons"]=>
    string(1) "0"
    ["show_print_icon"]=>
    string(1) "0"
    ["show_email_icon"]=>
    string(1) "0"
    ["show_hits"]=>
    string(1) "0"
    ["show_noauth"]=>
    string(1) "0"
    ["urls_position"]=>
    string(1) "0"
    ["show_publishing_options"]=>
    string(1) "1"
    ["show_article_options"]=>
    string(1) "1"
    ["save_history"]=>
    string(1) "0"
    ["history_limit"]=>
    int(10)
    ["show_urls_images_frontend"]=>
    string(1) "0"
    ["show_urls_images_backend"]=>
    string(1) "1"
    ["targeta"]=>
    int(0)
    ["targetb"]=>
    int(0)
    ["targetc"]=>
    int(0)
    ["float_intro"]=>
    string(4) "left"
    ["float_fulltext"]=>
    string(4) "left"
    ["category_layout"]=>
    string(6) "_:blog"
    ["show_category_heading_title_text"]=>
    string(1) "1"
    ["show_category_title"]=>
    string(1) "1"
    ["show_description"]=>
    string(1) "1"
    ["show_description_image"]=>
    string(1) "0"
    ["maxLevel"]=>
    string(1) "1"
    ["show_empty_categories"]=>
    string(1) "0"
    ["show_no_articles"]=>
    string(1) "1"
    ["show_subcat_desc"]=>
    string(1) "1"
    ["show_cat_num_articles"]=>
    string(1) "0"
    ["show_cat_tags"]=>
    string(1) "1"
    ["show_base_description"]=>
    string(1) "1"
    ["maxLevelcat"]=>
    string(2) "-1"
    ["show_empty_categories_cat"]=>
    string(1) "0"
    ["show_subcat_desc_cat"]=>
    string(1) "1"
    ["show_cat_num_articles_cat"]=>
    string(1) "1"
    ["num_leading_articles"]=>
    string(1) "1"
    ["num_intro_articles"]=>
    string(1) "7"
    ["num_columns"]=>
    string(1) "1"
    ["num_links"]=>
    string(1) "0"
    ["multi_column_order"]=>
    string(1) "0"
    ["show_subcategory_content"]=>
    string(1) "0"
    ["show_pagination_limit"]=>
    string(1) "1"
    ["filter_field"]=>
    string(4) "hide"
    ["show_headings"]=>
    string(1) "1"
    ["list_show_date"]=>
    string(1) "0"
    ["date_format"]=>
    string(0) ""
    ["list_show_hits"]=>
    string(1) "1"
    ["list_show_author"]=>
    string(1) "1"
    ["orderby_pri"]=>
    string(5) "order"
    ["orderby_sec"]=>
    string(5) "rdate"
    ["order_date"]=>
    string(9) "published"
    ["show_pagination"]=>
    string(1) "1"
    ["show_pagination_results"]=>
    string(1) "0"
    ["show_featured"]=>
    string(4) "show"
    ["show_feed_link"]=>
    string(1) "1"
    ["feed_summary"]=>
    string(1) "0"
    ["feed_show_readmore"]=>
    string(1) "0"
    ["show_page_heading"]=>
    int(0)
    ["layout_type"]=>
    string(4) "blog"
    ["menu_text"]=>
    int(1)
    ["pageclass_sfx"]=>
    string(9) " newspage"
    ["ansprechpartner-link-option"]=>
    string(2) "99"
    ["menu-meta_description"]=>
    string(152) "Unter der Überschrift Pressespiegel finden Sie, was die Fachpresse über UNIORG und seine Kunden in den letzten Monaten und Jahren veröffentlicht hat!"
    ["menu-meta_keywords"]=>
    string(26) "Pressespiegel, UNIORG, SAP"
    ["secure"]=>
    int(0)
    ["page_title"]=>
    string(13) "Pressespiegel"
    ["page_description"]=>
    NULL
    ["page_rights"]=>
    NULL
    ["robots"]=>
    NULL
    ["page_heading"]=>
    string(13) "Pressespiegel"
  }
  ["initialized":protected]=>
  bool(true)
  ["separator"]=>
  string(1) "."
}