Web Data Mining selbst gemacht mit Alexa

Seit Jahren sammelt der 1996 gegründete und später von dem Online-Buchhändler Amazon aufgekaufte Internet-Dienstleister Alexa Daten über Websites und Internet-Traffic. Diese Sammelleidenschaft hat einiges Misstrauen geweckt. Das könnte sich jetzt ändern: Online-Publisher dürfen selbst ins Data Mining einsteigen. Alexa macht Teile seiner Datenbanken offen oder gegen ein vergleichsweise geringes Endgelder zugänglich.

Im November lief zunächst der Alexa Web Information Service vom Stapel. Damit lassen sich zu Web-Adressen Daten über Zugriffszahlen, Eigentümer und verwandte Websites abrufen. Dies geschieht über einen sogenannten Webservice: Die abrufende Website sendet einige Abfrage-Parameter und erhält als Antwort die gewünschten Daten zurück. Der Dienst ist Teil der Amazon Webservices. Wer bereits ein Entwickler-Token von Amazon besitzt, kann ihn bis zu 10.000 Mal pro Monat kostenlos einsetzen. Jeder weitere Abruf kostet nur 0,00015 Dollar, tausend Abrufe demnach 15 Cent.

Seit 12. Dezember gibt es auch eine Beta-Version der Alexa Web Search Platform, die eine gesonderte Registrierung erfordert. Sie ermöglicht den Betrieb eigener Suchmaschinendienste im teilweisen oder kompletten Outsourcing bei Alexa - einschließlich Hosting und einem alle zwei Monate erneuerten Index, der nach Firmenangaben 4,5 Milliarden Seiten von über 16 Millionen Websites umfasst.

Die Bezahlung erfolgt auf der Basis von CPU-Nutzung, Speicherplatz sowie verwendeter Bandbreite. Die Kosten erscheinen überschaubar und basieren jeweils auf einem Dollar. So kostet eine Stunde CPU-Nutzung ebenso einen Dollar wie 50 GB Bandbreite oder 4.000 Abrufe durch den Webservice.
Zuletzt bearbeitet 14.12.2005 18:52 Uhr