Gutes Tracking – Böses Tracking

Posted: Juni 18th, 2012 | Author: | Filed under: Allgemein | Kommentare deaktiviert für Gutes Tracking – Böses Tracking

Am Wochenende hatte ich das Vergnügen mit Falk Lüke beim Deutschlandradio Kultur eingeladen zu sein – die Sendung @breitband widmete sich unter Leitung der Redakteurin Anja Krieger der Frage, ob Tracking gut oder böse ist.

Kann man hier nachhören: http://breitband.dradio.de/gutes-tracking-boses-tracking/

War ein bisschen wenig Sendezeit und Falk hatte ja noch eine Rechnung offen von der re:publica (die session gibt es leider nicht im Netz, dafür aber das Vorgespräch) – deshalb haben wir dann leider wieder nur über first vs. third party Tracking, Browsereinstellungen und die Frage gesetzlicher Regelungen ja oder nein gesprochen. Aber ist ja auch wichtig.

Das ist aber insofern schade, als ich mich auf eine Diskussion über die Innovationspotentiale des Trackings über Werbung hinaus gefreut hatte, deshalb nochmal in aller Kürze hier (hatte meine Grundhaltung dazu ja auch schonmal hier dargelegt vor einiger Zeit (sic)).

Denn es gibt tatsächlich zahlreiche Beispiele dafür, wie das vor allem in der Online-Werbung angewandte Tracking zu Innovationen und Technologie-Sprüngen führt, die schon jetzt bemerkenswert sind, obwohl wir mit dem ganzen Feld wirklich erst am Anfang stehen. Ich will drei Beispiele nennen:

1. Google Translate: Das besondere an Google Translate im Gegensatz zu bisherigen Übersetzungs-Ansätzen ist, dass auf eine linguistische Analyse eines Sprachcorpus ganz verzichtet wird. Stattdessen setzt Google mit dem Produkt auf statistische Verfahren, anders gesagt eine Kombination von Big-Data und Machine Learning. Solche Ansätze wurden immer schonmal erforscht, sind aber bisher gegenüber den linguistischen Verfahren meistens gnadenlos durchgefallen. Was Tracking hier konkret technologisch verändert hat (neben dem Aspekt, dass die Finanzierung dieses Forschungsprojekt zu 100% durch auf Tracking basierender Werbung erfolgt) ist die Möglichkeit den Ansatz einfach massiv zu skalieren, d.h. einfach viel grössere Datenmengen in viel kürzerer Zeit zu verarbeiten. Damit reicht die Qualität dann plötzlich doch an die elaborierterer Verfahren heran, neben zahlreichen anderen Vorteilen, die ein agnostisches Verfahren hat, insbs. wenn es darum geht sozusagen beliebige Sprachen zu übersetzen – solange genügend Material vorliegt (und ja, bestimmte Strukturmerkmale der Sprache gegeben sind…) und die Maschinen damit trainiert werden können funktioniert die Übersetzung. Und zwar so gut, dass ex Google CEO Eric Schmidt bereits die Erfüllung eines alten Menschheits-Traumes ankündigen kann, nämlich die maschinelle Simultan-Übersetzung in eine beliebige Zielsprache.

YouTube Preview Image

Erstes Beispiel das schon nahe drankommt (wenn auch bisschen krude):

YouTube Preview Image

2. Google Cars: Bei Google Cars geht es darum, autonom fahrende Autos zu entwickeln, also vor allem die Steuerungs-Software dazu. Auch hier gibt es schon beeindruckende Fortschritte der Google-Ingenieure und die Fahrzeuge haben schon mehrere tausend Kilometer im Strassenverkehr zurückgelegt ohne größere Zwischenfälle. Und auch hier gibt es direkte Bezüge zur Advertising-Technologie, die Google entwickelt hat. Zum einen ist bei Google Cars das Funktionsprinzip ebenfalls ein agnostisches wie schon bei Translate, d.h. es werden der Maschine nicht in erster Linie Strassenverkehrsregeln beigebracht, sondern sie wird auf Muster des Verhaltens im Verkehr trainiert – und zwar auf der Basis von unfassbaren Mengen von Sensor-Informationen, die das Fahrzeug ständig erfasst. Also wieder eine Kombination von Big-Data und Machine-Learning – und Sensoren sind natürlich nichts anderes als Tracker. Das Google Auto tracked also seine Umgebung und lernt auf der Basis sich autonom zu bewegen. Zusätzlich wird das Material von Google-Maps ausgewertet, das wiederum erstmal ein Advertising-fokussiertes Projekt ist…

3. Hadoop: Und zuletzt noch Hadoop – in diesem Fall eher eine „behind the scenes“ Geschichte, in Ihrer Auswirkung aber sicherlich mindestens mit den beiden obigen Produkten vergleichbar. Hadoop ist (mittlerweile) ein Projekt der Apache-Foundation, das massgeblich auf Input der Google-Ingenieure, aber auch auf das von Yahoo, Facebook und zahlreicher anderer Firmen zurückgeht. Es handelt sich dabei um ein Framework zur Speicherung und Verarbeitung großer Datenmengen, das deutlich besser skaliert als selbst die teuersten Datenbank-Produkte von Oracle, IBM und co. Mit Sicherheit läuft Hadoop sowohl bei Translate als auch bei Google Cars irgendwie mit. Vor allem aber setzen hunderte von Firmen weltweit mittlerweile Hadoop ein (nugg.ad gehörte zu den ersten Nutzern in Europa) um die unterschiedlichsten Big-Data Projekte zu realisieren. Man kann hier übrigens sogar fast von einer Demokratisierung der Produktionsmittel sprechen, denn Hadoop ist Open-Source und so können auch kleine Startups und Einzelpersonen sich mit überschaubaren Mitteln eine Infrastruktur aufbauen, für die noch vor wenigen Jahren eine siebenstellige Summe allein an Lizenz-Zahlungen fällig gewesen wäre. Auch Hadoop ist sehr unmittelbar aus dem Google Tracking/Werbe-Kontext entstanden, finanziert worden und wird dort massgeblich weiterentwickelt, weil die Google Ads eben nur so gut sind wie die darunterliegenden Daten…

Man sieht also – es gibt ein paar sehr unmittelbare Belege für die These, dass Tracking nicht nur schwer wegzudenken ist, wenn wir vom Internet reden, und noch nichtmal dann, wenn wir nicht nur über Werbung reden. Tatsächlich ist Tracking in mehrfacher Hinsicht eine Innovationsquelle ersten Ranges und wir sollten uns genau überlegen, wie wir damit in Zukunft umgehen (womit ich übrigens nicht meine „bitte bloss nicht regulieren oder abschalten“ sondern wirklich einen weisen Umgang mit ggf. breiterer gesellschaftlicher Diskussion).

 


Comments are closed.