Wie „wissenschaftlich“ ist SEO?

Da Vinci - Kunst und WissenschaftDie letzten Studien über Rankingfaktoren von Searchmetrics und Moz, haben mir wieder den Ausspruch

„SEO is Art and Science“

ins Gedächtnis gerufen. Wenn ich mir meine tägliche SEO-Arbeit so ansehe, frage ich mich aber immer wieder wie „wissenschaftlich“ SEO denn tatsächlich ist. Ist die Suchmaschinenoptimierung wirklich so „wissenschaftlich“ und datengetrieben wie viele SEOs vorgeben? Wie viel Wissenschaft/Datenanalyse und wie viel Kunst/Kreativität führt denn zu einem guten SEO-Ergebnis?

Wissenschaft oder lediglich Datenanalyse?

Ohne ausführlich über die Definitionen von Wissenschaft und Forschung zu schwadronieren, sollte klar gestellt werden, um was es bei der Wissenschaft/Forschung geht: eine Aussage über einen Zusammenhang (Ursache – Wirkung) nachprüfbar und nachvollziehbar zu machen.

Für die Suchmaschinenoptimierung ist interessant, den Zusammenhang zwischen Rankingsignalen und Platzierung in den Suchmaschinen zu verstehen. Die wissenschaftliche Vorgehensweise wäre also einen Versuchsaufbau zu entwickeln, in dem die Hypothese überprüft werden kann und die Ergebnisse reproduzierbar sind. Konkret würde das so aussehen, dass man ein Ranking-Signal, z.B. den Seitentitel, manipuliert und misst, wie sich das auf die Suchergebnisse auswirkt. Ich denke jedem halbwegs versierten SEO wird gleich einleuchten, warum das problematisch ist:

Der Google-Algorithmus ist extrem dynamisch. Zwar werden die größten Veränderungen am Algorithmus mittlerweile auch von Google angekündigt und es gibt mit dem Mozcast auch  Bemühungen, Änderungen am Algorithmus aufzuspüren. Allerdings macht die Dynamik eine klare Zuordnung von Ursache und Wirkung ziemlich schwierig, weil wir nicht wissen können, ob die Wirkung auf unserer Manipulation des Signals oder einer Änderung der Rahmenbedingungen des Systems beruht.

Nicht nur die Rahmenbedingungen ändern sich ständig, auch die anderen Teilnehmer am SERP-Spiel sind aktiv. Mit anderen Worten: Wenn ich im Ranking falle, kann das daran liegen, dass meine Website negative Signale sendet und daher die Wirkung negativ ist oder eine andere Site schickt mehr positive Signale und wird daher stärker als meine Site eingestuft.

Auch der ungesteuerte Einfluss von Signalen kann dazu führen, dass sich eine Wirkung zeigt. Selbst wenn ich kein aktives SEO betreibe, wird meine Site Likes, Shares, +1s und Links erhalten.

Klare kausale Zusammenhänge zwischen Veränderungen und Ergebnissen lassen sich so also nicht ableiten. Einziger Ausweg bleibt damit die Korrelationsanalyse. Dabei wird versucht, die Beziehung zwischen zwei Variablen aufzuzeigen, um dann zu Schlüssen zu kommen wie „Wann A hoch ist, dann ist B auch hoch“ (positiv korreliert) oder „Wann A hoch ist, dann ist B niedrig“ (negativ korreliert). Aber auch Korrelationsanalysen sind mit Vorsicht zu genießen:

1. Korrelation ist nicht Kausalität

Ein uralter und oft bemühter Einwand ist natürlich, dass Korrelationen nicht bedeuten, dass es einen kausalen Zusammenhang geben muss – das wird auch in den Studien immer sehr deutlich herausgestellt. Schön illustrieren lässt sich das an verrückten Zusammenhängen, die hohe Korrelationen zeigen, aber mit sehr hoher Wahrscheinlichkeit keine kausalen Zusammenhänge haben. Als problematisch muss man dennoch sehen, dass in den Studien immer von „Ranking-Faktoren“ die Rede ist, was kausale Zusammenhänge nahelegt. Der kausale Zusammenhang dahinter ist vermutlich maketingtechnischer Natur 🙂

Ein schönes Lehrstück dazu, waren die Diskussionen, die Cyrus Shepard auslöste, als er eine Korrelationsanalyse präsentierte, die einen Zusammenhang zwischen +1s und Rankings nahelegte. Allein die Diskussionen zu dem verlinkten Post sind es wert zu lesen. Daneben gab es aber auch noch andere großartige Reaktionen darauf. Eine der umfassendsten lieferte Dave Davies auf SearchEngineWatch.

2. Beziehungen zwischen Faktoren

Ein weiteres Riesenproblem ist, dass voneinander unabhängig aufgeführte Faktoren vermutlich keineswegs als unabhängig zu werten sind. Prominentes und hitzig diskutiertes Beispiel dafür ist die Rolle von Links und Social Signals. Seit die Signale aus den sozialen Netzwerken untersucht werden, zeigt sich eine starke Korrelation mit guten Rankings. Das mag aber auch damit zusammenhängen, dass gute Inhalte neben Likes, Shares, +1s auch Links und Zitierungen anziehen. Welche Ursache nun welchen Einfluss auf das Ergebnis hat, lässt sich so kaum herausfiltern, da einfach zu viele Faktoren zusammenwirken, die man nur schwer isolieren kann.

Vielen sind diese Probleme sicherlich bewusst, so dass auch die Ergebnisse der Korrelationsanalyse in den richtigen – also vorsichtigen – Kontext gestellt werden. Ich erlebe es trotzdem ständig, dass bei Diskussionen die Studien der „Rankingfaktoren“ ins Feld geführt werden. Und eben nicht als vorsichtige Hinweise darauf, dass es Zusammenhänge zwischen bestimmten Änderungen an einer Website und deren Rankings geben könnte. Vielmehr als das, was auch darauf steht: Rankingfaktoren … vorzugsweise noch mit dem Missverständnis, dass der Balken, der die Korrelation anzeigt, zeigt wie stark der Faktor gewichtet ist. Und weil das Ganze auch noch so schön wissenschaftlich daherkommt, wird es als erwiesen betrachtet. Ich kenne das nur allzu gut, weil ich diese Karte selber schon gespielt habe und daher nicht unbedingt mit zu großen Steinen um mich werfen will 🙂

Ist datengetriebenes SEO dann überhaupt möglich?

Wenn SEO nun schon keine Wissenschaft ist, so ist es doch ein Feld das extrem datengetrieben ist, oder nicht? Das hängt natürlich sehr stark davon ab, was man unter „datengetriebenem“ SEO versteht. Ich will meine ganz persönliche Meinung an zwei für mich einleuchtenden Beispielen verdeutlichen:

1. „Natürliche“ Linkprofile

Die Linkanalyse ist neben den Rankinganalysen das älteste Feld, das man datentechnisch in den Griff zu bekommen versucht. Mittlerweile gehen die Tools weit darüber hinaus, nur Links zu registrieren und bestimmte Metriken dafür zu aggregieren. Aktuell werden die Daten nicht nur aggregiert, sondern es findet eine automatisierte Interpretation der Daten statt, so dass es z.B. möglich ist, schädliche Links in Linkprofilen zu identifizieren.

Klar ist es interessant das eigene Linkprofil zu analysieren und auch die Linkprofile der Wettbewerber. Das ist vor allem dann interessant, um herauszufinden, ob es extreme Auffälligkeiten im eigenen Profil gibt (vor allem bei SEO-Problemen) oder aber um potentielle Linkquellen zu finden.

Problematisch wird es, wenn die Dateninterpretationen weitergehen. Schon oft gehört: „Ein „natürliches“ Linkprofil in Ihrer Branche sollte aber ca. x% Links aus Blogs erhalten. Wir sollten im Linkaufbau darauf achten, dass wir mehr Links aus Blogs erhalten.“

Bei solchen Ansagen zweifle ich an der Zukunftsfähigkeit unserer Branche! Nicht nur, dass es mir kaum einleuchtet, was „natürlich“ in diesem Zusammenhang bedeuten soll. Ist es wirklich sinnvoll mein Linkprofil so aufzubauen wie meine Wettbewerber? Wie sieht denn ein Linkaufbau mit solchen Zielsetzungen aus? Die Linkaufbau-Realität sieht für mich so aus, dass ich alles an sauberen Links mitnehme, was ich bekommen kann. Da ist es mir herzlich egal, ob der Link von einem Blog, einer Nachrichtenseite oder einem Forum kommt. Was bringt mir dann noch eine genaue Datenanalyse, die vorgibt, wie mein Linkprofil aussehen soll?

2. SEO-getriebene Textoptimierungen

Ein anderer Bereich, in dem die Datenanalyse merkwürdige Blüten treibt.

Sicherlich sinnvoll ist eine Analyse, wie Inhalte bei Usern ankommen. Egal ob man dabei Social Signals misst, gewonnene Links, generierten Traffic oder das Nutzerverhalten. Wenn man diese Daten heranzieht, um zu sehen, was zum SEO-Erfolg beiträgt und was nicht, ist das eine großartige Sache.

Merkwürdig wird es, wenn sich die Datenanalyse auf das vermeintliche Wissen um den Algorithmus stützt. Ein Klassiker, der mittlerweile aus der Mode gekommen ist, ist die Keyworddichte. Die wurde mittlerweile ersetzt durch „wissenschaftlichere“ Ansätze wie LSI oder WDF*IDF. Ich will hier nicht mal in Abrede stellen, dass alle diese Dinge irgendeinen Einfluss auf die SEO-Performance haben können – auch wenn ich bis heute noch keine reproduzierbaren Hinweise darauf gesehen habe. Aber mal ehrlich: Für die Produktion von starkem Content kommt es auf andere Sachen an. Also warum sollte ich mich oder meine Texter mit vermeintlich wichtigen Ergebnissen aus diesen Analysen behelligen?

SEO – mehr „Art“ als „Science“

Ohne Daten kommen SEOs trotzdem nicht aus. Gerade die Keywordrecherche ist eine der Hauptaufgaben der Suchmaschinenoptimierung. Hinzu kommen eher datengetriebene SEO-Aufgaben wie die Optimierung von Produktdaten. Die Analyse von möglichen Linkquellen wäre ein anderer Einsatzzweck, neben so vielen anderen.

Aber ob viele der Datenanalysen, die für zahlungswillige Kunden erstellt werden, tatsächlich zum SEO-Erfolg beitragen bezweifle ich. Oft genug erfüllen diese Datenanalyse nur den Zweck zu zeigen, dass man Energien in ein Projekt investiert hat oder dem Bedürfnis nach Datenpornografie auf Kundenseite. Oder aber schlimmer noch: Sie suggerieren ein profundes Verständnis von einem System, dessen Komplexität und Dynamik sich den aktuellen Analysen schlichtweg verschließt.

Für mich beruht nachhaltiger SEO-Erfolg daher weitaus mehr auf den Qualitäten, die eher im „Art“-Teil zu finden sind. Das sind vor allem Dinge wie Kreativität und auch die Fähigkeit Beziehungen zu knüpfen und zu pflegen. SEOs sind auf Daten angewiesen, entscheidend für den Erfolg ist der Großteil der Datenanalysen aber keineswegs. Letzten Endes kommt es auch im SEO einfach darauf an, gutes Marketing zu betreiben. Noch einmal schön zusammengefasst von Eric Enge in einem Interview mit Matt Cutts:

I always liken this to doing marketing the way it used to be done, right? Businesses always tried to create the best product, the best value, of the best something. Then they would find a way to promote it. Then promotion becomes easy.

Haltet ihr SEO für wissenschaftlich? Welche Rolle spielen Daten in eurem SEO-Ansatz? Wann setzt ihr Daten wirklich produktiv ein? Welche Daten sind für euch am sinnvollsten?