Die 10 spannendsten Insights des Yandex-Leaks

Am 25. Januar wurde der Quelltext der russischen Suchmaschine Yandex geleaked. SEOs haben damit einen einzigartigen Einblick in Rankingfaktoren einer Suchmaschine erhalten. Einigen Spekulationen konnte somit endlich ein Ende gesetzt werden. Unsere SEO-Experten Alena Beutler-Thönes (Chapter Lead SEO & UX) und Daniel Spears (Senior Manager SEO) teilen ihre 10 spannendsten Insights aus dem Leak und die gesamte, übersetzte Liste der Rankingfaktoren.

Was macht den Yandex Leak so spannend?

Yandex hat auf dem russischen Markt rund 62 % Marktanteil* – weltweit beeindruckt sie mit ihren 1,42 %** nur bedingt. Auch wenn sie damit die viertstärkste Suchmaschine der Welt ist.

Dennoch wurde dem Leak erstaunlich wenig Aufmerksamkeit geschenkt – gerät er doch rund um die sich teilweise überschlagenden Entwicklungen von ChatGPT nahezu in den Hintergrund. Dabei lassen sich interessante Einblicke in den Quellcode einer Suchmaschine erlangen, die nicht nur als Google-Klon entwickelt wurde, sondern bei deren Entstehung auch diverse ehemalige Mitarbeitende von Google beteiligt waren.

1922 Rankingfaktoren – 1478 davon veraltet

Die Liste verfügt über 1922 Rankingfaktoren, von denen 1478 Faktoren als „unused“, „deprecated“, „unimplemented“ oder „removed“ vertagged sind. Teilweise sind die Bezeichnungen der Faktoren so kryptisch, dass es sehr schwerfällt, den Sinn zu erschließen. So sagt uns „BQPRSampleALLWcmWeightedValue“ bis heute eher wenig.

Die restlichen Rankingfaktoren teilen sich in 217 aktive statische, 222 aktive dynamische und 5 nicht klassifizierte Ranking-Faktoren auf. Statische Rankingfaktoren sind bspw. Wortanzahl oder Dokumentenalter – dynamische Faktoren sind bspw. die Anzahl der eingehenden Links mit Suchbegriff im Ankertext.

Von den aktiven Rankingfaktoren betreffen 100 das Nutzerverhalten, wie die Verweildauer oder die Anzahl der wiederkehrenden Besucher.

Unsere Top-Insights

Wir haben die spannendsten Rankingfaktoren in drei Gruppen aufgeteilt: UX & Usersignale, Content und Tech. Ein weiteres Problem – neben den kryptischen Bezeichnungen – ergibt sich daraus, dass unklar bleibt, wie sehr und ob der jeweilige Rankingfaktor positiv oder negativ in den Algorithmus einfließt. In Kombination mit SEO-Optimierungsstandards können wir dennoch einige Testing- und Analyse-Ideen ableiten.

UX & Usersignals

Eine Analyse der Rankingfaktoren (RF) im UX & Usersignals-Bereich deutet an, dass die Verweildauer vom Algorithmus berücksichtigt wird (RF 1794). Es gibt jedoch noch detailliertere Rankingfaktoren im Kontext Verweildauer. So beispielsweise RF 849, der die Verweildauer einer URL in einer Region ins Verhältnis setzt zu den Verweildauern auf der Seite aus anderen Regionen – dies ist besonders im Kontext Local SEO spannend zu beachten.

Die Rankingfaktoren 1076 und 1077 berücksichtigen, wie häufig die Verweildauer über 90, bzw. 160 Sekunden beträgt. Auch wenn sich nicht 100-prozentig sagen lässt, ob dies positiv oder negativ zutragen kommt, bekommen wir doch erstmals eine grobe Orientierung. Daraus ergibt sich auch die erste Analyse-Idee: Konkret die Performance der URLs betrachten, deren Verweildauer unter 90 Sekunden, zwischen 90 und 160 Sekunden sowie über 160 Sekunden beträgt – eventuell lassen sich hier erste Tendenzen hinsichtlich einer optimalen Verweildauer im Kontext Rankingposition erkennen.

Darüber hinaus wird von Yandex die Verweildauer der User berücksichtigt, die über einen Backlink eine bestimmte URL erreichen (RF 660). Hierbei liegt die Annahme nahe, dass Backlinks, die zu Sessions mit besonders hohen Verweildauern führen, sich positiv auf die Qualität des Backlinkprofils auswirken. Hieraus ergibt sich eine weitere Analyse-Idee: Zuerst könnte geprüft werden, wie die Qualität der Backlinks einzustufen ist, die zu Sessions mit auffällig niedrigen Verweildauern führen. Anschließend kann der testweise Abbau dieser Backlinks erfolgen, um so die Qualität des Backlinkprofils zu erhöhen. Dies kann sich wiederum positiv auf die SEO-Performance auswirken. Ein solche Analyse ist durch den Abgleich von Daten aus Google Analytics und Daten aus einem Backlink-Monitoring Tool wie LinkResearchTools möglich. Wichtig hierfür ist eine bestmögliche Datenqualität und eine große Sensibilität beim Abbau der Backlinks.

Zudem deutet der RF 1794 an, dass die CTR im Yandex Algorithmus eine Rolle spielt. Dies ist nicht überraschend. Hieraus leitet sich vor allem ab, dass eine CTR-Optimierung, z.B. durch optimierte Metadaten, sinnvoll ist. Dies ist aber keine neue Erkenntnis, sondern etablierte SEO Best Practice.

Weitere interessante Rankingfaktoren zu Nutzersignalen beziehen sich u.a. auf Wikipedia: So berücksichtigt RF 767 die Anzahl der URL-Besuche, die durch Verlinkungen von Wikipedia entstehen. RF 845 bezieht sich auf Verlinkungen der URL in Wikipedia Info-Boxen. Höchste Zeit also einen Wikipedia-Artikel für die eigene Brand oder Unternehmen zu erstellen.

Content

Im Content-Bereich konnten wir die spannendsten Rankingfaktoren in zwei Gruppen einsortieren: Die eine bezieht sich auf Keyword-Optimierungen, die andere Gruppe bezieht sich aufs Dokumentenalter.

Diverse Rankingfaktoren aus dem Quellcode unterstreichen die Bedeutung von Keywords:

So RF 8, der prüft, ob die exakte Suchanfrage im Titel der Seite vorkommt. RF 69 berücksichtigt hingegen, ob die exakte Suchanfrage in den Überschriften der Seite vorkommt. Auch wenn es inzwischen klar scheint, dass Google Keywords in verschiedenen Reihenfolgen und auch Synonyme gut erkennt und zuordnen kann, wäre es dennoch spannend zu prüfen, ob Seiten mit der exakten Keyword-Formulierung und Reihenfolge einen Rankingvorsprung haben. Der RF 74 prüft auch, ob Synonyme der Suchanfrage in der Überschrift vorhanden sind.

Keine allzu neue Information ist, dass TF*IDF bei Yandex keine Berücksichtigung findet, der Rankingfaktor ist mit einem „deprecated“-Tag versehen. Der prozentuale Anteil des exakten Suchbegriffes an der Gesamtzahl der Wörter wird jedoch unter RF 148 weiterhin berücksichtigt – genauso wie der prozentuale Anteil der Wörter des Suchbegriffs (RF 139).

Aufschlussreich hinsichtlich Longtail-Keywords ist RF 8. Dieser prüft, ob es für Suchanfragen, die aus mehreren Wörtern bestehen, Sätze auf der Seite gibt, in denen sich alle Wörter der Suchanfrage befinden.

Auch das Dokumentenalter wird berücksichtigt. Besonders hinsichtlich Googles letzten Änderungen (wie die Empfehlung, das Dokumentenalter in verschiedensten Formen auf der URL zu hinterlegen) lohnt es sich, die Rankingfaktoren hierzu genauer anzusehen.

Zunächst ergibt sich die Frage, wie Yandex das Dokumentenalter ermittelt – RF 345 hilft hier weiter: „Zur Ermittlung des Alters des Dokuments, wird (u.a.) das Datum verwendet, welches auf der Seite genannt wird.“

Außerdem berücksichtigt RF 41 das Alter einer URL. Hier wird es besonders spannend, denn URLs wird ein Wert 1 oder 0 zugeordnet. Es gibt einen Punkt, wenn die URL 3 Jahre oder älter ist. Doch auch frischer Content bekommt durch RF 442 einen Punkte-Boost, da er prüft, ob das Dokument innerhalb der letzten zehn Tage veröffentlicht wurde. Der Wert errechnet sich folgendermaßen: 10 minus Anzahl der Tage. Ein 4 Tage alter Content bekommt also 6 Punkte gutgeschrieben. Die Punkteanzahl nimmt ab, je länger der Content live ist. Hieraus lässt sich erneut schlussfolgern, dass sowohl alter als auch frischer Content seine Berechtigung hat und positiv auf den Algorithmus wirkt. Es ist also nicht angeraten, per se das Dokumentenalter möglichst aktuell zu halten – eine natürliche Domain besteht aus einem branchenspezifischen Mix.

Nicht zuletzt ist es im Kontext E-E-A-T sinnvoll, das Dokumentenalter bzw. Veröffentlichungsdatum eines Textes als UX-Optimierung aufzunehmen. Der Yandex-Leak unterstreicht diese Best Practice nochmal.

Als Fazit können Websitebetreiber ziehen: Frischer Content aber auch Bestandscontent sowie UX-Optimierung sind im Suchalgorithmus berücksichtigt und heutzutage unerlässlich, um das Maximum aus Organic Search zu ziehen.

Tech

Im Tech-Bereich konnten wir nur zwei aufschlussreiche Rankingfaktoren entdecken: Entgegen der Erwartung berücksichtigt RF 1692 den „Hostspeed“ nicht im Algorithmus und vertaggt diesen als „unused“. Sitespeed ist jedoch allein aus Gründen der UX- und Conversion-Optimierung nicht zu unterschätzen.

Nicht überraschend ist hingegen, dass der Anteil der Seiten mit Statuscode 404 an der Gesamtzahl der Seiten berücksichtigt wird. Websitebetreiber sind also dazu angehalten, für eine gesunde Website durch Webhygiene zu sorgen.

Interesse an weiteren Insights?

Weitere Rankingfaktoren, Testideen und Gedanken zur Einordnung werden Daniel und Alena am 20.04.2023 um 16 Uhr in einem offenen Workshop teilen. Die Teilnahme ist kostenlos. Interessierte können sich unter folgendem Link anmelden: https://top10seolearnings.eventbrite.de

Wir teilen die übersetzte Liste der Rankingfaktoren!

Veröffentlicht wurde eine russische Text-Datei. Um besser mit der Datei arbeiten zu können, wurde sie von uns übersetzt und in ein filterbares Excelformat gebracht.

In der Liste können Filteroptionen genutzt werden, wie bspw. nach aktiven Faktoren mit user-Tag (Nutzerverhalten), date-Tag (Dokumentenalter) oder linktext-Tag (Linktexte).

Die Datei schicken wir allen Interessierten, die nicht am Workshop teilnehmen können, gerne zu.

Schreibt uns einfach eine kurze Nachricht!

Liste anfordern

*Quelle: https://de.statista.com/statistik/daten/studie/727047/umfrage/marktanteil-von-yandex-im-suchmaschinenmarkt-in-russland-quartalsweise/#:~:text=Im%20dritten%20Quartal%202022%20belief,im%20Durchschnitt%20auf%2062%20Prozent

**Quelle: https://de.statista.com/statistik/daten/studie/225953/umfrage/die-weltweit-meistgenutzten-suchmaschinen/