Neues aus R&D – Teil 1: Wie man Künstliche Intelligenz nutzen kann, um die Sichtbarkeit von Unternehmen zu messen.

28. März 2019 Innoplexia Redaktion

Im ersten Teil unserer neuen Blog-Artikel-Serie „Neues aus IX Research & Development“ berichten wir heute darüber, wie man Künstliche Intelligenz nutzen kann, um die Sichtbarkeit von Unternehmen im Internet zu messen.

Die Sichtbarkeit von Unternehmen im digitalen Marktumfeld ist eines der wichtigsten Kriterien für den Unternehmenserfolg. Sowohl im B2B- als auch im B2C-Bereich informieren sich heutzutage mehr als die Hälfte aller Konsumenten vor der Kaufentscheidung über Unternehmen und Produkte im Web. In der westlichen Welt wird hierfür in mehr als neun von zehn Fällen die Suchmaschine Google genutzt, weshalb Google als Vermittlungsplattform zwischen Angebot und Nachfrage eine zentrale Rolle im digitalen Marktumfeld einnimmt. Ist ein Unternehmen gut sichtbar und präsent auf Google, so steigt typischerweise auch der Umsatz und hiermit der Unternehmenserfolg. Wird ein Unternehmen von der ersten Ergebnisseite von Google verdrängt, so kann dies im Umkehrschluss fatale Folgen für die Geschäftsentwicklung des Unternehmens haben.

Da nun definiert ist, weshalb die Sichtbarkeit von Unternehmen auf Google ein wichtiges Kriterium für den Unternehmenserfolg ist, stellt sich nun die Frage, wie man diese am genauesten messen kann. Bereits 2014 entwickelte Innoplexia deshalb eine Formel zur Messung der Sichtbarkeit von Unternehmen und deren Webseiten auf Google. Mehrere Kriterien auf der Ergebnisseite von Google wurden hierfür herangezogen, unter anderem der Rang, optimale Länge von Titel und Texten, Vorhandensein von Sterne-Bewertungen und einige weitere. Diese Kriterien wurden gewichtet und ergaben in der Summe den Innoplexia-Sichtbarkeitsscore, der sich bis zum heutigen Tag – unter regelmäßigen Anpassungen – erfolgreich am Markt bewährt hat.

Doch warum ist es nun an der Zeit, eine neue Berechnungsgrundlage zu erproben und eine grundlegende Überarbeitung des Sichtbarkeitsscores anzustreben? Der hauptsächliche Beweggrund hierfür liegt vor allem in der immer dynamischer werdenden Ergebnisdarstellung von Google. Das Unternehmen spielt in immer kleiner werdenden Abständen Updates aus, welche zu einer veränderten Darstellung der Suchergebnisse führen. Eine Sichtbarkeitsberechnung mittels klassischer statistischer Methoden trägt dieser Tatsache also nur noch bedingt Rechnung, sodass Innoplexia nun auf Deep Learning Models setzt, welche den Einfluss verschiedenster Variablen auf die Sichtbarkeit genauer abbilden können.

Diese zwei Screenshots der Ergebnisseite von Google zeigen deutlich, dass organische Ergebnisse (SEO) teilweise gar nicht mehr auf den ersten Blick sichtbar sind (links) beziehungsweise zum Teil auch größer dargestellt werden, als es früher der Fall war (rechts). Aus diesem Grund gilt es, multiple Faktoren für die Sichtbarkeitsberechnung zu nutzen.

Dieses mehrwöchige Projekt wurde im Innoplexia Kompetenzbereich Künstliche Intelligenz im Rahmen der folgenden Etappen realisiert:

    1. Zunächst wurde eine möglichst repräsentative Stichprobe an Probanden herangezogen, welche jeweils Sichtbarkeiten von Unternehmen auf Google bewerten sollten. Alle Probanden erhielten hierfür dieselben Screenshots von Google Ergebnisseiten zur Bewertung vorgelegt und sollten ihre subjektive Wahrnehmung darüber abgeben, welcher Suchtreffer in den Ergebnissen wie sichtbar ist.
    2. Es folgte ein Feature Engineering zur Beantwortung der grundlegenden Frage: Welche unabhängigen Variablen (bspw. Rang oder y-Koordinate eines Unternehmens) haben welchen Einfluss auf die abhängige Variable, nämlich die wahrgenommenen Sichtbarkeit des jeweiligen Unternehmens. Der ursprüngliche Innoplexia Score bestand aus sieben Kriterien, die in unterschiedlicher Gewichtung die Sichtbarkeit bestimmten. Im neu erprobten Modell wurden nun viele neue Kriterien entdeckt, sodass sich die Anzahl der relevanten Kriterien nun mehr als verdoppelt hat. Darüber hinaus ergab sich eine optimierte Gewichtung der Kriterien. So ist beispielsweise der Rang eines Unternehmens nicht mehr so einflussreich wie die y-Koordinate. Dies ist dadurch bedingt, dass Google in der Zwischenzeit immer mehr dazu übergegangen ist, Kartendarstellungen oder einzelne Snippets aus Google Maps über das erste organische Suchergebnis zu stellen. Ziel und Ergebnis dieses Feature Engineerings auf Basis der im ersten Schritt gewonnenen empirischen Datengrundlage war es, die genauen Einflussfaktoren auf die Sichtbarkeit sowie deren Gewichtung neu zu definieren und somit weiter zu optimieren.
    3. Im nächsten Schritt folgte das Trainieren eines Deep Neural Models, ebenfalls auf Basis der im ersten Schritt gewonnenen Datengrundlage. Hierfür wurde das Framework TensorFlow des Google Brain Teams herangezogen. Zum Trainieren des Models wurde die Google Machine Learning Engine eingesetzt, um von der Skalierbarkeit der Google Cloud zu profitieren.
    4. Die nun folgende Phase bezieht sich auf Test und Deployment des neuen Berechnungsmodells. Aktuell werden die Ergebnisse auf neue und produktive Daten angewandt und mit weiteren Testpersonen validiert. Erste Ergebnisse lassen darauf schließen, dass die neue Berechnungsgrundlage noch stärker der menschlichen Wahrnehmung entspricht, als es beim aktuellen Score der Fall ist. Demgemäß kann im Folgeschritt ein Deployment und eine programmatische Umsetzung des neuen Berechnungsmodells für Innoplexia-Kunden erfolgen.
    5. Darüber hinaus wurde eine neue Anwendung entwickelt, welche mehrfach täglich die Ergebnisseite von Google auf geänderte Layouts prüft. Sobald neue Einheiten hinzukommen oder die Anordnung bekannter Einheiten auf eine neuartige Weise geändert wird, werden Analysten von Innoplexia informiert. Sofern es sich hierbei tatsächlich um Änderungen in der Ergebnisdarstellung handelt, kann das Neuronale Netz mit neuen Trainingsdaten re-kalibriert werden. Das Modell ist somit sehr robust – auch für zukünftige Anpassungen durch Google.

Zusammenfassend lässt sich sagen, dass die Score-Berechnung durch den Einsatz Neuronaler Netze noch detailgenauer erfolgt als es bereits zuvor der Fall war. Anstelle der sieben bisher genutzten Kriterien kann die Sichtbarkeit nun durch mehr als doppelt so viele Kriterien konstituiert werden, deren Gewichtung nun direkt abhängig von der wahrgenommenen Sichtbarkeit bei Google sind. Ebenso ist es durch Einsatz der Neuronalen Netze möglich, sehr schnell auf neue Einheiten auf der Ergebnisseite von Google reagieren zu können, indem diese mit neuen Daten trainiert werden ohne den übrigen Prozess zu beeinflussen.

, , , , , , , ,

NEWSLETTER


Jetzt zum Newsletter anmelden und zum Platzhirsch werden!

NEWSLETTER


Jetzt zum Newsletter anmelden und zum Platzhirsch werden!

contact-section