Angemeldet bleiben
Passwort vergessen?
Jetzt registrieren!
logo
  • OMT-SUMMIT
  • Events
    • OMT 2025
      Online Marketing Wissen auf das nächste Level heben!
    • OMT-Toolkonferenz
      Die kostenfreie Toolkonferenz für Toolanbieter
    • OMT-Agency Day
      Der Treffpunkt für Agenturinhaber:innen
    • OMT KI-Konferenz
      Digital-Konferenz für Entscheider und Anwender
    • OMT-Clubtreffen
      Clubtreffen in vielen Städten der DACH-Region
    • Eventrezensionen
      Die wichtigsten Konferenzen 2025 mit Rezensionen
  • Lernen
    • Seminare
      Unsere Seminare für Entscheider:innen und Praktiker:innen
      • B2B SEO Seminar
      • E-Commerce SEO Seminar
      • Leadgenerierung im digitalen Zeitalter
      • KI in der Praxis: Erfolgsstrategien für den Mittelstand – Kostenloses Infomaterial
      • Online Marketing Strategie Seminar
      • SEO Seminar
      • SEO Seminar für Fortgeschrittene
      • SEO Seminar für Management
      • Strategisches CRM- & Lead-Management als Wachstumstreiber
      • Weitere Inhouse-Seminare >
    • Magazin
      Online Marketing Artikel von Experten
    • Webinare
      Kostenlose Online Marketing Webinare: Termine & Mediathek
      • SISTRIX Website Clinic
      • FRIDAY Insights
      • Affiliate Marketing Webinare
      • Content Marketing Webinare
      • Facebook Ads Webinare
      • Google Ads Webinare
      • Google Analytics Webinare
      • SEO Webinare
      • Social Media Webinare
    • Podcast
      Geballtes Online Marketing Wissen für die Ohren
      • E-Mail Marketing Podcasts
      • Google Ads Podcasts
      • Inbound Marketing Podcasts
      • Influencer Marketing Podcasts
      • Marketing Podcasts
      • Performance Marketing Podcasts
      • Suchmaschinenmarketing Podcasts
      • Social Media Podcasts
      • SEO Podcasts
    • Speaker Academy
      Der Speaker Workshop mit Bane Katic
    • Sales Academy
      Vertriebstraining mit Bane Katic & Mario Jung
  • Downloads
    • Templates
      Kostenlose Templates & Vorlagen
      • YouTube Templates
      • LinkedIn Templates
      • Instagram Templates
      • E-Mail Templates
    • eBooks
      Große Auswahl an kostenfreien Ebooks
    • (Print-)Magazin
      Alle OMT-Magazinausgaben zum Download
    • Leadmagneten
      Auswahl aller OMT-Leadmagnenten
    • Studentenarbeiten
      Studentenarbeiten zum Thema Online Marketing
    • Toolvergleiche
      Kostenfreie Tool- und Softwarevergleiche
  • Services
    • Freelancervermittlung
      Finde die passenden Freelancer für Dein Projekt
    • SEO Check
      Kostenlose Quick-Analyse Deiner Website
    • Engagement-Studie
      Starte in 2024 mit mehr Effektivität
  • Tools
  • Agenturfinder
Club-Login

    Inhaltsverzeichnis:

  • Was ist Information Retrieval?
  • Wofür wird Information Retrieval genutzt?
  • Verschiedene Information Retrieval Modelle
  • Wie funktioniert Information Retrieval?
  • Relevanz von Information Retrieval in der SEO
  • Fazit

Information Retrieval – SEO-Modelle einfach erklärt

Lesezeit: 9 Min | Autor: Nele Hilgenstock

Teile den Artikel
URL kopiert!

eBook: Lust auf mehr SEO-Tipps?

Strategien, KPI’s, Maßnahmen und Ziele, um Dein SEO messbar zu machen

Kostenlos downloaden
Information Retrieval – SEO-Modelle einfach erklärt

© UnderhilStudio/ shutterstock.com

Wie möchtest Du den Artikel konsumieren?

Was ist Information Retrieval?

Unter Information Retrieval versteht man eine Informationsrückgewinnung oder Informationsbeschaffung. Sie ist ein Bestandteil in der Informatik und der Computerlinguistik. Der Begriff Informationsrückgewinnung ist allerdings genauso wenig aussagekräftig wie der englische Begriff.

Vereinfacht gesagt umfasst Information Retrieval die Aufbereitung von Informationen, die man aus einer großen Datenmenge zurückbekommt. Beim Einsatz dieses Modells werden die Daten allerdings nicht nur sortiert, sondern auch gewichtet zurückgegeben.

NEU ❗ OMT-Magazin - Ausgabe #24 - JETZT HERUNTERLADEN
Die neuste OMT-Ausgabe jetzt exklusiv
NEU ❗ OMT-Magazin - Ausgabe #24 - JETZT HERUNTERLADEN

94 Seiten geballtes Online Marketing-Wissen ❗ 12 Experten beteiligt ✓ SEO ✓ E-Mail Marketing ✓ E-Commerce ✓ uvm.

Jetzt kostenfrei herunterladen!

Wofür wird Information Retrieval genutzt?

Beim letzten Satz wird Dir ganz sicher ein Stichwort in den Kopf gekommen sein, als ich von Sortierung und Gewichtung von Daten gesprochen habe: richtig, Google. Denn Suchmaschinen nutzen Information Retrieval für das Crawling und den Ranking-Prozess. Informationen werden beschafft, sortiert, gewichtet und in einer Reihenfolge zurückgegeben.

Verschiedene Information Retrieval Modelle

Wenn Du Dich als SEO mit Information Retrieval beschäftigst, laufen Dir früher oder später verschiedene Modelle über den Weg. Zu den wichtigsten gehören dabei:

  • Boolesches Modell/Boolesches Retrieval
    • einfache Form des Information Retrieval
    • es gibt kein Ranking der Informationen, lediglich ihre Indexierung
  • Linktopologische Modelle
    • es werden Verlinkungen zwischen den Dokumenten ausgewertet
    • ein klassisches Beispiel aus der SEO ist der PageRank
  • Modelle der Textstatistik
    • Terme innerhalb eines Textes werden geprüft und gewichtet
    • hierzu zählt die WDF*IDF Berechnung
  • Algebraische Modelle
    • word2vec als Vektorraummodell
    • mathematische Vektorräume werden genutzt, um Ähnlichkeiten und Beziehungen zwischen verschiedenen Themen und Wörtern zu untersuchen

Diese verschiedenen Retrieval Modelle haben unterschiedliche Aufgaben, schließen sich aber nicht gegenseitig aus. Häufig werden sie kombiniert angewandt, um Informationen zurückzugewinnen und diese Datenmengen systematisch zu sortieren.

Google als Retrieval System

Nicht nur diese Modelle zählen zum Information Retrieval System, auch Google selbst stellt ein Retrieval System dar. Dabei kann man den Suchvorgang und die Indexierung in verschiedene Stadien unterteilen.

Im ersten Stadium müssen die Informationen erst einmal in die Datenbank eingespeist werden. Im Falle von Google passiert das durch das Crawlen von Webseiten. Die Inhalte und Meta-Daten werden gespeichert und durch das stetige Crawling auf einem relativ aktuellen Stand gehalten. So ist auch gewährleistet, dass nicht nur alte Webseiten, sondern auch neue hinzugefügt werden. Schließlich gibt es Milliarden Webseiten im Internet und täglich kommen neue hinzu.

Das zweite Stadium ist dann die Ausgabe der gesuchten Informationen. Dies entspricht der klassischen Suchanfrage eines:einer User:in. Die Suchmaschine beschafft also die gewünschten Informationen anhand der Datenbank.

Aber was genau ist daran jetzt Information Retrieval?

Ein Beispiel:

In Deiner Bibliothek werden ständig Bücher abgegeben. Manche davon werden zurückgegeben, andere kommen neu in den Bestand. Bei den alten Büchern schaust Du genau hin, ob sich etwas am Zustand des Buches verändert hat oder ob beispielsweise Seiten herausgerissen wurden. Die neuen Bücher sind noch nicht im System hinterlegt und müssen erst einmal erfasst und in der Kartei angelegt werden. Egal, ob neu oder alt: die Bücher wandern, nachdem Du sie einmal gesehen hast, auf einen Bücherwagen. Hier herrscht Chaos und Du hast gerade auch keine Zeit, die Bücher nach Kategorien oder Bestseller Status zu sortieren.

Am Nachmittag bekommst Du Besuch. Gesucht wird ein Krimi, der im Norden spielt. Du weißt, wo so etwas im Regal steht und begleitest Deine:n Besucher:in dorthin. Angekommen ziehst Du fünf verschiedene Krimi-Romane mit dem gewünschten Setting aus dem Regal. Dabei fällt Dir ein, dass auch auf dem Bücherwagen irgendwo ein neuer Krimi liegt, der ebenfalls zum gesuchten Thema passt. Du holst alle Bücher zusammen und stellst sie Deinem:Deiner Besucher:in vor. Und zwar so, wie Du die Romane einordnen würdest. Du beginnst mit Deiner besten Empfehlung und endest mit einem Krimi-Roman, der die Wünsche des:der Leser:in erfüllt, aber eben nicht so gut wie der Erste.

Wie funktioniert Information Retrieval?

Genau wie im Beispiel arbeitet auch der Suchindex bei Google. Suchmaschinen erfassen zwar alle neuen Daten und Informationen anhand der Webseiten im Netz, allerdings ohne jegliche Ordnung oder Gewichtung. Die Gewichtung wird erst bei der Suchanfrage abgefragt.

Dabei wird die Relevanz der jeweiligen Webseiten zum gesuchten Begriff eingeordnet. Es entstehen die Rankings und schließlich auch die SERPs, die demder User:in zur Suchanfrage ausgespielt werden. Suchmaschinen beachten beim Information Retrieval auch die Art der Suchanfrage.

Sucht jemand nach Inhalten oder vielleicht eher nach Videos, Bildern oder Rezepten? Außerdem ist die Besonderheit bei Suchmaschinen als Information Retrieval System, dass keine konkrete Anfrage an eine Einzeldatei gestellt wird, sondern durch Machine Learning und AI sowie den Algorithmus alles rund um das Thema gesammelt und ausgespielt wird. Dabei bezieht die Suchmaschine auch Entitäten und Vektoren ein.

Grafik Information Retrieval System am Beispiel einer Suchmaschine

Grafik zur Veranschaulichung eines Information Retrieval Systems anhand einer Suchmaschine

Information Retrieval am Beispiel des Vektorraummodells word2vec

Suchmaschinen können Text verstehen. Allerdings vorrangig durch mathematische Berechnungen. Diese Berechnungen werden durch word2vec gelöst. Wie der Name sagt, konvertiert das Vektorraummodell Wörter in Vektoren.  Durch die Vektoren können die Nähe und Beziehung von Begriffen und Themen zueinander erkannt werden.

Word2vec spielt also auch im Information Retrieval eine Rolle, da bei einer Abfrage auch die Ähnlichkeit zwischen den Themen betrachtet wird. Die Suchanfrage, die ein:e User:in stellt, wird einem Vektorraum zugeteilt, in dem sich die verschiedenen Dokumente im Web zum Thema positionieren. Je spitzer jetzt der Winkel zur Suchanfrage ist, desto genauer trifft dieses Ergebnis die Suchintention und das Thema Deiner Suchanfrage.

Grarfik word2vec

Das Dokument A liegt am nächsten an der Suchanfrage, also dem Wort dran, und hat somit die höchste Ähnlichkeit im Vektorraum.

Dies ist also das beste Suchergebnis, wenn es um die reinen Informationen geht – alle anderen SEO-Faktoren einmal außen vor gelassen. Diese Berechnung einer thematischen Relevanz und Beziehung unter den Wörtern kann nur durch ein Vektorraummodell wie word2vec realisiert werden.

Erfüllung des Search Intents und eigene Themenrelevanz erhöhen

Google wird immer besser darin, zu verstehen, welche Themen zusammenhängen und was der:die Nutzer:in sehen will. Auch durch verschiedene Updates im Algorithmus wurde der Fokus auf Content als Rankingfaktor weiter gestärkt. So zum Beispiel durch BERT, MUM oder Hummingbird.

  • Hummingbird ist ein Algorithmus von Google und hat die Aufgabe, die semantische Suche voranzutreiben und Suchanfragen zu interpretieren. Durch Hummingbird wurden auch die großen Updates wie Penguin und Panda realisiert.
  • BERT ist die Weiterentwicklung von Hummingbird und nutzt Natural Language Processing (NLP) zur Interpretation von Suchanfragen und deren Kontext.
  • MUM beschäftigt sich mit der multimedialen Darstellung von Suchergebnissen und geht auf den Search Intent ein. Sucht ein:e User:in ein Rezept, werden Rezeptvorschläge und Kochvideos gemeinsam mit den normalen Testergebnissen ausgespielt.

Im August 2022 wurde außerdem das Helpful Content Update seitens Google, erst einmal nur für den englischsprachigen Raum, ausgerollt. Alle diese großen Veränderungen im Google Algorithmus stärken die Vermutung, dass Themenrelevanz, Search Intent und Informationsaufbereitung auf der eigenen Landingpage für das eigene Ranking enorm wichtig sind.

Aber wie finde ich passende Themen oder weiterführende Content Ideen, um die Ähnlichkeit zu einem bestimmten Keyword und damit die Relevanz zu erhöhen? Oftmals wird dazu neben einer klassischen Keyword-Recherche und Nutzungsfragen-Analyse auch das WDF*IDF-Modell herangezogen.

Was ist WDF*IDF?

Mit einer WDF*IDF Analyse kannst Du Suchterme identifizieren, die Du in Deinem Inhalt unterbringen solltest, um die Relevanz für Suchmaschinen zu steigern.

WDF*IDF, oft auch als TF*IDF bekannt, heißt ausgeschrieben “Within Document Frequency * Inverse (Document) Frequency” und beschreibt das Vorkommen bestimmter Wörter im eigenen Dokument verglichen mit allen Dokumenten im Web. Bei Information Retrieval geht es immer um eine Gewichtung. So auch bei der WDF*IDF.

WDF ist die “Within Document Frequency” und misst, wie oft ein Term in Deinem eigenen Text vorkommt. Der IDF Wert, also die “Inverse Document Frequency”, setzt die Anzahl aller bekannten Dokumente ins Verhältnis zur Zahl der Texte, die Deinen Term enthalten.

Kombiniert man beide Formeln, indem man sie multipliziert, erhält man eine Gewichtung für den Term anhand des eigenen Textes im Vergleich zu allen Dokumenten im Web, die Dein Keyword enthalten. Diese Gewichtung beschreibt nichts anderes als die Relevanz für das Fokus-Keyword, also das Hauptthema des Textes.

Screenshot aus dem Tool SEObility WDFIDF Tool

Screenshot SEObility WDF*IDF Tool zum Term “schuhe”

WDF*IDF vs. word2vec

Weiterhin zeigt die WDF*IDF-Analyse passende Keywords, beispielsweise rund um das Thema Schuhe an. Zum Beispiel Schuharten, wie Stiefel oder Sneaker, oder bekannte Marken, die erwähnt werden sollten.

Diese Keywords ergeben sich aus der Analyse aller möglichen Dokumente mit demselben Keyword im Text. Füllwörter oder Begriffe, die eine Doppelbedeutung beinhalten, können durch WDF*IDF nicht gefiltert werden. Dazu kommen eventuell Fremdmarken oder Konkurrenten, die zwar eine hohe Relevanz haben, in der Praxis auf Deiner eigenen Seite aber nichts zu suchen haben.

Anders als beim word2vec-Modell werden hier lediglich Anzahlen und Gewichtungen genutzt, ohne eine thematische Nähe oder Beziehung zwischen den Termen hinzuzuziehen. Bei der WDF*IDF handelt es sich also um eine rein mathematische Berechnung, die man nie zu 100 % auf User:innen orientierte Texte anwenden sollte.

Relevanz von Information Retrieval in der SEO

Durch Information Retrieval-Systeme und Modelle können User:innen das finden, was sie wollen, ohne dass sie ihre Suchanfrage exakt so eingeben müssen, wie sie auf einer Seite steht. Tools oder Modelle wie word2vec oder WDF*IDF können Dir also dabei helfen, Deine eigenen Informationen zu optimieren und im Ranking zu verbessern.

Die Suchintentionen und auch die Nähe zu verwandten Themen oder die holistische Abdeckung des Contents, stellen einen der wichtigsten Punkte in der Suchmaschinenoptimierung dar. Dennoch solltest Du natürlich andere SEO-Faktoren nicht außer Acht lassen, da der Ranking-Algorithmus weiterhin unbekannte Faktoren beinhaltet und sich durch Machine Learning und AI stetig verändern wird.

Fazit

Du kannst eine Waschmaschine nicht reparieren, wenn Du nicht weißt, wie die einzelnen Komponenten zusammengesetzt sind oder wie eine Waschmaschine überhaupt arbeitet. Genauso ist es auch in der Suchmaschinenoptimierung. Um Maßnahmen zu definieren und Optimierungsansätze zu erkennen, musst Du verstehen, wie eine Suchmaschine arbeitet.

Es ist also essenziell zu wissen, wie die Informationen auf meiner Website überhaupt von Google ausgelesen und verarbeitet werden. Die aktuelle Entwicklung hinsichtlich der verschiedenen genutzten Algorithmen von Google, lassen darauf schließen, dass die Relevanz Deines Contents ein essenzieller Rankingfaktor ist.

Wenn Du lernst, wie Du nützliche Inhalte zu den Suchanfragen Deiner Nutzer schreibst, lernst Du automatisch, wie Du für SEO schreiben musst. Denn nur die stumpfe Keyword-Einbindung und Wiedergabe von allgemeinen Informationen, ohne auf die semantische Suche, Entitäten und den Search Intent zu achten, bringt Dich langfristig nicht auf einen grünen SEO-Zweig.

omt logo

Diesen Artikel jetzt als Podcast anhören

Jetzt anhören auf: Spotify | Apple Podcast | Google Podcast

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren
Teile den Artikel
Wie ist Deine Meinung zu dem Thema? Wir freuen uns über Deinen

Diesen Artikel bewerten

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (Noch keine Bewertungen)

Willst Du im Online Marketing besser werden?

Mit unserem Newsletter schicken wir Dir regelmäßig unsere neusten Webinare und Magazinartikel zu den unterschiedlichen Online Marketing Themen. Mehr als 10.000 Abonnenten nutzen es bereits!

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren
Mehr Informationen

Nele Hilgenstock

Nele Hilgenstock

Nele Hilgenstock ist seit 2015 im SEO-Bereich unterwegs und konnte ihre Expertise und Erfahrung sowohl Inhouse als auch in Agenturen sammeln. Dabei betreut sie SEO-Projekte von Start-ups, über KMUs bis hin zu internationalen Konzernen strategisch und operativ.

Nele ist seit Ende 2020 fester Bestandteil der Online Marketing Agentur „wambo marketing“ aus Bielefeld und leitet als passionierte SEO-Managerin heute das SEO-Team der Agentur. Neben ihren branchenübergreifenden Kundenprojekten kümmert sie sich auch um die Schulung angehender SEOs.

Weitere interessante Artikel zum Thema:

KI-Tools im Offpage-SEO-Alltag OMT Magazin

KI-Tools im Offpage-SEO-Alltag Suchmaschinenoptimierung

Patricia Unfried 13 Min

Im Bereich des Suchmaschinenmarketings gehört Offpage-SEO dazu, um die langfristige Sichtbarkeit einer Website zu gewährleisten. Die schnellsten Ladezeiten, die tollsten Produkte und besten Ratgeber...
Pagination: Gestaltungsbeispiele & Best Practices OMT Magazin

Pagination: Gestaltungsbeispiele & Best Practices

Suchmaschinenoptimierung

Yvonne Westerbeck 14 Min

Erfolgreiche SEO-Optimierung mit TYPO3: Deine Website auf die nächste Stufe bringen OMT Magazin

Erfolgreiche SEO-Optimierung mit TYPO3: Deine Website auf die nächste...

Suchmaschinenoptimierung

Christian Jäger 10 Min

Search Experience Optimization: In 5 Schritten zur besseren Sucherfahrung OMT Magazin

Search Experience Optimization: In 5 Schritten zur besseren Sucherfahr...

Suchmaschinenoptimierung

Michael Möller 20 Min

Abonnieren
Benachrichtige mich bei
guest
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
https://www.reachx.de https://www.pure-host.de/ https://de.depositphotos.com/
Du bist hier: 
  • Home
  • »
  • Suchmaschinenoptimierung
  • »
  • Information Retrieval – SEO-Modelle einfach erklärt

Alles über…

  • Affiliate Marketing
  • Amazon Marketing
  • Amazon SEO
  • Content Marketing
  • Conversion Optimierung
  • Digital Marketing
  • Direktmarketing
  • E-Commerce
  • E-Mail-Marketing
  • Facebook Ads
  • Google Analytics
  • Google Ads (SEA)
  • Google My Business
  • Growth Hacking
  • Inbound Marketing
  • Influencer Marketing
  • Internet Marketing
  • Linkbuilding
  • LinkedIn Ads
  • Local SEO
  • Marketing
  • Online Marketing
  • Performance Marketing
  • Pinterest Marketing
  • Podcast Marketing
  • Public Relations (PR)
  • Social Media Marketing
  • Suchmaschinenmarketing (SEM)
  • Suchmaschinenoptimierung
  • TikTok Marketing
  • Video-Marketing
  • Webanalyse
  • Webdesign
  • WordPress

Sonstiges

  • OMT 2025
  • Toolkonferenz 2025
  • Agency Day 2025
  • OMT-Clubtreffen
  • Speaker Academy
  • Sales Academy
  • SEO Check
  • Download-Center
  • kostenfreie Online Marketing-Ebooks
  • Studentenarbeiten
  • Templates
  • Online Marketing Trends 2024
  • Alle Experten des OMT
  • OMT-Gehaltsumfrage
  • OMT-Club
  • OMT-Lexikon
  • Das OMT-Team
  • Jobs-Portal
  • Karriere beim OMT
  • Talentpool
  • Online Marketing Jobs
  • OMT-Botschafter
  • Newsletter

Rechtliches

  • AGB
  • Datenschutzerklärung
  • Impressum

OMT GmbH

Feldstraße 7
65719 Hofheim am Taunus
tel:06192 - 9626152
[email protected]
t

OMT-Bewertungen

https://www.omt.de/uploads/2021/01/OMT-Social-Bewertungen.png https://www.omt.de/uploads/2018/12/OMT-Google-Bewertungen-NEU-191223.jpg https://www.omt.de/uploads/2018/12/OMT-Facebook-Bewertungen-NEU-191223.jpg
wpDiscuz
0
0
Interessanter Artikel? Wir freuen uns über Deinen Kommentarx
()
x
| Antworten