Stell Dir vor, Du baust ein riesiges, hochmodernes Einkaufszentrum mit fantastischen Produkten. Doch es gibt ein Problem: Es existieren keine Straßenschilder, die dorthin führen, und auf keiner Landkarte ist das Gebäude verzeichnet. Genau dieses Szenario droht Deiner Website in der digitalen Welt, wenn Suchmaschinen Deine Inhalte nicht finden können. Hier kommt die XML-Sitemap ins Spiel.
Als SEO-Experten wissen wir: Großartiger Content nützt wenig, wenn der Googlebot ihn nicht entdeckt. Eine Sitemap ist die direkte Kommunikationsleitung zwischen Deiner Website und den Suchmaschinen. Sie stellt sicher, dass alle relevanten URLs effizient gecrawlt und indexiert werden.
In diesem umfassenden Ratgeber zeigen wir Dir, wie Du eine XML-Sitemap erstellen kannst, welche Best Practices Du zwingend beachten musst, wie die Einbindung in WordPress funktioniert und wie Du die Datei fehlerfrei in der Google Search Console einreichen kannst.
Was ist eine XML-Sitemap überhaupt?
Eine XML-Sitemap ist im Grunde eine maschinenlesbare Inhaltsverzeichnis-Datei Deiner Website. Das Kürzel XML steht für eXtensible Markup Language. Im Gegensatz zu HTML, das dafür entwickelt wurde, Daten für menschliche User optisch ansprechend im Browser darzustellen, dient XML ausschließlich der Strukturierung von Daten für Maschinen und Software-Programme.
Wenn der Googlebot (oder der Crawler einer anderen Suchmaschine wie Bing) Deine Website besucht, sucht er nach dieser Datei. Sie liefert ihm eine präzise Liste aller Seiten, Beiträge, Bilder oder Videos, die Du als wichtig erachtest. Anstatt sich mühsam von Link zu Link hangeln zu müssen, bekommt der Crawler einen direkten Bauplan der Website überreicht.
Neben der reinen URL liefert die Sitemap zusätzliche Metadaten, die für das Crawling wertvoll sind – allen voran das Datum der letzten Änderung. So weiß die Suchmaschine sofort, ob sich ein erneuter Besuch einer bestimmten Seite lohnt, weil der Content aktualisiert wurde.
XML-Sitemap vs. HTML-Sitemap: Wo liegt der Unterschied?
In der SEO-Welt tauchen häufig zwei Begriffe auf: die XML-Sitemap und die HTML-Sitemap. Obwohl beide das Wort “Sitemap” im Namen tragen, erfüllen sie völlig unterschiedliche Zwecke und richten sich an komplett andere Zielgruppen. Wir empfehlen in der Regel, beide Varianten zu nutzen, da sie sich perfekt ergänzen.
| Merkmal | XML-Sitemap | HTML-Sitemap |
|---|---|---|
| Zielgruppe | Suchmaschinen-Crawler (Googlebot, Bingbot etc.) | Menschliche Website-Besucher (User) |
| Format | Strukturierter XML-Code (maschinenlesbar) | Visuelle HTML-Webseite (lesbar im Browser) |
| Hauptzweck | Sicherstellung eines vollständigen und effizienten Crawlings aller relevanten URLs. | Navigationshilfe für User, um bestimmte Unterseiten oder Kategorien schnell zu finden. |
| Design & Optik | Kein Design. Reiner Textcode mit Tags. | An das Corporate Design der Website angepasst (oft als strukturierte Liste im Footer verlinkt). |
| Sichtbarkeit | Unsichtbar für den normalen User (meist unter /sitemap.xml erreichbar). | Öffentlich zugängliche Unterseite der Website. |
Warum ist eine Sitemap für SEO und Crawling so wichtig? (Vorteile)
Google ist zwar extrem gut darin, Links im Internet zu folgen und so neue Seiten zu entdecken. Dennoch gibt es zahlreiche Szenarien, in denen eine XML-Sitemap nicht nur ein “Nice-to-have”, sondern ein absoluter Ranking-Faktor im Sinne der technischen SEO-Grundausstattung ist.
1. Schnelleres Entdecken neuer Inhalte (Quick-Wins)
Wenn Du einen neuen Blog-Artikel veröffentlichst oder eine neue Produktseite online stellst, möchtest Du, dass diese so schnell wie möglich in den Suchergebnissen auftaucht. Ohne Sitemap kann es Tage oder Wochen dauern, bis der Crawler zufällig über einen internen Link auf die neue Seite stößt. Mit einer dynamischen XML-Sitemap wird Google sofort über die neue URL informiert.
2. Unterstützung für große und komplexe Websites
Bei Websites mit Tausenden von Unterseiten (z. B. große E-Commerce-Shops oder Nachrichtenportale) verliert selbst der beste Crawler irgendwann den Faden. Das sogenannte “Crawl-Budget” (die Zeit und Ressourcen, die Google Deiner Seite widmet) ist begrenzt. Eine saubere XML-Sitemap priorisiert das Crawling und stellt sicher, dass tief verschachtelte Seiten nicht übersehen werden.
3. Lösung für schwache interne Verlinkung
Ideal ist es, wenn jede Unterseite Deiner Website durch interne Links gut erreichbar ist. In der Praxis gibt es jedoch oft “verwaiste Seiten” (Orphan Pages), auf die kein interner Link zeigt. Ohne XML-Sitemap wären diese Seiten für Suchmaschinen praktisch unsichtbar.
4. Effizientes Crawling durch “Last-Modified”
Durch die Angabe des letzten Änderungsdatums in der Sitemap teilst Du Google mit, welche Seiten kürzlich überarbeitet wurden. Das spart Crawl-Budget, da Google unveränderte Seiten seltener crawlen muss und sich stattdessen auf Deine frischen, aktualisierten Inhalte konzentrieren kann.
Welche Arten von Sitemaps gibt es?
Wenn wir von “der” Sitemap sprechen, meinen wir meist die Standard-XML-Sitemap für Webseiten. Je nach Art Deines Contents gibt es jedoch spezialisierte Formate, die Suchmaschinen helfen, bestimmte Medienformate besser zu verstehen und in speziellen Suchergebnissen (wie der Bildersuche oder Google News) auszuspielen.
Die Standard XML-Sitemap
Dies ist die Basis-Version. Sie enthält alle regulären HTML-Seiten Deiner Website, also Startseite, Kategorieseiten, Blog-Beiträge, Produktseiten und Impressum. Sie ist für 99 % aller Websites absolut ausreichend und der wichtigste erste Schritt.
Bilder-Sitemap
Bilder sind ein enorm wichtiger Traffic-Kanal (Stichwort: Google Bildersuche). Eine Bilder-Sitemap liefert Google zusätzliche Informationen über die auf Deiner Website eingebundenen Grafiken und Fotos. Du kannst hier Details wie den Bildtitel, die Lizenz oder den geografischen Standort des Bildes hinterlegen. Oft werden Bilder-Informationen heute aber auch direkt in die Standard-Sitemap integriert.
Video-Sitemap
Wenn Du viele eigene Videos hostest (nicht nur eingebettete YouTube-Videos), ist eine Video-Sitemap Gold wert. Sie hilft Google, die Videos in der Video-Suche zu indexieren. Du kannst hier Metadaten wie die Laufzeit des Videos, ein Vorschaubild (Thumbnail), eine Beschreibung und Altersfreigaben definieren. Rich-Media-Inhalte werden so deutlich besser auffindbar.
Google News-Sitemap
Für journalistische Portale und Nachrichten-Websites ist diese Variante Pflicht. Eine Google News-Sitemap darf nur Artikel enthalten, die in den letzten 48 Stunden veröffentlicht wurden. Sie ermöglicht eine blitzschnelle Indexierung, die notwendig ist, um in den “Top Stories” (Schlagzeilen) der Google-Suche zu erscheinen.
Die Anatomie einer XML-Sitemap: Welche Informationen stecken drin?
Um zu verstehen, wie man eine XML-Sitemap optimal nutzt, werfen wir einen kurzen Blick “unter die Haube”. Eine typische Sitemap-Datei besteht aus bestimmten XML-Tags. Ein einfacher Eintrag für eine einzelne URL sieht so aus:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.deinewebsite.de/beispiel-seite/</loc>
<lastmod>2023-10-25</lastmod>
</url>
</urlset>
Hier ist die Erklärung der wichtigsten Tags:
<urlset>: Dies ist der Rahmen der gesamten Datei. Er öffnet und schließt die Sitemap und verweist auf den offiziellen Protokoll-Standard.<url>: Der Container für jeden einzelnen Seiten-Eintrag.<loc>(Location): Die absolute, vollständige URL der Seite (inklusive https://). Dies ist die einzige Information, die zwingend erforderlich ist.<lastmod>(Last Modified): Das Datum (im Format YYYY-MM-DD), an dem der Inhalt der Seite zuletzt signifikant geändert wurde. Dies ist für Google heute das wichtigste Meta-Signal in der Sitemap.
Achtung: Diese Tags sind veraltet!
Wenn Du Dir ältere Sitemaps ansiehst, findest Du oft noch die Tags <changefreq> (Änderungshäufigkeit, z. B. “weekly”) und <priority> (Wichtigkeit der Seite von 0.0 bis 1.0).
Wichtig: Google hat offiziell bestätigt (unter anderem durch John Mueller), dass diese beiden Werte mittlerweile komplett ignoriert werden. Google verlässt sich lieber auf eigene Algorithmen, um die Wichtigkeit einer Seite zu bewerten. Du kannst diese Tags beim Sitemap erstellen also getrost weglassen oder ignorieren, wenn Dein Tool sie noch generiert.
Best Practices: Was gehört in die Sitemap – und was nicht?
Ein häufiger Fehler, den wir bei Website-Audits sehen, ist die Annahme: “Je mehr URLs in der Sitemap, desto besser.” Das ist falsch. Eine XML-Sitemap ist kein Mülleimer für jede jemals generierte URL, sondern eine exklusive VIP-Gästeliste für Google. Wenn Du Google eine Liste mit fehlerhaften oder irrelevanten URLs präsentierst, verlierst Du das Vertrauen des Crawlers (Crawl-Budget-Verschwendung).
Diese URLs gehören in die XML-Sitemap:
- Alle Seiten, die Du aktiv in den Google-Suchergebnissen sehen möchtest (Index-Seiten).
- Seiten, die mit einem Statuscode 200 (OK) antworten.
- Die jeweils kanonische Version einer Seite (Canonical URL).
Diese URLs musst Du zwingend ausschließen:
- Seiten mit “noindex”-Tag: Wenn Du per Meta-Robots-Tag sagst “Bitte nicht indexieren”, hat die URL in der Sitemap nichts verloren. Das sendet widersprüchliche Signale an Google.
- 404-Fehlerseiten (Not Found): Gelöschte Seiten müssen aus der Sitemap verschwinden.
- Weiterleitungen (301, 302): Nimm nur das finale Ziel der Weiterleitung in die Sitemap auf, nicht die alte URL, die weiterleitet.
- Paginierungs-Seiten: Seite 2, 3, 4 Deines Blogs oder Deiner Kategorie gehören in der Regel nicht in die Sitemap. Die Hauptkategorie reicht aus.
- Parameter-URLs: URLs mit Session-IDs, Sortierparametern (z. B. ?sort=price) oder Filter-URLs erzeugen Duplicate Content und gehören nicht in die XML-Sitemap.
- Passwortgeschützte Bereiche: Inhalte hinter einer Paywall oder einem Login kann Google ohnehin nicht crawlen.
Die offiziellen Google-Limits und die Sitemap-Indexdatei
Suchmaschinen haben klare technische Vorgaben, wie groß eine Sitemap sein darf, um die Server beim Crawling nicht zu überlasten. Die offiziellen Limits von Google lauten:
- Maximal 50.000 URLs pro einzelner Sitemap-Datei.
- Maximal 50 MB Dateigröße (unkomprimiert).
Was passiert nun, wenn Du einen riesigen Online-Shop mit 150.000 Produkten betreibst? Hier kommt die sogenannte Sitemap-Indexdatei (oft sitemap_index.xml genannt) zum Einsatz.
Eine Indexdatei ist im Grunde eine Sitemap für Sitemaps. Anstatt einzelne URLs aufzulisten, verlinkt die Indexdatei auf weitere Sitemaps (z. B. sitemap-produkte-1.xml , sitemap-produkte-2.xml , sitemap-blog.xml). Wenn Du diese eine Indexdatei in der Google Search Console einreichst, folgt Google automatisch allen darin enthaltenen Unter-Sitemaps. Moderne CMS und Plugins splitten große Sitemaps vollautomatisch auf, sobald das Limit erreicht wird.
XML-Sitemap erstellen: So geht’s in der Praxis
Die gute Nachricht: Die Zeiten, in denen man XML-Dateien mühsam per Hand programmieren musste, sind lange vorbei. Heute gibt es für jedes System automatisierte Lösungen. Wir zeigen Dir die gängigsten Methoden.
1. WordPress-Sitemap erstellen
WordPress ist das weltweit meistgenutzte CMS. Zwar bietet WordPress seit Version 5.5 eine integrierte Basis-Sitemap (unter deinedomain.de/wp-sitemap.xml), diese ist für professionelles SEO jedoch oft zu unflexibel, da man URLs nur schwer ausschließen kann. Wir empfehlen daher die Nutzung etablierter SEO-Plugins.
Variante A: Mit Yoast SEO
Yoast SEO ist der Klassiker unter den WordPress-Plugins. Die Sitemap-Erstellung ist hier standardmäßig aktiviert.
- Installiere und aktiviere das Plugin “Yoast SEO”.
- Gehe im WordPress-Dashboard links auf Yoast SEO > Einstellungen.
- Scrolle zum Bereich Allgemein > Website-Funktionen.
- Stelle sicher, dass der Schalter bei “XML-Sitemaps” auf “An” steht.
- Klicke auf “Änderungen speichern”.
- Du findest Deine Sitemap nun unter deinedomain.de/sitemap_index.xml.
- Pro-Tipp: Unter den Einstellungen für “Inhaltstypen” kannst Du genau definieren, ob z. B. bestimmte Kategorien oder Schlagwörter in der Sitemap erscheinen sollen oder nicht.
Variante B: Mit Rank Math
Rank Math ist die moderne und sehr beliebte Alternative zu Yoast.
- Installiere und aktiviere “Rank Math SEO”.
- Gehe im Dashboard auf Rank Math > Sitemap-Einstellungen.
- Hier kannst Du die Funktion global aktivieren.
- Im linken Menü kannst Du nun detailliert durchgehen, welche Inhaltstypen (Beiträge, Seiten, Produkte) inkludiert werden sollen.
- Rank Math schließt Noindex-Seiten vollautomatisch aus der Sitemap aus.
- Auch hier liegt die Datei standardmäßig unter deinedomain.de/sitemap_index.xml.
2. Sitemaps in anderen CMS (Shopify, Wix, TYPO3)
Fast alle modernen Baukästen und Shop-Systeme nehmen Dir die Arbeit ab:
- Shopify: Generiert die Sitemap automatisch. Du findest sie immer unter deinshop.de/sitemap.xml. Sie aktualisiert sich von selbst, wenn Du Produkte hinzufügst.
- Wix: Auch Wix erstellt automatische Sitemaps, erreichbar unter deinewebsite.de/sitemap.xml.
- TYPO3 / Shopware: Hierfür gibt es in der Regel dedizierte SEO-Erweiterungen, die konfiguriert werden müssen, um eine dynamische Sitemap zu generieren.
3. Online-Tools und Sitemap-Generatoren
Wenn Du eine statische HTML-Website ohne CMS betreibst, musst Du die Sitemap von externen Tools generieren lassen. Diese Tools crawlen Deine Website und spucken am Ende eine fertige XML-Datei aus, die Du auf Deinen Server (ins Hauptverzeichnis) hochladen musst.
- XML-Sitemaps.com: Ein sehr bekannter Online-Generator. Du gibst einfach Deine URL ein, wartest kurz, und kannst die Datei herunterladen. Kostenlos für Websites mit bis zu 500 Unterseiten.
- Screaming Frog SEO Spider: Das Profi-Tool für Desktop-PCs. Du kannst Deine komplette Website crawlen und über das Menü Sitemaps > XML Sitemap eine hochgradig individualisierte Datei exportieren. Perfekt, um gezielt Parameter oder Noindex-Seiten auszuschließen.
Nachteil dieser Methode: Die Sitemap ist statisch. Wenn Du eine neue Seite erstellst, musst Du die Sitemap neu generieren und manuell per FTP auf Deinen Server laden.
4. Manuelle Erstellung
Für einen One-Pager oder eine winzige Website mit drei Unterseiten kannst Du die XML-Datei theoretisch in einem einfachen Texteditor (wie Notepad) selbst schreiben, als sitemap.xml speichern und hochladen. Für alles, was darüber hinausgeht, ist dies jedoch zu fehleranfällig und ineffizient.
Internationales SEO: Mehrsprachige Websites und hreflang
Wenn Du Deine Website in mehreren Sprachen anbietest (z. B. Deutsch und Englisch), musst Du Google mitteilen, welche Version für welches Land oder welche Sprache gedacht ist. Dies geschieht über das sogenannte hreflang-Attribut.
Anstatt dieses Attribut mühsam in den HTML-Code jeder einzelnen Seite einzubauen, kannst Du die Sprachzuordnungen auch extrem elegant und zentral in Deiner XML-Sitemap abbilden. Google unterstützt diese Methode ausdrücklich.
Dabei wird innerhalb des <url>-Tags der jeweiligen Seite auf alle alternativen Sprachversionen verwiesen. Das reduziert den Code-Overhead im HTML-Dokument und macht das Crawling für internationale Setups deutlich effizienter. Plugins wie WPML oder Polylang für WordPress integrieren diese hreflang-Tags oft automatisch in die generierte Sitemap.
XML-Sitemap bei Google einreichen: Schritt-für-Schritt-Anleitung
Du hast Deine Sitemap erfolgreich erstellt. Großartig! Aber woher weiß Google nun, wo sie zu finden ist? Zwar sucht der Googlebot oft standardmäßig nach URLs wie /sitemap.xml , aber Du solltest nichts dem Zufall überlassen. Das aktive Einreichen bei Google ist ein entscheidender Schritt für Dein SEO.
Dafür nutzen wir die Google Search Console (GSC) – das wichtigste kostenlose SEO-Tool von Google.
Schritt 1: URL der Sitemap kopieren
Finde heraus, unter welcher URL Deine Sitemap erreichbar ist (meist https://www.deinedomain.de/sitemap_index.xml oder /sitemap.xml). Rufe die URL im Browser auf, um zu testen, ob sie wirklich existiert und lädt.
Schritt 2: Google Search Console öffnen
Logge Dich in die Google Search Console ein und wähle oben links die entsprechende “Property” (Deine Website) aus.
Schritt 3: Zum Bereich “Sitemaps” navigieren
Klicke im linken Seitenmenü unter dem Reiter “Indexierung” auf den Menüpunkt “Sitemaps”.
Schritt 4: Sitemap eintragen
Im oberen Bereich siehst Du das Feld “Neue Sitemap hinzufügen”. Deine Haupt-Domain steht dort bereits. Trage in das leere Feld nur noch den Dateinamen ein (z. B. sitemap_index.xml) und klicke auf “Senden”.
Schritt 5: Status überprüfen
Google wird die Datei nun abrufen. Im Bereich “Eingereichte Sitemaps” solltest Du nach kurzer Zeit (manchmal dauert es ein paar Minuten und ein Neuladen der Seite) unter dem Punkt “Status” ein grünes “Erfolgreich” sehen. Zudem zeigt Dir Google an, wie viele URLs in der Sitemap gefunden wurden.
Zusatz-Tipp: Die robots.txt nutzen
Zusätzlich zur Search Console solltest Du den Link zu Deiner Sitemap auch in Deiner robots.txt-Datei hinterlegen. Diese Datei ist das Erste, was Crawler aufrufen, wenn sie Deine Website besuchen. Füge einfach folgende Zeile ganz am Ende Deiner robots.txt ein:
Sitemap: https://www.deinedomain.de/sitemap_index.xml
So stellst Du sicher, dass auch andere Suchmaschinen wie Bing, Yahoo oder DuckDuckGo Deine Sitemap sofort finden.
Fehlerbehebung: Wenn die Google Search Console meckert
Manchmal läuft nicht alles glatt und die Search Console zeigt statt einem grünen “Erfolgreich” eine rote Fehlermeldung an. Hier sind die häufigsten Probleme und wie wir sie lösen:
Fehler: “Sitemap konnte nicht gelesen werden”
Dieser Fehler tritt oft auf, wenn die URL falsch getippt wurde oder die Sitemap-Datei durch ein Caching-Plugin blockiert wird.
Lösung: Rufe die Sitemap-URL im Inkognito-Modus Deines Browsers auf. Wenn sie dort nicht lädt, prüfe die Einstellungen Deines SEO-Plugins. Leere zudem den Cache Deiner Website.
Fehler: “Eingereichte URL hat ein Crawl-Problem” / “URL nicht gefunden (404)”
Das bedeutet, dass sich in Deiner Sitemap URLs befinden, die nicht mehr existieren (Statuscode 404) oder für den Googlebot aus anderen Gründen nicht erreichbar sind.
Lösung: Bereinige Deine Sitemap. Entferne gelöschte Seiten oder richte korrekte 301-Weiterleitungen auf relevante neue Inhalte ein. Wenn Du ein CMS nutzt, aktualisiere die Sitemap-Einstellungen oder leere den Cache Deiner Website, damit die veralteten URLs aus der generierten Datei verschwinden.
Fehler: “Eingereichte URL als ‘noindex’ markiert”
Du hast eine URL in der Sitemap eingereicht, die gleichzeitig im HTML-Code per Meta-Robots-Tag auf “noindex” steht. Das sendet extrem widersprüchliche Signale an Suchmaschinen: Die Sitemap sagt “Bitte crawlen und indexieren”, der Meta-Tag sagt “Bitte ignorieren”.
Lösung: Du musst Dich entscheiden. Soll die Seite in den Index? Dann entferne das “noindex”-Tag. Soll sie nicht in den Index? Dann schließe die URL zwingend aus Deiner XML-Sitemap aus.
Spezialisierte Sitemaps: Bilder, Videos und News
Neben der klassischen XML-Sitemap für normale Webseiten gibt es spezielle Formate, die Suchmaschinen helfen, bestimmte Medientypen besser zu verstehen und in den vertikalen Suchen (wie der Google Bildersuche, der Videosuche oder Google News) prominenter auszuspielen.
- Bilder-Sitemaps: Sie helfen Google, Bilder zu finden, die sonst schwer zu crawlen sind (z. B. Bilder, die dynamisch per JavaScript geladen werden). Du kannst hier zusätzliche Metadaten wie Bildtitel, Lizenzinformationen und den geografischen Standort hinterlegen.
- Video-Sitemaps: Wenn Videos ein zentraler Bestandteil Deiner Content-Strategie sind, ist eine Video-Sitemap wärmstens zu empfehlen. Hier kannst Du Google wichtige Details wie die Dauer des Videos, ein Thumbnail-Bild, die Altersfreigabe und eine kurze Beschreibung übermitteln. Das erhöht die Chance auf sogenannte Rich Snippets in den Suchergebnissen enorm.
- News-Sitemaps: Betreibst Du ein Nachrichtenportal oder einen journalistischen Blog und möchtest in Google News erscheinen? Eine News-Sitemap ist hierfür essenziell. Sie darf nur Artikel enthalten, die in den letzten 48 Stunden veröffentlicht wurden, und muss spezifische Tags wie den Namen der Publikation und die Sprache enthalten.
Fazit: Ein absolutes Muss für Dein SEO
Das Erstellen und Einreichen einer XML-Sitemap ist einer der effektivsten Quick-Wins in der Suchmaschinenoptimierung. Sie garantiert zwar nicht automatisch, dass alle Deine Seiten sofort auf Platz 1 ranken, aber sie stellt sicher, dass Google Deine Inhalte überhaupt erst findet, ihre Struktur versteht und effizient verarbeitet.
Dank moderner Content-Management-Systeme und leistungsstarker SEO-Plugins ist dieser Prozess heute weitgehend automatisiert und erfordert keine Programmierkenntnisse mehr. Richte Deine Sitemap einmal sauber ein, reiche sie in der Google Search Console ein und prüfe danach in regelmäßigen Abständen, ob Fehler gemeldet werden. So nutzt Du Dein Crawl-Budget optimal aus und legst das technische Fundament für mehr organischen Traffic.