Disallow: /*.html$ in robots.txt
von t3nf4n Rookie vor ca einem Jahr
Ich habe vor einigen Wochen CoolURL in Typo3 installiert. Um schnellstmöglichst die neuen URLs in Form der Verzeichnisstruktur indizieren zu lassen, habe ich in der robots.txt die Anweisung geschrieben, dass keine HTML-Dokumente mehr indiziert werden sollen. Nun teilt mir Webmaster Tools mit, dass über 200.000 HTML-Dokumente durch die robots.txt gesperrt wurden. Die besagte Seite hat jedoch nur ca. 1200 Seiten von denen ca. 750 mit der neuen URL indiziert wurden.
Habe ich hier etwas falsch gemacht? Hat noch jemand diese Erfahrung gemacht?
Nachträglich bearbeitet am 22.03.10 08:05
- Tags:
- sonstiges 338
4 Antworten
von no5251 Geek vor ca einem Jahr
Ist tt_news oder etwas ähnliches installiert? Jeder Eintrag erzeugt einen neuen URL.
Nachträglich bearbeitet am 18.03.10 11:12
Kommentare
-
vor ca einem Jahrt3nf4n: Nein tt_news ist nicht installiert. In den Webmaster Tools sind folgende Seiten in solcher Form deaktiviert bzw. durch dir robots.txt gesperrt:
seitenname.de/.extern/xyz.html
Ich bin mit meinem Latein am Ende. Mittlerweile sind mehr als 280.000 Seiten durch die robots.txt gesperrt. Obwohl nur etwa 1200 Seiten real existieren.
TEAM
2 Punkte
von macx Alpha Geek vor ca einem Jahr
Warum hast du die .html-Dateien denn gesperrt? Auch wenn du keine hast, lass sie doch einfach weiter zu. Letzendlich entscheidet doch dein CMS (hier TYPO3), welche Seite wie verlinkt ist. Denn durch die .htaccess sollten doch eh alle Zugriffe zentral ins TYPO3 führen.
Nachträglich bearbeitet am 22.03.10 11:08
Kommentare
-
vor ca einem Jahrt3nf4n: Im Grunde stimmt da ja auch. Ich wollte nur, dass nach der Umstellung die alten *.html-Einträge in den SERPs verschwinden und es zu einer schnelleren Indizierung kommt.
von ling Nerd vor ca einem Jahr
Mal ganz blöd gefragt:
- Ist dein Projekt auf eine Domain begrenzt? Mit oder ohne www?
- Sind die Seiten auch über index.php?id=whatever erreichbar?
- Hast du eine Sitemap angelegt?
Kommentare
-
vor ca einem Jahrt3nf4n: Nein, Umleitung von http:// auf http://www.. per 301
Ja, die Seiten sind per id erreichbar
Sitemap ist drin
Antwort schreiben
Um eine Antwort schreiben zu können, sollest du dich zuvor anmelden.







100.000+ Community-User. Mach mit!
Unser neuestes Video auf YouTube:
Weitere Videos findest in unserem t3n-YouTube-ChannelChrome für Android Beta und Gewinnspiel [TechnikLOAD 71]
Unsere RSS-Feeds
Wer steckt hinter t3n?
Welche Köpfe stecken hinter t3n und wie kannst du ihnen bei Facebook, Google+ oder Twitter folgen? Wirf doch mal einen Blick auf unsere Teamseite.
Das t3n-Team