Du hast deinen AdBlocker an?

Es wäre ein Traum, wenn du ihn für t3n.de deaktivierst. Wir zeigen dir gerne, wie das geht. Und natürlich erklären wir dir auch, warum uns das so wichtig ist. Digitales High-five, deine t3n-Redaktion

Software & Infrastruktur

NerdyData – Neue Suchmaschine für Quelltext

    NerdyData – Neue Suchmaschine für Quelltext

Klassische Suchmaschinen wie Google oder Bing durchsuchen das Internet nach Inhalten wie Texten, Bildern oder Videos – sie bleiben an der Oberfläche. NerdyData ist anders. Das Tool sucht quasi unter der Haube des Internets – nach Quellcode wie HTML oder JavaScript. Doch das Projekt kann noch viel mehr.

NerdyData – „A Search Engine for Source Code“

Keine Frage: Suchmaschinen wie Google, Bing oder Wolfram Alpha bieten deutlich mehr Funktionen, als nur nach Textstellen zu suchen. Mit ihnen kann man auch Links oder Bilder finden und nach Begriffen in einem bestimmten Kontext suchen. Was sie aber nicht können ist, in die Tiefen von Webseiten abzutauchen und direkt im Quelltext nach bestimmten Parametern zu fanden. NerdyData kann das – unter anderem. Und damit ist das noch frische Projekt der Entwickler Steven Sonnes und David Bielik etwas Besonderes.

Die fünf Hauptfunktionen von NerdyData. (Screenshot: NerdyData)
Die fünf Hauptfunktionen von NerdyData. (Screenshot: NerdyData)

NerdyData bietet fünf Hauptfunktionen: eine Quelltext-Suche, eine Vergleichssuche für Keywords, eine SEO-Suche, eine Backlink-Suche und einen Image-Locator. Während der Keyword-Vergleich eine deutliche abgespeckte Variante des Google-Keyword-Planners ist, die Backlink-Suche sowie der Image-Locator so auch in anderen Suchmaschinen möglich sind (beide bieten die Suche nach einer bestimmten URL oder dem Teil einer URL an), ist die eigentliche Quelltext-Suche etwas wirklich neues.

Mit ihr könnt ihr beispielsweise rausfinden, auf welchen Webseiten ein bestimmter Google-Analytics-Code eingesetzt wurde oder welche Seiten von ein und dem selben Analytics-Account gemanagt werden. Oder ihr könnt prüfen, ob das Code-Konstrukt, dass ihr in einem Webprojekt eingesetzt habt, von anderen kopiert wurde. Und mit der Suche nach bestimmten Meta-Elementen könnt ihr beispielsweise feststellen, welche Seiten den Google-Author-Rank schon eingesetzt haben oder wer schon dieses oder jenes neue HTML5-Element benutzt.

NerdyData – Suche nach SiteCatalyst-Accounts, Optimizely-IDs und AdSense-IDs

Das NerdyData-Suchergebnis für die JavaScript-Eigenschaft object.property. (Screenshot: NerdyData)
Das NerdyData-Suchergebnis für die JavaScript-Eigenschaft object.property. (Screenshot: NerdyData)

Darüber hinaus bietet NerdyData ungewöhnliche Funktionen wie die Suche nach Seiten mit einem bestimmten Farbschema oder einer Suche nach SiteCatalyst-Accounts, Optimizely-IDs und AdSense-IDs. All das jedoch ist im kostenlosen Basis-Account nicht enhalten. Der lässt lediglich einfache Suchanfragen zu und das auch nicht unbegrenzt. 200 Credit-Points bekommt jeder Basis-User bei der Anmeldung pro Monat – für eine Quelltext-Suche werden drei Creditpoints fällig, für einen Keyword-Vergleich zwei und für eine SEO-, Backlink- oder Bildersuche ein Creditpoint..

Wer mehr als die 200 Punkte braucht, wird von NerdyData zur Kasse gebeten. Für 99 US-Dollar im Monat bietet das Professional-Paket 1.200 Credits und 5.000 Ergebnisse pro Suche, das Enterprise-Paket mit 3.000 Credits und 100.000 Ergebnissen pro Suche kostet 149 US-Dollar im Monat.

Die ausgefeilteren Suchmöglichkeiten von NerdyData sind nur in den kostenpflichten Paketen enthalten. (Screenshot: NerdyData)
Die ausgefeilteren Suchmöglichkeiten von NerdyData sind nur in den kostenpflichten Paketen enthalten. (Screenshot: NerdyData)

Zwar geben die Macher von NerdyData an, schon mehr als 140 Millionen Seiten gecrawled zu haben – im Vergleich zu seit Jahren etablierten Anbietern aber fallen die Ergebnisse naturgemäß noch etwas dünn aus. Sollte das Projekt erfolgreich sein, und davon ist bei der Idee auszugehen, dürfte sich aber in überschaubarer Zeit ändern.

Dazu kommt, dass NerdyData mit einem relativ strikten Algorithmus arbeitet. „Für die meisten Begriffe nehmen wir eine exakte Suche vor und geben als Ergebnis Seiten aus, auf denen die Suchphrase genau so zu finden ist, wie sie in die Suchmaske eingegeben wurde“, heißt es in der Dokumentation von NerdyData. Das bedeutet zum Beispiel, dass die Suche nach „Michael Jordan“ nur Seiten ausspuckt, bei denen „Michael“ und „Jordan“ nebeneinander zu finden sind, nicht etwa Seiten, bei denen die beiden Begriffe einfach irgendwo auftauchen.

Die Suchergebnisse schließlich lassen sich entweder nach Relevanz oder Popularität filtern, wobei sich die Popularität auf den Traffic der gefundenen Seiten bezieht. Bei der Sortierung nach Relevanz spielt es beispielsweise eine Rolle, wie oft der gesuchte Begriff in der entsprechenden Seite gefunden wurde.

NerdyData bietet Export-Funktion und kostenlose Demo

Die Suchergebnisse von NerdyData lassen sich in vier Formaten exportieren. (Screnshot: NerdyData)
Die Suchergebnisse von NerdyData lassen sich in vier Formaten exportieren. (Screnshot: NerdyData)

Als Besonderheit bietet NerdyData auch eine Export-Funktion, die es Nutzern erlaubt, einzelne Suchergebnisse in verschiedenen Dateiformaten runterzuladen. Dabei stehen JSON, CSV, XML und Plain Text zur Verfügung.

Wer NerdyData erst mal ausprobieren will, findet unter nerdydata.com eine kostenlose Demo der Suchmaschine, die verschiedenen Preis-Modelle findet ihr hier.

Weiterführende Links zum Thema „Web-Entwicklung“

Finde einen Job, den du liebst

9 Reaktionen
Michael
Michael

Spannende Sache! Aber so richtig scheint die Seite noch nicht zu funktioneren, oder? Ist das Projekt noch Beta? Zumindest in diesem Blogartikel ( http://www.seo-handbuch.de/suchmaschinen-suchmaschinenoptimierung/nerdydata-die-neue-quellcode-suchmaschine ) wird berichtet, dass NerdyData wohl noch einige Zicken macht...

Antworten
nazeK
nazeK

Endlich leichter veraltete Installationen von Wordpress, Wbb oder anderen Scripten finden ;)

Antworten
borgdrone
borgdrone

bitte :)
toller Artikel

Antworten
Florian Blaschke

Gefixt, danke für den Hinweis!

Antworten
Florian Blaschke

Also, bei mir läuft die Seite noch ...

Antworten
borgdrone
borgdrone

die sind gerade n bissl down?

Antworten

Melde dich mit deinem t3n-Account an oder fülle die unteren Felder aus.

Abbrechen