t3n News Entwicklung

Hässlich geklaut bei t3n.de oder: Wie man Content-Diebstahl kreativ für sich nutzen kann

Hässlich geklaut bei t3n.de oder: Wie man Content-Diebstahl kreativ für sich nutzen kann

Leider werden unsere t3n.de-Artikel oft komplett von anderen Internetseiten ungefragt übernommen. Im Prinzip ein schönes Zeichen, dass unsere Website ein gewisses Maß an Relevanz erreicht hat und die Inhalte so gut gefallen, dass man sie komplett für sich nutzen möchte. Als Publisher mit Qualitätsanspruch und Suchmaschinenliebhaber, aber auch in der Verantwortung gegenüber unseren Autoren, wollen wir jedoch gerne selbst entscheiden wo unsere Inhalte online sind.

Hässlich geklaut bei t3n.de oder: Wie man Content-Diebstahl kreativ für sich nutzen kann

Während sich manche Content-Diebe wenigstens noch die Mühe machen, ihre Spuren zu verwischen, indem sie Texte minimal verändern oder Bilder austauschen, gibt es auch immer häufiger den Fall, dass unsere Artikel einfach maschinell, automatisiert und unverändert übernommen werden. Die betreffenden Seiten sind oft Content-Farmen, die unsere Inhalte für SEO-Zwecke nutzen wollen oder einfach „unbedarfte Anwender“, die es als „ok“ ansehen, mal eben Inhalte großer Websites zu kopieren und bei sich online zu stellen.

Mac is sexy: Eine von vielen Content-Scraping-Seiten, die unsere Inhalte kopieren. (Screenshot: mac-is.sexy)
Mac is sexy: Eine von vielen Content-Scraping-Seiten, die unsere Inhalte kopieren. (Screenshot: mac-is.sexy)

Natürlich beobachten wir diese Fälle sehr genau und scannen das Netz regelmäßig nach neuen Vorfällen. In den meisten Fällen empfinden wir es allerdings eher als Overhead, rechtliche Schritte gegen die Betreiber einzuleiten. Solche Verfahren sind uns zu teuer und verschlingen zu viele Ressourcen.

Einfach akzeptieren wollen wir dieses Verhalten aber auch nicht. Abgesehen davon, dass wir jeden Klon-Website-Betreiber natürlich zunächst kontaktieren und ihn freundlich, aber bestimmt bitten, den Content-Klau einzustellen, haben wir uns jetzt noch eine kleine, technische Sofortmaßnahme ausgedacht.

Wir lassen unseren Webserver möglichst hässliche Animated GIFs ausliefern

Wenn Content-Diebe unsere Bilder auf ihren Seiten nur verlinken und nicht auf ihre eigenen Server kopieren, können wir mittels der Referer-Angabe im HTTP-Header herausfinden, von welcher URL ein HTTP-Request stammt. Kommt die Anfrage von einer uns bekannten Content-Farm, können wir über unseren nginx-Webserver alle Bilddateien automatisch durch eine andere Datei ersetzen. So lassen wir zukünftig alle Bilddatei-Anfragen von Seiten auf unserer internen Blacklist mit diesem Katzen-GIF-Diebstahl-Hinweis ersetzen. Das Ergebnis lässt sich in freier Wildbahn dann hier betrachten.

Content-Diebe kriegen von uns dieses animierte GIF ausgeliefert, wenn sie Bilder von unserem Server abfragen. (Bild: t3n/Cat-Content: omgcatsinspace.com)

Wie funktioniert das technisch?

Das Prinzip sich vor Hotlinking zu schützen, ist nichts Neues. Wir sind da mit t3n.de eher locker unterwegs, weil wir es nicht schlimm finden, wenn wir zum Beispiel in einem Newsletter direkt eingebunden werden oder ein Tool unsere Inhalte auf einer externen Seite rendert. Trotzdem kann man für bestimmte „referer“ (das ist ein HTTP-Header mit der „Aufruf-Domain“, den jeder gängige Browser mitschickt) bestimmte Aktionen starten. Interessant ist das besonders als schnelle „Sofort-Maßnahme“, wenn der Betreiber einer Website nicht gut zu ermitteln ist.

Für Bilder, die auf einer Seite auf den fiktiven Content-Klau-Domains „katzen-sind-toll.de“ oder „ich-klaue-content.de“ eingebettet werden, könnte man im nginx zum Beispiel folgende Regel definieren:

#nginx configuration
if ($http_referer ~* (katzen-sind-toll.de|ich-klaue-content.de)) {
   rewrite ^ /images/anticontentklau.gif;
}

Anstelle des Inhalts wird dann das Animated GIF anticontentklau.gif ausgeliefert. Das kann man dann natürlich noch auf bestimmte Dateiendungen beschränken und so weiter. Natürlich gibt es auch hier aus Sicht des Content-Diebes wieder Möglichkeiten, unseren Mini-Diebstahlschutz zu umgehen, aber das Animated GIF dürfte schon hässlich genug sein, um eine gewisse Wirkung zu zeigen.

Update vom 4. Juli 2014: Kurz nach Erscheinen des Artikels ist mac-is.sexy offline gegangen. Das mit der gewissen Wirkung scheint sich also zu bewahrheiten.

Wie seht ihr das? Ist unser Animated GIF hässlich genug? Wie geht ihr mit Content-Klau um?

Newsletter

Bleibe immer up-to-date. Sichere dir deinen Wissensvorsprung!

Vorheriger Artikel Zurück zur Startseite Nächster Artikel
49 Antworten
  1. von Aaron am 04.07.2014 (08:22 Uhr)

    Haha! Sehr geile Lösung! Finde, ihr macht das beste daraus.

    Antworten Teilen
  2. von Oliver Trebes am 04.07.2014 (08:28 Uhr)

    Ihr hättet jetzt nur noch den Link auf mac-is sexy auf nofollow setzten sollen ;)

    Antworten Teilen
  3. von Jochen am 04.07.2014 (08:29 Uhr)

    Ihr habt da ein paar Probleme mit eurer Serverkonfiguration... Wenn ich eine dieser "Content-Klau" Webseiten besuche, werden die Katzenbilder in meinem Cache gespeichert und auf t3n werden auf dem jeweiligen Artikel auch die Katzenbilder angezeigt :x

    Antworten Teilen
  4. von Michi am 04.07.2014 (08:32 Uhr)

    Wieso sind rechtliche Schritte zu aufwendig? Screenshot machen und einem Anwalt übergeben und der Betreiber erhält (natürlich nur wenn man den Betreiber einfach identifizieren kann) eine Abmahnung die sich gewaschen hat.
    Ist mir selber schon einmal passiert muss ich gestehen. Vor Jahren mit einem Foto, bei dem ich keine Bildrechte hatte. 10.000 Euro Abmahnung bei der schließlich dann 1500 zu zahlen waren.
    Mir ist es aus Nichtwissen passiert, da finde ich, sollte man vl so kulant sein wie ihr. Aber bei bewussten Content-Klau ist das was anderes.
    Außerdem ist das für euer Ranking auch nicht gut, Stichwort Duplicate Content...

    Antworten Teilen
    • von Lars Budde am 04.07.2014 (09:20 Uhr)

      Wir hatten bislang noch keine Probleme mit unseren Rankings. Der Trust der anderen Domains ist in der Regel unterirdisch, insofern ist das kein Problem.

      Antworten Teilen
    • von Jan Christe am 04.07.2014 (09:25 Uhr)

      "Zu aufwendig" trifft es vielleicht nicht exakt, eher "nicht unser Stil". Würde ich als letzte Maßnahme zwar nicht ausschließen, aber erst mal sprechen und versuchen das Thema auf dem kurzen Dienstweg zu regeln, finden wir deutlich sinnvoller als sofort abzumahnen. Hat auch in den allermeisten Fällen zum Erfolg geführt.

      Antworten Teilen
    • von Andi am 04.07.2014 (10:52 Uhr)

      So einfach ist das nicht zumal die t3n Artikel zu 90% nicht selbst produzierte Inhalte sind und meist selbst nur kuratierte News oder direkt üersetzte von Quellen wie TC,Mashable und co.

      Sofern du selbst kein aufwendig geschütztes Medium aka Video oder Bildmaterial ohne weitere Quellenangabe verlinkst oder kopiert anzeigts, bist du auch in keinem Fall belangbar.

      Da kannste soviel screenshots machen wie du willst und bullshit Abmahnungen verschicken, was eh ein Witz ist, da DE eines der letzten Länder mit dieser Rechtsmöglichkeit ist.

      Antworten Teilen
  5. von Markus am 04.07.2014 (08:36 Uhr)

    Moin!

    Hatte ich auch mal. War zwar "nur" das Facebook-Icon, aber die Fremdreferrer haben meine Logfile-Auswertung immer versaut. Habe dann sämtliche Bildabrufe, die nicht von meiner Webseite kamen auf ein "Werbebanner" umgeleitet - und blieb satte 2 Jahre unbemerkt!

    Antworten Teilen
  6. von Anh Dung am 04.07.2014 (08:36 Uhr)

    Gute Idee ;-) Witzig allemal. Werde das eventuell auch mal für meine Seiten umsetzen. Darauf bin ich noch gar nicht gekommen. Man geht meistens davon aus, dass Leute sowas nicht machen würden.

    Antworten Teilen
  7. von Tobi am 04.07.2014 (08:37 Uhr)

    Contentklau ist dreist und ich finde, Ihr solltet auch juristisch gegen Content-Farmen vorgehen. Es kann ja nicht sein, dass die immer weiter munter Profit daraus schlagen.

    Antworten Teilen
  8. von Heiko am 04.07.2014 (08:37 Uhr)

    Wie wäre es wenn Ihr selbst auch einige Artikel mit diesem Katzenbild verseht? Wäre durchaus angebracht! Am besten dann bitte auch noch mit Quelle. Danke! ;)

    Antworten Teilen
  9. von Georg am 04.07.2014 (08:39 Uhr)

    Hi,

    das Problem ist, dass viele gar kein Unrechtsbewusstsein haben. Bei unserer Astrologie Seite wurden unsere Sternzeichen Beschreibungen über 200 Mal auf anderen Webseiten - meist private Blogs - veröffentlicht. Ein paar besonders dreiste haben alle Sternzeichen-Texte übernommen und Adsense Werbung dabei eingeblendet. Das große Problem: Bei den privaten Blogs findet man meistens kein Impressum bzw. irgendwelche Kontaktdaten. Dafür wird bei einer E-Mail an den Hosting Dienstleister meist der geklaute Beitrag / der Blog schnell gelöscht / gesperrt.

    Es hat uns viel Zeit gekostet, alle Content Klauer anzuschreiben. Ein paar Abmahnungen haben wir auch verschickt (an die dreisten...). Aber es ist ein Wahnsinn, das bezahlt niemand!

    Google hat teilweise den geklauten Content höher gerankt als unseren bei schicksal.com, was besonders bitter war.

    Es gibt aber noch die Content Scraper, die gleich die komplette Webseite spiegeln und deren Ad Codes einblenden.

    Wenn Ihr auch von solchen Scrapern betroffen seid, dann hab ich noch einen Tipp. Ich bin dahinter gekommen, dass dafür häufig die "AppEngine" von Google verwendet wird. Die bauen dort eine "App", die die komplette Website spiegelt.

    Das kann man mit einer einfachen Rewrite Rule verhindern:

    RewriteCond %{HTTP_USER_AGENT} ^AppEngine
    RewriteRule ^.*$ - [F]

    Wie kommt man drauf: Einen Artikel nehmen, einen Satz rauskopieren und ihn mit Anführungszeichen bei Google suchen.

    Noch ein Tipp: Wir haben ein Javascript entwickelt, dass Copy & Paste abwandelt. Statt der ganze Text wird nur der erste Satz mit der aktuellen URL in die Zwischenablage kopiert. Ich bin noch nicht dazu gekommen, daraus eine Open Source Geschichte zu machen, werde ich aber noch tun, wenn ich mehr Zeit habe.

    Bin auch für weiter Tipps dankbar!

    lg,
    Georg.

    Antworten Teilen
  10. von Georg am 04.07.2014 (08:43 Uhr)

    PS: Die Katze, die Ihr da verwendet, die habt Ihr doch auch geklaut!!!!! ;-)

    Antworten Teilen
  11. von Simon am 04.07.2014 (08:44 Uhr)

    Das hats wohl gebracht :-)
    Die Seite wird nun auf http://www.google.ru umgeleitet, nachdem der Webserver nur noch "Internal Server Error" ausgeliefert hatte.

    Antworten Teilen
  12. von Andreas am 04.07.2014 (08:51 Uhr)

    Hallo

    wir hatten (und haben) auch mit dem Problem Content-Klau zu kämpfen.

    Irgendwann hatten wir ein ähnliches JavaScript wie Georg in unsere Seiten integriert. Seitdem ist es schon mal weniger geworden.

    Probiert mal einen Text auf http://www.aritso.net zu kopieren.

    Nur kopieren, nicht klauen bitte. :-)

    Antworten Teilen
    • von Philipp am 04.07.2014 (09:27 Uhr)

      Hallo Andreas,

      das Script was Ihr benutzt sieht sehr interessant aus, ist das Opensource?

      Beste Grüße

      Antworten Teilen
    • von Oliver am 04.07.2014 (09:27 Uhr)

      Hallo,

      Content-Klau ist natürlich „böse“, aber wegen einigen Störern gleich alle Benutzer zu gängeln kann ja auch nicht der richtige Weg sein.

      Auf eurer Seite geht es ja sogar so weit, dass ich mir z.B. noch nicht einmal die Kontaktdaten oder Telefonnummer in die Zwischenablage legen kann. Halte ich persönlich für sehr schlechten Stil und für ähnlich ärgerlich, wie das Umbiegen der rechten Maustaste.

      Antworten Teilen
      • von Andreas am 04.07.2014 (09:39 Uhr)

        Danke für Dein Feedback.

        Wir haben nicht die rechte Maustaste belegt, sondern nur die Kopierenfunktion.

        Das Kopieren der Kontaktdaten, oder anderer Inhalte, die evtl. kopiert werden sollen werde ich überdenken.
        In der linken Seitenleiste wurde das z.B. berücksichtigt. Die Kontaktbox kann kopiert werden.

        Teilen
      • von Oliver am 04.07.2014 (09:49 Uhr)

        Hallo Andreas,

        der Vergleich mit der rechten Maustaste ging nicht in Richtung eurer Website, sondern eher allgemein.

        Der Hinweis auf das Kopieren der Adresse war nur ein x-beliebiges Beispiel für durchaus legitimes Kopieren in die Zwischenablage. Nicht jeder, der Inhalte kopiert, will sie auch gleich klauen.

        Und -- sorry -- aber ich probiere doch auf der Website nicht lange herum, welche Adresse in welcher Infobox ich jetzt kopieren darf und welche nicht.

        Mir geht es auch nicht speziell um deine Website, sondern diese Technik allgemein. Ich halte das doch für eher zweifelhaft.

        Teilen
    • von Black Sheepy am 04.07.2014 (11:52 Uhr)

      Probier mal mit ctrl+a und dann ctrl+c ... man kann trotzdem kopieren.

      Antworten Teilen
    • von Florian Ritter am 04.07.2014 (15:29 Uhr)

      Irgendwelche Funktionen des Browsers/Betriebssystems zu brechen, ist einfach nur unprofessionell.

      Falls jemand Euren Content abgreifen möchte, ich wüsste nicht wozu, würde das sicherlich nicht per Copy-Paste passieren.

      Antworten Teilen
  13. von huron am 04.07.2014 (09:13 Uhr)

    Ich möchte euer gedrucktes Magazin abbestellen!

    Antworten Teilen
  14. von evance am 04.07.2014 (09:25 Uhr)

    Ist zwar nur die softe Variante und schreckt die Content-Farmer bestimmt nicht ab, clever nonetheless: http://www.tynt.com – allein schon für die Statistiken zu den Kopiervorgängen interessant...

    Antworten Teilen
  15. von Julian am 04.07.2014 (09:52 Uhr)

    Klasse, vielleicht hört ihr dann ja auch auf von TechCrunch und co. abzuschreiben und fangt an mal mehr eigenen Content zu schreiben.

    Antworten Teilen
  16. von reraiseace am 04.07.2014 (11:13 Uhr)

    Euer Vorgehen finde ich richtig. Mir geht es auch gegen den Strich, dass einem irgendwelche Leute einfach den Content klauen. Nur weil sie nicht in der Lage sind eigene Inhalte zu erstellen und sich mal selbst ne Platte zu machen.

    Was nun diese Vorwürfe gegen t3n angeht: irgendwoher müssen die Informationen ja kommen und die Jungs und Mädels von t3n schreiben nicht einfach ab ;) Mal davon abgesehen, gibt es hin und wieder mal einen Artikel, der einfach misslungen ist. Aber das gehört dazu. Jeder Goldgräber findet auch mal einen Steinklumpen.

    Antworten Teilen
    • von Florian Blaschke am 04.07.2014 (15:42 Uhr)

      Wir sehen das naturgemäß genauso, danke für den Kommentar. Für Journalisten und beispielsweise auch Nachrichtenagenturen gehört das Kuratieren relevanter News zum Kerngeschäft. Und zumindest wir sind der Meinung, dass wir eine sehr gelungene Mischung aus solchen Stücken und eigenen Geschichten hinkriegen.

      Antworten Teilen
  17. von Sebastian am 04.07.2014 (11:58 Uhr)

    Mit deaktiviertem JavaScript ist der Kopiervorgang erfolgreich.

    Antworten Teilen
  18. von christian.stanke am 04.07.2014 (12:24 Uhr)

    Ich mag das Bild!

    Antworten Teilen
  19. von Victor am 04.07.2014 (14:07 Uhr)

    Ai ai ai... wie es aussieht zählt Feedly wohl auch zu den Dieben ;)

    Antworten Teilen
  20. von Thiel am 04.07.2014 (21:35 Uhr)

    Aber ein teasern und verlinken dürfte wohl vielleicht sogar eher gern gesehen sein oder? Grüße

    Antworten Teilen
  21. von Marcel am 04.07.2014 (23:05 Uhr)

    Großartige Idee. Und was ich am besten finde ist die Tatsache, daß ihr den "Dieben" einfach mal Schrott unterschiebt. Nee, am Besten ist es, dass ihr eben NICHT die Anwälte losrennen lasst. In Deutschland wird eh ständig jeder von jedem verklagt und ich habe als Blogger echt manchmal Angst, überhaupt noch was zu schreiben, was ich irgendwo anders gelesen habe.

    Insofern: Respekt für eure total hässlichen GIFs und für die coole Art und Weise. Und an diejenigen, die hier mit den Anwälten drohen wollten. Ich glaube, dass so mancher Content-Dieb die CC-Lizenzen einfach nur falsch verstanden hat und das nicht wirklich böse gemeint hat. Denn ich glaube an das gute im Menschen.

    Antworten Teilen
  22. von Max am 05.07.2014 (19:08 Uhr)

    Ich hätte nicht gedacht, dass es Webseiten gibt, die die Artikel wirklich in der Originalversion ohne eine Änderung übernehmen...Da ist das Katzenbild sicherlich die beste Lösung!

    Finde es gut, dass ihr die Sache eher "locker" angeht und nicht sofort den Rechtsweg geht. So bleiben die sauberen Blogger, die eure Beiträge als Quelle verwenden und, wie gesagt, ein Foto in den Newsletter einbauen, davon verschont. Bei einem 1:1 Klau wäre der Rechtsweg dennoch angebracht.

    Antworten Teilen
  23. von Eva am 07.07.2014 (01:49 Uhr)

    Schöne eigene Interpretation dieses alten aber erst kürzlich wieder populären Artikels http://www.portent.com/blog/random/stop-plagiarism-in-3-easy-steps.htm

    Antworten Teilen
Deine Meinung

Bitte melde dich an!

Du musst angemeldet sein, um einen Kommentar schreiben zu können.

Jetzt anmelden

Mehr zum Thema
Stephan Dörner wird neuer Chefredakteur von t3n.de
Stephan Dörner wird neuer Chefredakteur von t3n.de

Am 1. Juli startet Stephan Dörner (33), derzeit Tech-Reporter bei der Tageszeitung „Die Welt“, seinen Job als neuer Chefredakteur von t3n.de. Wir freuen uns auf Stephan und stellen euch unseren … » weiterlesen

Traumjob frei: Wir suchen einen Chefredakteur (m/w) für t3n.de
Traumjob frei: Wir suchen einen Chefredakteur (m/w) für t3n.de

Bei t3n wird in Kürze eine extrem spannende Stelle frei: die des Chefredakteurs für t3n.de. Florian Blaschke, der die Stelle seit mehr als drei Jahren bekleidet hat, sucht den Weg in die … » weiterlesen

t3n.de holt Stephan Dörner als Chefredakteur von der „Welt“
t3n.de holt Stephan Dörner als Chefredakteur von der „Welt“

Hannover, 14. Juni 2016 – Stephan Dörner (33), derzeit Tech-Reporter bei der Tageszeitung „Die Welt“, wird zum 1. Juli neuer Chefredakteur von t3n.de, dem Online-Auftritt des Magazins der … » weiterlesen

Alle Hefte Jetzt abonnieren – für nur 35 €

Kennst Du schon unser t3n Magazin?