Rechtliche Zulässigkeit des Data Mining online

Rechtliche Zulässigkeit des Data Mining online

Es geht die gezielte Erhebung von Daten von Websites im Wege automatisierter Verfahren aus dem Internet. Mittels Software werden Daten anderer/ nicht eigener Websites erhoben, damit die auf den anderen Seiten befindlichen Informationen zumindest in Teilen auf der eigenen Seite nutzbar gemacht werden können. Solche Verfahren werden meistens mit den Schlagwörtern data scraping, Data mining etc. bezeichnet (vgl. § 44b UrhG). Dieser Blog befasst sich mit der Fragestellung, unter welchen Voraussetzungen man eigentlich die Daten, die auf anderen Websites im Internet präsentiert werden, erfassen und auf der eigenen Seite verwenden darf. Im zweiten Teil befasse ich mich mit einer neueren Entscheidung des BGH aus dem Urheberrecht zu diesem Thema.

Die Verfahren funktionieren normalerweise unter Verwendung von Bots oder Crawlern genannten Programmen. Entweder werden Ergebnisse automatisierter Verfahren verwendet; oder es wird das Abfragemuster von imaginären Menschen verwendet.

Frage: Unter welchen rechtlichen Gesichtspunkten dürfen solche Daten erfasst und verwendet werden?

1.) Vertragliche Bedingungen (AGB) auf den Websites der Betreiber

Zwei unterschiedliche Situationen sind zu betrachten: In dem einen Fall verwendet der Betreiber der Website, die abgefragt werden soll, bestimmte technische Maßnahmen, die eine automatisierte Erhebung von Daten verhindern soll oder verweist in seinen AGB darauf, dass die automatisierte Erhebung von Daten unzulässig ist.

In vielen Fällen verwenden die Inhaber der Websites nur in ihren eigenen Allgemeinen Geschäftsbedingungen, Hinweise, die eine automatisierte Erhebung von Daten untersagen. Die Wirksamkeit solcher Nutzungsbedingungen ist deshalb fraglich, weil durch den bloßen Besuch einer Website kein Vertrag zustande kommt. Der BGH kommt in einer Entscheidung aus dem Jahr 2011 (Automobil Online Börse CR 11,757) zu dem Ergebnis, dass der bloße Besuch einer Website keinen Vertrag begründen würde. Der Betreiber der betroffenen Website hätte es ja in der Hand, durch einen Registrierungsprozess einen entsprechenden Vertrag abzuschließen, in dem die Nutzungsrechte dann vereinbart werden. Wir treffen hier auf ein Muster, dass der BGH auch in einer neueren Entscheidung (Deutsche Digitale Bibliotheken II) verwendet: Wer data scraping untersagen will, muss das in der Sprache des Internets tun. Er muss durch technische Maßnahmen sicherstellen, dass eine Verwendung seiner Daten nicht automatisiert erfolgen kann.

Die Nutzungsbedingungen selbst müssen den gesetzlichen Anforderungen genügen. Dieser Hinweis ist insofern ein wenig schwer umzusetzen, als dass kein Algorithmus so klug ist, den semantischen Wert von AGB untersuchen zu können. Wer aber nur wenige Seiten auswerten lassen möchte, dem sei gesagt, dass die AGB der Websitebetreiber dem § 44b III S.1 Urhebergesetz entsprechen müssen. Grundsätzlich darf man nämlich Daten erheben und analysieren, um von einzelnen oder mehreren digitalen oder digitalisierten Werken Informationen oder Muster, Trends oder Korrelationen zu gewinnen. Aber der § 44b III S.1 sagt, dass dies bei online vorhandenen Daten nur dann zulässig ist, wenn der Inhaber der Website sich diese Nutzung nicht vorbehalten hat und der S.2 besagt, dass dieser Vorbehalt bei online zugänglichen Werken nur dann wirksam ist, wenn er maschinenlesbar ist. Ergo muss in dem Script, dass der BOT auf seine Abfrage hin erhält, ein Hinweis enthalten sein, nach dessen Inhalt die Abfrage dieser Seiten nicht erfolgen darf. Das Verbot nur in die AGB zu schreiben, reicht nicht aus, wenn diese nicht im Rahmen einer maschinenlesbaren Abfrage erkannt werden kann. Außerdem sollte man noch eine Ausnahme für die Wissenschaftliche Verwendung der Daten nach § 60 UrhG in seine Website aufnehmen.

2.) Datenschutz

Sofern bei dem Data Mining personenbezogene Daten ausgelesen werden, werden diese vervielfältigt und damit liegt eine Verarbeitung personenbezogener Daten nach Art 4 II DSGVO vor, die wieder nur dann rechtssicher durchgeführt werden kann, wenn ein Erlaubnistatbestand nach Art. 6 DSGVO vorliegt. Dieser kann nur in einer Abwägung der widerstreitenden Interessen bestehen. Die Verarbeitung der Daten muss erforderlich sein, das Interesse des Verarbeitenden muss das Interesse der betroffenen Person überwiegen. Man braucht also eine Dokumentation, aus der sich ergibt, dass man eine solche Abwägung tatsächlich vorgenommen hat. Sofern die betroffenen Personen ihre Daten selbst in offene Foren geschrieben haben, ist davon auszugehen, dass ihr Interesse geringer ist, als das Interesse des Unternehmens, dass die Daten verarbeiten will.

Sofern die Abwägung ergibt, dass die Rechte der betroffenen Personen nachrangig sind, ist das Thema Datenschutz und Dokumentation aber noch nicht ausgestanden. Denn jetzt muss man noch die richtigen Dokumentationen nach den Art 14 DSGVO vorrätig halten, die es den Betroffenen gestatten, sich zu informieren und ggf. Ansprüche geltend zu machen. Art 14 III lit a. besagt, dass die Betroffenen spätestens binnen eines Monats über die Verarbeitung informiert werden müssen, die Quelle, aus der die Informationen stammen, ist anzugeben, etc. Nach Art 14 V lit b. DSGVO besteht zwar eine Ausnahme für die Fälle, in denen sich die Erteilung dieser Information als unmöglich erweist, oder einen unverhältnismäßigen Aufwand erfordern würde. In der Literatur wird davor gewarnt, die Duldsamkeit der Behörden bei der Anwendung dieser Ausnahme zu strapazieren.

Teil II Data Mining und Urheberrecht. 

Weitere Beiträge

Programmieren und KI und Urheberrecht Teil II

Im Teil I hatte ich die generellen Probleme dargelegt, die sich daraus ergeben dass der Output eines KI Systems grundsätzlich nicht als urheberrechtsähiges Werk qualifiziert werden kann. Ganz konkret gehen wir in diesem Teil mal der Frage nach, was das

Mehr lesen »
Nach oben scrollen