Studie – Paul Keller
Die Massendatenanalyse ist zunehmend allgegenwärtig und wird von vielen verschiedenen Akteuren, die von großen Unternehmen, Einzelpersonen bis hin zum Forschungssektor reichen, genutzt. Herzstück der Massendatenanalyse, die auch eines der grundlegenden Elemente der Künstlichen Intelligenz (KI) bildet, ist die Fähigkeit von Computern, Informationen aus strukturierten und nicht strukturierten Datensätzen zu analysieren und zu gewinnen. Dieser Prozess wird im rechtlichen Kontext häufig als „Text und Data Mining“ oder allgemeiner als „Datenanalyse“ bezeichnet
Angesichts der Allgegenwart von Text und Data Mining, insbesondere in den USA (in denen die Nutzungsquoten deutlich höher liegen als in Europa), beschloss die Kommission 2016 aus Gründen der internationalen Wettbewerbsfähigkeit, eine neue Ausnahme vom Urheberrecht vorzusehen, die es in der EU ansässigen Forschungsorganisationen gestattet, Text und Data Mining zu wissenschaftlichen Zwecken einzusetzen, ohne die Erlaubnis der Rechteinhaber einzuholen. Während der gesetzgeberischen Beratungen zum Vorschlag für die DSM-Richtlinie wurde eine weitere Ausnahme, die Text und Data Mining für alle und für jegliche Zwecke unter bestimmten Bedingungen gestattet, in den Text der Richtlinie ausgenommen. [1]Diese zusätzliche Ausnahme wurde in Reaktion auf die von Rat und Europäischem Parlament vorgeschlagenen Änderungen aufgenommen
In Artikel 2 Absatz 2 der DSM-Richtlinie wird Text und Data Mining (TDM) als „eine Technik für die automatisierte Analyse von Texten und Daten in digitaler Form, mit deren Hilfe Informationen unter anderem – aber nicht ausschließlich – über Muster, Trends und Korrelationen gewonnen werden können“ definiert.
Artikel 3 (Text und Data Mining zum Zwecke der wissenschaftlichen Forschung) sieht
vor, dass Mitgliedstaaten eine verbindliche Ausnahme zum Urheberrecht [2]In diesem Dokument wird der Begriff Urheberrecht(e) für das Urheberrecht und damit zusammenhängende (verwandte) Schutzrechte im Urheberrecht verwendet, einschließlich Sui-generis-Rechten an … Continue reading in ihre nationalen Rechtsvorschriften zum Zwecke der Datenanalyse aufnehmen müssen. Diese neue Ausnahme ermöglicht es Wissenschaftlern, die rechtmäßigen Zugang zum offenen Web sowie zu den Sammlungen von Hochschulen, Bibliotheken, Archiven und anderen Organisationen des Kulturerbes in der gesamten EU haben, Text und Data Mining zu wissenschaftlichen Zwecken einzusetzen, ohne die Genehmigung der Rechteinhaber zu benötigen. Die Mitgliedstaaten werden aufgefordert, mit Forschungsorganisationen, Einrichtungen des Kulturerbes und Rechteinhabern zusammenzukommen, um angemessene Sicherheitsmaßnahmen im Zusammenhang mit der Nutzung dieser Ausnahme zu erörtern. Das Recht auf Nutzung dieser Ausnahme kann weder durch einen Vertrag noch durch technische Schutzmaßnahmen entzogen werden.
Artikel 4 (Allgemeine Ausnahme für Text und Data Mining) verpflichtet die Mitgliedstaaten, eine verbindliche Ausnahme vom Urheberrecht in ihren nationalen Rechtsvorschriften für die Zwecke des Text und Data Mining durch jeden einzuführen, der urheberrechtlich geschütztes Material zu einem beliebigen Zweck gewinnen möchte. Rechteinhaber können das Data Mining im Rahmen dieser Ausnahme jedoch verhindern, wenn sie dies wünschen.
Der Hauptunterschied zwischen den beiden Ausnahmen besteht darin, dass die Ausnahme zu Zwecken der wissenschaftlichen Forschung (Artikel 3) es Wissenschaftlern, die Organisationen von öffentlichem Interesse angehören, gestattet, eine Kopie der von ihnen gewonnenen Informationen zu behalten, und dass dies nicht durch Verträge oder technische Schutzmaßnahmen verhindert werden kann. Die zweite Ausnahme (Artikel 4), die von jeder Person zu beliebigen Zwecken in Anspruch genommen werden kann, gestattet Text und Data Mining nur bei Inhalten, für die sich die Rechteinhaber dieses Recht nicht ausdrücklich vorbehalten haben.
Mit diesen beiden verbindlichen Ausnahmen können Massendatenanalysen und künstliche Intelligenz (KI) in Europa unterstützt werden. Die Ausnahmen sind verhältnismäßig klar. Durch eine unzureichende Umsetzung einiger wichtiger Einzelheiten in nationales Recht könnte jedoch die Möglichkeit der Begünstigten der Ausnahmeregelung eingeschränkt werden, Text und Data Mining einzusetzen. Dies betrifft folgende Punkte:
Rasche Entfernung technischer Schutzmaßnahmen
Technische Schutzmaßnahmen [3]Technische Schutzmaßnahmen (TPM) beziehen sich auf Zugriffssperren, Prüfzeichen oder andere Tools (z. B. Passwortkontrollsysteme, Zahlungssysteme, Zeitzugangskontrollen, … Continue reading (Technical Protection Measures, Abkürzung TPM, nicht zu verwechseln mit TDM) zur Verhinderung von Text und Data Mining sind ein Bereich, indem es weiterhin große Bedenken gibt. Dies kann von grundlegenden technischen Merkmalen wie der Captcha-Technologie, die die Datengewinnung behindern kann, bis hin zu anspruchsvolleren technischen Schutzmaßnahmen reichen. Beispielsweise verwenden wissenschaftliche Verlage Systeme, die nicht selten den Zugang zu Datenbanken blockieren, die Hochschulen kostenpflichtig abonniert haben. Häufig überwachen die Verlage die Download Raten; werden ihre Systeme auf atypische Download-/Anfrage-/Load-Raten aufmerksam gemacht, könnten sie annehmen, dass ein Teil der technischen Infrastruktur der Hochschule kompromittiert wurde, und den Zugang sperren. Beide Ausnahmen für TDM fallen unter Artikel 7, in dem festgelegt ist, dass die Bestimmungen der InfoSoc-Richtlinie, denen zufolge die Mitgliedstaaten Maßnahmen ergreifen müssen, um sicherzustellen, dass TDM die Begünstigten nicht an der Ausübung ihrer im Rahmen der Ausnahme bestehenden Rechte hindern, auch für diese beiden Ausnahmen gelten.
Obwohl eines der Haupthindernisse beim Text und Data Mining technisch bedingt ist, nur in acht EU-Ländern Verfahren bestehen, um Rechteinhaber um Zugang zu durch Schutzmaßnahmen geschützten Inhalten zu ersuchen, und Mechanismen in vielen Fällen zu aufwändig und zeitraubend sind, werden mit der Richtlinie die InfoSoc-Regeln für technische Schutzmaßnahmen nicht geändert. Die Nutzer können die technischen Schutzmaßnahmen nicht entfernen und müssen warten, bis sie die Rechteinhaber dazu in die Lage versetzen, um ihre im Rahmen der Ausnahmen vorgesehenen Rechte wahrzunehmen. Dies führt zu langen Wartezeiten für Wissenschaftler, die TDM einsetzen, da sie jedes Mal, wenn sie auf eine technische Schutzmaßnahme stoßen, freiwillige Änderungen beantragen müssen. Es wird wichtig sein, dass ein solches Verfahren zumindest schnell und einfach ist, damit für die Begünstigten der Ausnahmen für TDM keine unangemessenen Verzögerungen entstehen. Um dies zu erreichen, sollten die Mitgliedstaaten festlegen, dass technische Schutzmaßnahmen von den Rechteinhabern binnen 72 Stunden nach einer Beantragung entfernt werden müssen (siehe auch den gesonderten Abschnitt zu Artikel 7 unten).
Speicherung der Daten
Die Richtlinie bezieht sich auf die sichere Speicherung von Inhalten, die für Text und Data Mining verwendet werden. Obwohl sich die Rechteinhaber während der Beratungen im Europäischen Parlament für eine Pflicht der Löschung von Datensätzen, die im Zuge von Text- und Data Mining erstellt wurden, eingesetzt haben (was ganz und gar im Widerspruch zur gesamten wissenschaftlichen Praxis steht), bezieht sich Artikel 3 Absatz 2 nur auf die Speicherung von Datensätzen „mit angemessenen Sicherheitsvorkehrungen“. Es wird nicht genauer festgelegt, was damit gemeint ist. In Erwägung 15 wird jedoch vorgeschlagen, dass die Mitgliedstaaten dies diskutieren und vertrauenswürdige Stellen für die Speicherung nutzen. Aus Sicht von Forschungsinstituten und Wissenschaftlern wäre es unangemessen, den Wissenschaftlern detaillierte oder technologische Sicherheitsmaßnahmen aufzuerlegen. Die Mitgliedstaaten sollten diesen Einrichtungen keine besonderen oder stärker belastenden Verpflichtungen auferlegen, als dies sinnvoll ist.
Robots.txt
Artikel 4 Absatz 3 der Richtlinie sieht vor, dass Rechteinhaber, die ihre Werke vom Anwendungsbereich der allgemeinen Ausnahme für TDM ausnehmen wollen, dies tun können, indem sie ihre Rechte „in angemessener Weise, etwa mit maschinenlesbaren Mitteln im Fall von online veröffentlichten Inhalten“ mit einem Nutzungsvorbehalt versehen. Die Bestimmung, diese Nutzungsvorbehalte mit maschinenlesbaren Mitteln vorzunehmen, ist zu begrüßen, reicht jedoch nicht aus. Damit diese Bestimmung wirksam ist (sowohl für Rechteinhaber, die sich ihre Rechte vorbehalten wollen, als auch für Begünstigte, die solche Vorbehalte einhalten wollen), müssen diese Vorbehalte in standardisierter Form gemacht werden. Auch wenn mit der Richtlinie die weitere Umsetzung dieser Bestimmung den einzelnen Mitgliedstaaten überlassen bleibt, muss auf europäischer Ebene eine standardisierte Form der Äußerung des Rechtsvorbehalts festgelegt werden, um zu verhindern, dass die Mitgliedstaaten unterschiedliche Maßstäbe anlegen. Das bedeutet, dass die Kommission aktiv mit allen einschlägigen Interessenträgern zusammenarbeiten muss und dass die Mitgliedstaaten einen Standard für einen maschinenlesbaren Vorbehalt von Rechten festlegen müssen. Am besten dafür geeignet ist der Robots Exclusion Standard, der von den größten Text und Data Mining-Betrieben im Internet, einschließlich Google, Bing, Baidu, DuckDuckGo, Yahoo! und Yandex, eingehalten wird. Da sich die Suchmaschinen zur Befolgung dieser Regeln verpflichtet haben, wird der Standard von fast allen Websites weltweit eingehalten, um zu kontrollieren, was von ihren Bots ausgewertet werden kann, und kann problemlos verwendet werden, um den in Artikel 4 Absatz 3 vorgesehenen Nutzungsvorbehalt zum Ausdruck zu bringen.
Umsetzungsperspektive
Die Massendatenanalyse ist eine Tätigkeit mit erheblichen wirtschaftlichen Auswirkungen; während des Gesetzgebungsverfahrens haben sich (Wissenschafts-)Verlage nachdrücklich um den Schutz ihrer wirtschaftlichen Interessen in diesem Bereich bemüht. Die oben untersuchten Fragen sind zwar vor allem technischer Art, werden sich jedoch stark auf den Nutzen der mit der Richtlinie eingeführten Bestimmungen über das TDM auswirken. Verleger und andere Rechteinhaber werden daher voraussichtlich versuchen, die nationale Umsetzung in diesen Bereichen zu beeinflussen; die akademische Forschungsgemeinschaft muss daher die Umsetzung auf nationaler Ebene genau beobachten und sich um eine Vertretung bei den in Artikel 3 Absatz 4 vorgesehenen Konsultationen der Interessenträger bemühen.
Fußnoten
↑1 | Diese zusätzliche Ausnahme wurde in Reaktion auf die von Rat und Europäischem Parlament vorgeschlagenen Änderungen aufgenommen |
↑2 | In diesem Dokument wird der Begriff Urheberrecht(e) für das Urheberrecht und damit zusammenhängende (verwandte) Schutzrechte im Urheberrecht verwendet, einschließlich Sui-generis-Rechten an Datenbanken. |
↑3 | Technische Schutzmaßnahmen (TPM) beziehen sich auf Zugriffssperren, Prüfzeichen oder andere Tools (z. B. Passwortkontrollsysteme, Zahlungssysteme, Zeitzugangskontrollen, Verschlüsselungsmaßnahmen, Captcha-Technologie usw.), die den Zugang zu und/oder das, was ein Benutzer mit einem digitalen Werk, wie z. B. einem Buch, einem Video oder einem anderen Dateityp, tun kann, kontrollieren. |