Le nuove eccezioni ai diritti di privativa per Text and Data Mining
di Caterina Bo
TDM e Big data
Il text and data mining (TDM) o “estrazione di testo e di dati” è una procedura informatica che permette di trarre informazioni implicite da grandi quantità di testo e di dati. Per quanto riguarda specificamente il data mining, spesso costituisce inoltre l’unica modalità di rendere “leggibili” ed utilizzabili anche da un essere umano i dati raccolti in maniera aggregata dai dispositivi digitali.
L’esigenza di sviluppare tecniche attraverso cui velocizzare il classico processo di analisi e sintesi che porta alla scoperta di una nuova informazione deriva dall’esponenziale aumento dei dati a disposizione, che ha portato al conio dell’espressione “big data”. Big data peraltro non significa solamente che i dati sono moltissimi, ma che il loro volume, varietà e velocità di accumulo è tale che le tecniche di analisi tradizionali non sono in grado di estrarre un’informazione utile nei tempi in cui è necessario o desiderabile ottenerla.
Il TDM è dunque l’impiego di algoritmi istruiti dall’uomo per rendere sensati e comprensibili dati altrimenti inaccessibili (si pensi ai dati immagazzinati da dispositivi IoT) o per evidenziare possibili correlazioni, ricorrenze o significati ancora impliciti mettendo a confronto numerosi database o testi di produzione umana (si pensi ad esempio alle recensioni dei clienti relative ai prodotti sponsorizzati su piattaforme di e-commerce e alle informazioni che è possibile trarne in relazione ai potenziali miglioramenti degli stessi o del servizio di consegna).
TDM e proprietà intellettuale
Sviluppati inizialmente in ambito di intelligence militare, gli algoritmi per l’estrazione di dati sono stati via via perfezionati ed adattati alle diverse tipologie di database esistenti, di pari passo con la diffusione dei data warehouse[1] e di internet.
Agli utilizzatori di tale tecnologia, in primis ricercatori e data scientists, ma sempre più anche aziende e soggetti commerciali, si è tuttavia posto il problema del possibile conflitto rispetto al diritto d’autore sulle opere creative oggetto di estrazione e sulla loro creativa disposizione, nonché rispetto al diritto sui generis sulle banche di dati previsto dalla normativa europea e nazionale.
Sebbene i dati in quanto tali non siano infatti proteggibili o rivendicabili da un soggetto in particolare (il diritto d’autore protegge la forma espressiva di un’opera), in concreto per operare gli algoritmi di TDM hanno necessità, in primo luogo, di accedere ai materiali protetti e, in secondo luogo, di copiarli, rielaborarli, trasferirli su supporti diversi da quelli su quali erano originariamente contenuti e renderli accessibili ad una vasta platea di fruitori, specie se operano in cloud computing e utilizzano piattaforme informatiche potenzialmente accessibili ad un numero illimitato di utenti.
Tali operazioni sono astrattamente idonee a costituire violazioni dei diritti di riproduzione[2], elaborazione[3] e di comunicazione al pubblico[4] di opere protette dal diritto d’autore, nonché violazione del diritto sui generis sulle banche di dati che abbiano richiesto investimenti rilevanti in termini quantitativi o qualitativi[5], ideato appositamente per garantire una adeguata remunerazione ai soggetti che abbiano impiegato tempo e risorse ad organizzare secondo criteri sistematici e a rendere accessibili grandi complessi di dati[6].
Il rischio di incorrere in contenziosi legati all’utilizzo del TDM su opere o database protetti non è dunque trascurabile, tanto più che la giurisprudenza della Corte di Giustizia ha storicamente interpretato il diritto esclusivo di riproduzione in maniera rigorosa (includendovi anche copie non dirette alla fruizione “umana” ma che tecnicamente prevedono la riproduzione dei caratteri dell’opera) per garantire la più ampia protezione possibile ai relativi autori.[7]
Tale rischio non è d’altra parte eliminato dall’esistenza delle eccezioni ai diritti di privativa enunciate dalle Direttive europee in materia, tra cui in particolare l’eccezione per atti di riproduzione temporanea[8], ricerca scientifica[9] ed estrazioni non rilevanti di dati[10]. Innanzitutto, perché l’adozione di molte di tali eccezioni è stata rimessa alla discrezione degli Stati membri e dunque il panorama legislativo risulta frammentato e incoerente, e in secondo luogo perché la loro applicabilità alle diverse fasi di riproduzione e rielaborazione dei dati compiute dagli algoritmi TDM sono difficilmente riconducibili in maniera univoca al loro ambito di operatività.
Queste problematiche possono naturalmente essere risolte mediante la negoziazione diretta con i titolari dei diritti di privativa, negoziazione che tuttavia implica un evidente dispendio in termini di tempo e risorse economiche e che dunque aumenta notevolmente i costi dell’operazione, scoraggiando i progetti di TDM.
La Direttiva Copyright e le nuove eccezioni per l’estrazione di testo e di dati
È in questo contesto di incertezza che si inserisce la c.d. Direttiva Copyright[11], entrata in vigore il 13 giugno 2019.
Tra gli obiettivi esplicitamente enunciati nei considerando della direttiva vi è infatti l’armonizzazione della disciplina degli Stati membri in materia di diritto d’autore, con lo specifico intento di favorire lo sviluppo del mercato unico digitale europeo e l’uso transfrontaliero dei contenuti digitali.
Per raggiungere tale obiettivo, sono state introdotte due nuove eccezioni che mirano a chiarire in quali casi e condizioni le operazioni di text and data mining siano lecite, operando tuttavia una fondamentale distinzione tra soggetti dediti a scopi di ricerca e tutela del patrimonio culturale e soggetti che perseguono uno scopo di lucro.
Entrambe le eccezioni inoltre presuppongono che i soggetti che operano TDM abbiano avuto accesso lecitamente alle opere e ai database sulle quali compiono l’estrazione di informazioni, ciò che in sostanza significa operare una prima distinzione tra coloro che hanno le risorse per negoziare accordi di licenza e i soggetti che ne sono privi.
L’articolo 3 della Direttiva prevede in particolare un’eccezione obbligatoria in caso il TDM venga condotto per scopi di ricerca scientifica da organismi di ricerca o tutela del patrimonio culturale (purché su di essi non eserciti un’influenza determinante un soggetto con finalità di lucro), i quali dunque nell’ambito di tali operazioni potranno liberamente riprodurre le opere protette dal diritto d’autore e diritti connessi, così come estrarre e riutilizzare i contenuti dei database protetti dal diritto sui generis. Inoltre, la stessa norma esclude gli organismi di ricerca anche dall’applicazione del controverso art. 15 della medesima direttiva, che attribuisce agli editori il diritto ad essere remunerati per l’utilizzo online delle loro pubblicazioni di carattere giornalistico.
L’articolo 4 invece prevede un’eccezione di portata generale che consente a qualunque soggetto il libero utilizzo delle opere e contenuti protetti e dei database per scopi di TDM purché vi abbia lecitamente accesso, a meno che ciò non venga adeguatamente escluso dai titolari dei relativi diritti.
I nuovi articoli 70-ter e 70-quater Legge Autore
In Italia la Direttiva Copyright è stata attuata mediante il Decreto legislativo n. 177 dell’8 novembre 2021, che ha introdotto i nuovi articoli 70 ter e 70 quater all’interno della Legge Autore, i quali sostanzialmente riproducono il testo degli articoli 3 e 4 della Direttiva e vi integrano le definizioni dei soggetti abilitati a fruire delle eccezioni.
La misura dell’impatto che tali leciti utilizzi delle opere e database di titolarità di terzi avranno sul panorama della ricerca (pubblica e privata) andrà naturalmente verificata a maggiore distanza dalla loro adozione; tuttavia, già ora è possibile delineare le problematiche a cui andranno incontro i soggetti che intendono usufruirne.
Rileviamo innanzitutto come, nel bilanciare i diversi interessi in gioco, il legislatore europeo abbia deciso di operare una decisa scelta di campo in favore della ricerca scientifica operata da soggetti finanziati prevalentemente con soldi pubblici o che comunque non perseguano finalità di lucro, nell’ottica di privilegiare dunque quei progetti di TDM i cui risultati dovrebbero (almeno teoricamente) beneficiare l’intera collettività. Solo in relazione a tali soggetti, infatti, l’eccezione non è derogabile contrattualmente.
Nonostante lo sforzo definitorio compiuto dalla Direttiva, inoltre, rimangono profili di incertezza riguardo agli attributi che renderebbero “scientifica” la ricerca condotta attraverso l’estrazione di dati, così come non sempre può risultare agevole determinare se un ente no profit che riceva sponsorizzazioni da un’impresa commerciale sia oggetto o meno di un’influenza determinante. Restano poi totalmente esclusi dalla portata dell’eccezione i ricercatori che non appartengono ad un’organizzazione riconosciuta.
A ciò si deve aggiungere che la direttiva non si preoccupa di tutelare un aspetto fondamentale del processo di ricerca, ovvero la convalida dei risultati attraverso la c.d. peer review, la revisione da parte di specialisti del settore. È evidente, infatti, che per poter verificare la coerenza delle informazioni risultanti dalla ricerca attraverso TDM è necessario poter accedere al medesimo set di testi e di dati, ciò che tuttavia sarà in concreto possibile solo ove anche il soggetto revisore vi abbia ottenuto autonomamente l’accesso, dato che l’eccezione non consente di comunicare i dati oggetto della ricerca a terze parti.
Per quanto riguarda invece l’eccezione generale prevista dall’art. 70-quater, va dato atto del positivo sforzo fatto dal legislatore europeo per eliminare la situazione di incertezza giuridica preesistente riguardo alla liceità o meno delle operazioni di estrazione automatizzata. L’inerzia dei titolari dei diritti nell’esprimersi a riguardo viene infatti superata, consentendo una maggiore sicurezza nel determinare le situazioni di liceità dell’impiego delle tecniche di mining.
Rimane tuttavia il dubbio che sul piano pratico tale eccezione risulti in uno scarso incremento dell’attività di elaborazione di dati da parte di soggetti – anche latu sensu – commerciali, poiché la clausola di opt-out prevista dalla Direttiva consente ai titolari dei diritti di riservare a se stessi la riproduzione delle loro opere e database.
In definitiva, sebbene le nuove eccezioni introdotte nel sistema del diritto d’autore contribuiscano positivamente a fornire una base più certa per l’adozione di tecniche di text and data mining, e di riflesso un incentivo all’attività di ricerca, ad una prima analisi vi è certamente il rischio che lo spazio di liceità previsto sia comunque eccessivamente ristretto perché ne possa derivare un sostanziale beneficio per l’innovazione scientifica e tecnologica europea.
A tale riguardo, forse uno spunto di miglioramento può derivare dalla concreta applicazione che di tali eccezioni verrà fatta nella pratica e in particolar modo dalle corti chiamate a giudicarne, con l’auspicio che sappiano cogliere l’opportunità di garantirvi uno spazio di operatività il più ampio possibile.
[1] https://www.oracle.com/it/database/what-is-a-data-warehouse/
[2] Articolo 2 Direttiva 2001/29/CE del 22 maggio 2001 e articolo 13 L. 633/1941 (Legge Autore).
[3] Articolo 5 Direttiva 2001/29/CE del 22 maggio 2001 e articoli 4 e 18 L. 633/1941 (Legge Autore).
[4] Articolo 3.1 Direttiva 2001/29/CE del 22 maggio 2001 e articoli 15, 15-bis, 16 e 16-bis 18 L. 633/1941 (Legge Autore).
[5] Articolo 7 Direttiva 96/9/CE dell’11 marzo 1996, recepita dal D.Lgs. 169/99 che ha introdotto i nuovi articoli 102-bis e 102-ter nella Legge 633/1941 (Legge Autore).
[6] Per una definizione degli elementi costitutivi di un database si veda l’opinione dell’Avvocato Generale Stix-Hackl nel caso Fixtures Marketing: https://curia.europa.eu/juris/liste.jsf?num=C-444/02
[7] Per una approfondita analisi dell’armonizzazione europea del diritto d’autore alla luce della giurisprudenza comunitaria: https://www.ivir.nl/publicaties/download/710.pdf
[8] Articolo 5.1 Direttiva 2001/29/CE del 22 maggio 2001.
[9] Articolo 5.3 (a) Direttiva 2001/29/CE del 22 maggio 2001, articoli 6.2 (b) e 9 (b) Direttiva 96/9/CE dell’11 marzo 1996.
[10] Articolo 8.1 Direttiva 96/9/CE dell’11 marzo 1996.
[11] Direttiva (EU) 790/2019 sul diritto d’autore e sui diritti connessi nel mercato unico digitale.