Τεχνητή Νοημοσύνη και πνευματική ιδιοκτησία: Η χρήση έργων ως δεδομένων εκπαίδευσης παραγωγικών συστημάτων ΑΙ
Σύντομο σχόλιο με αφορμή την απόφαση LAION, την πρώτη απόφαση στην ΕΕ για την ερμηνεία των ρυθμίσεων Τext Αnd Data Mining σε σχέση με την ΑΙ
11/11/2024
Δύο είναι τα βασικά θέματα στα οποία διασταυρώνεται η χρήση της τεχνητής νοημοσύνης με την πνευματική ιδιοκτησία:
Α) το πρώτο αφορά το στάδιο της εισόδου δεδομένων, “input”, και ιδίως την εκπαίδευσης των συστημάτων ΤΝ με χρήση έργων προστατευόμενων με δικαίωμα πνευματικής ιδιοκτησίας και τις προϋποθέσεις νομιμότητας της πράξης αυτής
Β) το δεύτερο αφορά στο στάδιο της εξόδου, «output», του παραγόμενου αποτελέσματος και κατά πόσο αυτό μπορεί να είναι προστατευτέο με δικαίωμα πνευματικής ιδιοκτησίας. Στο ερώτημα αυτό οι απαντήσεις εξαρτώνται εν πολλοίς από το βαθμό ανθρώπινης δημιουργικής συμβολής που τυχόν μπορεί να τεκμηριωθεί. Αν πρόκειται δηλαδή για αμιγώς παραγόμενα έργα από μια εφαρμογή ΑΙ (ai produced), οπότε κατά κανόνα δεν θα υπάρχει αναγνώριση δικαιώματος ΠΙ ή αν πρόκειται για έργα υποβοηθούμενα από εφαρμογές ΤΝ, οπότε μπορεί να υπάρχει προστασία.
Αμφότερα τα ζητήματα απασχολούν τη θεωρία και είναι στο επίκεντρο ακαδημαϊκών συζητήσεων αλλά και προσπάθειας πρακτικής εφαρμογής νομικών λύσεων από τη νομική κοινότητα που παρέχει υπηρεσίες είτε στην πλευρά της αμιγώς τεχνολογικής βιομηχανίας είτε στην πλευρά της δημιουργικής – πολιτιστικής βιομηχανίας. Τα ζητήματα αυτά ήταν στο επίκεντρο του διεθνούς συνεδρίου της διεθνούς ένωσης για την πνευματική ιδιοκτησία ALAI στο Παρίσι το 2023. Οι περισσότερες παρουσιάσεις αλλά και οι απαντήσεις των εθνικών αντιπροσωπειών της ένωσης είναι ελεύθερα προσβάσιμες στην ιστοσελίδα του συνεδρίου.
Το πρώτο ζήτημα, της εκπαίδευσης των συστημάτων TN με προ- υπάρχοντα έργα, συνδέεται συχνά με τη διαδικασία της εξόρυξης κειμένων και δεδομένων (Text and Data Mining, TDM). Ως «εξόρυξη κειμένων και δεδομένων» νοείται κάθε αυτοματοποιημένη αναλυτική τεχνική που αποσκοπεί στην ανάλυση κειμένων και δεδομένων σε ψηφιακή μορφή με στόχο την παραγωγή πληροφοριών, όπως προτύπων, τάσεων και συσχετισμών, σύμφωνα με τον ορισμό που έδωσε η ΕΕ στην Οδηγία (ΕΕ) 2019/790 για τα δικαιώματα πνευματικής ιδιοκτησίας και τα συγγενικά δικαιώματα στην ψηφιακή ενιαία αγορά και ενσωματώθηκε στο εθνικό δίκαιο με το ν. 4996/2022.
Σύμφωνα με την ίδια οδηγία, εν ολίγοις, επιτρέπεται να προβαίνει κάποιος σε εξόρυξη, εάν αυτή «δεν έχει ρητά περιοριστεί από τους δικαιούχους των δικαιωμάτων τους με κατάλληλο τρόπο, όπως με μηχαναναγνώσιμα μέσα για την περίπτωση περιεχομένου που έχει καταστεί διαθέσιμο κοινό επιγραμμικά» (α. 4 παρ. 3 οδηγίας) ή αν οι πράξεις εξόρυξης «πραγματοποιούνται από ερευνητικούς οργανισμούς και ιδρύματα πολιτιστικής κληρονομιάς, με σκοπό τη διεξαγωγή, για τους σκοπούς της επιστημονικής έρευνας, της εξόρυξης κειμένων και δεδομένων από έργα ή άλλα αντικείμενα προστασίας υλικό στα οποία έχουν νόμιμη πρόσβαση.» (α. 3 παρ. 1 ίδια οδηγίας)
Σύμφωνα με την Πράξη για την ΤΝ (Κανονισμός 2024/1689), που πρόσφατα δημοσιεύθηκε για την ανάπτυξη και την εκπαίδευση των μεγάλων παραγωγικών μοντέλων ΤΝ, απαιτείται πρόσβαση σε τεράστιο όγκο κειμένων, εικόνων, βίντεο και άλλων δεδομένων και ότι οι τεχνικές εξόρυξης κειμένων και δεδομένων μπορούν να χρησιμοποιούνται εκτενώς στο πλαίσιο αυτό για την ανάκτηση και την ανάλυση τέτοιου περιεχομένου, το οποίο ενδέχεται να προστατεύεται από δικαιώματα πνευματικής ιδιοκτησίας και συγγενικά δικαιώματα. Για κάθε χρήση περιεχομένου που προστατεύεται με δικαιώματα πνευματικής ιδιοκτησίας, απαιτείται η άδεια του οικείου δικαιούχου, εκτός εάν ισχύουν σχετικές εξαιρέσεις και περιορισμοί όσον αφορά τα δικαιώματα πνευματικής ιδιοκτησίας. Στο προοίμιο του Κανονισμού, αποσαφηνίζεται επίσης ότι «οι πάροχοι μοντέλων ΤΝ γενικού σκοπού θα πρέπει να εφαρμόζουν πολιτική συμμόρφωσης με το ενωσιακό δίκαιο για τα δικαιώματα πνευματικής ιδιοκτησίας και τα συγγενικά δικαιώματα, ειδικότερα δε για τον εντοπισμό και τη συμμόρφωση με τη διατήρηση των δικαιωμάτων των δικαιούχων κατά τα προβλεπόμενα στο άρθρο 4 παράγραφος 3 της οδηγίας (ΕΕ) 2019/790. Κάθε πάροχος που διαθέτει μοντέλο ΤΝ γενικού σκοπού στην αγορά της Ένωσης θα πρέπει να συμμορφώνεται με την υποχρέωση αυτή, ανεξάρτητα από τη δικαιοδοσία στην οποία λαμβάνουν χώρα οι σχετικές με τα δικαιώματα πνευματικής ιδιοκτησίας πράξεις στις οποίες βασίζεται η εκπαίδευση των εν λόγω μοντέλων ΤΝ γενικού σκοπού. »
Πρόσφατα, Δικαστήριο του Αμβούργου εξέδωσε την πρώτη απόφαση σχετικά με το ζήτημα της εφαρμογής της διάταξης για την εξόρυξη των δεδομένων στο πλαίσιο συστήματος ΑΙ. Στην υπόθεση αυτή ένας φωτογράφος κατέθεσε αγωγή κατά του μη κερδοσκοπικού οργανισμού LAION ο οποίος είχες ως σκοπό την προώθηση της έρευνας στον τομέα της Τεχνητής Νοημοσύνης μέσω της παροχής ανοικτών συνόλων δεδομένων για σκοπούς εκπαίδευσης. Η δράση του LAION είχε ως αποτέλεσμα να έχει δημιουργηθεί ένα σύνολο δεδομένων που αποτελείται από σχεδόν έξι δισεκατομμύρια ζεύγη εικόνων-κειμένου. Μία από αυτές τις έξι δισεκατομμύρια εικόνες ανήκε στον ενάγοντα, ο οποίος είχε ανεβάσει τη φωτογραφία του σε έναν ιστότοπο με φωτογραφίες. Οι όροι χρήσης του εν λόγω ιστότοπου φωτογραφικών αποθεμάτων, ωστόσο, ανέφεραν ότι οι εικόνες δεν μπορούν να χρησιμοποιηθούν για «αυτοματοποιημένα προγράμματα». Η LAION χρησιμοποίησε την εικόνα του ενάγοντος από αυτόν τον ιστότοπο και την συμπεριέλαβε στο σύνολο δεδομένων εκπαίδευσης. Ο ενάγων ισχυρίστηκε ότι υπήρξε προσβολή των δικαιωμάτων πνευματικής ιδιοκτησίας, υποστηρίζοντας ότι δεν ίσχυε κανένας από τους περιορισμούς των δικαιωμάτων πνευματικής ιδιοκτησίας και ιδίως οι περιορισμοί για την εξόρυξη κειμένου και δεδομένων. Το δικαστήριο απέρριψε την αγωγή, αναγνωρίζοντας ότι η LAION ενόψει και του μη κερδοσκοπικού χαρακτήρα της μπορούσε να επωφεληθεί από τον περιορισμό της εξόρυξης δεδομένων (TDM) για επιστημονικούς σκοπούς. Δεν επιχειρηματολόγησε όμως ως προς τι γίνεται αν ακολουθήσει περαιτέρω αξιοποίηση της έρευνας του μη κερδοσκοπικού ιδρύματος από εμπορικούς φορείς. Είναι αρκετά τα ερωτήματα που άφησε αναπάντητα η απόφαση αυτή και μένει να δούμε αν ο φωτογράφος θα ασκήσει έφεση κατά αυτής.
Είναι αξιοσημείωτο ότι η συγκεκριμένη ενέργεια εντάσσεται σε ένα ευρύτερο πλαίσιο αντιδικίας δικαιούχων προστασίας με τους φορείς ανάπτυξης συστημάτων ΤΝ (AI developpers). Στις ενέργειες των δικαιούχων προστασίας κατά άλλων εταιριών Τεχνητής Νοημοσύνης, συμπεριλαμβάνεται μια ομαδική αγωγή κατά των Stability AI, Midjourney και DeviantArt για τη χρήση υλικού που προστατεύεται με δικαίωμα πνευματικής ιδιοκτησίας, συμπεριλαμβανομένων εικόνων από τα σύνολα δεδομένων της LAION, για την εκπαίδευση των μοντέλων τους. Παρόμοιες υποθέσεις έχουν ασκηθεί εναντίον κατασκευαστών εφαρμογών «παραγωγής» μουσικής (music generators) και βοηθών δημιουργίας κώδικα (coding assistants). Όλες αυτές οι δικαστικές ενέργειες, οι οποίες βρίσκονται σε εξέλιξη, βασίζονται στον ισχυρισμό των δικαιούχων ότι η εκπαίδευση σε σύνολα δεδομένων στα οποία περιλαμβάνονται έργα παραβιάζει το δίκαιο πνευματικής ιδιοκτησίας. Η νομική θεμελίωση των εκατέρωθεν ισχυρισμών είναι δυσχερής και περιπλέκεται από τεχνικά ζητήματα.
Παράλληλα, αξίζει να προστεθεί ότι έχει ανοίξει η συζήτηση για την αναζήτηση νέων μοντέλων αδειοδότησης και είσπραξη αμοιβής των δικαιούχων που θα ανταποκρίνεται στην νέα πραγματικότητα της εποχής της τεχνητής νοημοσύνης.
Διαχρονικά το δίκαιο της πνευματικής ιδιοκτησίας εξαρτιόνταν από τις εξελίξεις της τεχνολογίας και προσαρμόζονταν σε αυτές. Ζούμε ακριβώς αυτό: την εποχή που για άλλη μια φορά το δίκαιο πνευματικής ιδιοκτησίας θα πρέπει να αναμορφωθεί για να επιβιώσει.