Nowe badanie: Wyzwania prawnoautorskie w rozwoju otwartej sztucznej inteligencji w Unii Europejskiej
Na drodze ambitnych planów Unii Europejskiej wokół suwerenności cyfrowej i wspierania innowacji stoi poważna przeszkoda: realia prawne.
Autor: Koncern Ilustrowany Kurier Codzienny – Archiwum Ilustracji / Narodowe Archiwum Cyfrowe
Finansowane ze środków UE konsorcja akademickie prężnie budują duże modele językowe (LLM), którym przyświecają idee otwartego oprogramowania i niesienia pożytku publicznego. Jednak, jak wynika z naszego badania, twórcy systemów AI z sektora publicznego i środowisk open source nieustannie wpadają w zawiłą sieć niejasności i ograniczeń natury prawnoautorskiej.
Raport „Copyright challenges in open-source AI development in the European Union” (Maja Drabczyk, Alek Tarkowski) powstał na zlecenie Stowarzyszenia COMMUNIA i został opracowany we współpracy z Open Future. Czas publikacji jest nieprzypadkowy – badanie było krokiem do udzielenia jak najpełniejszej odpowiedzi w zakończonych w minionym tygodniu konsultacjach Komisji Europejskiej wokół ewaluacji Dyrektywy o prawie autorskim na jednolitym rynku cyfrowym (CDSM) z 2019 roku.
Sprawdziliśmy, jak w praktyce działają wyjątki badawcze, w szczególności te dotyczące eksploracji tekstów i danych (TDM), wprowadzone przez Dyrektywę. Wnioski na temat realiów tych przepisów zebraliśmy w oparciu o osiem wywiadów pogłębionych z ekspertami i ekspertkami kluczowych europejskich projektów AI: m.in. OpenEuroLLM, Pleias, PLLUM czy SOOFI. Wskazujemy na obszary, które paraliżują rozwój europejskich nowych technologii.
Dyrektywa CDSM wprowadza dwa obowiązkowe wyjątki dla TDM. Artykuł 3. pozwala instytucjom naukowym i instytucjom dziedzictwa kulturowego na eksplorację danych do celów badawczych. Z kolei Artykuł 4. zezwala wprawdzie na TDM ogólnego przeznaczenia, ale daje właścicielom praw możliwość zgłoszenia sprzeciwu (mechanizm opt-out). Nasza analiza pokazuje, że ten podział rodzi strukturalne konflikty. Projekty finansowane z publicznych środków muszą zazwyczaj udostępniać swoje modele w otwartym dostępie, co pozwala na ich wykorzystanie także w projektach komercyjnych. Przez to działy prawne ośrodków akademickich często odradzają powoływanie się na Art. 3., jako że ogranicza się on wyłącznie do celów badawczych. Jak ujął to jeden z rozmówców:
„To, że jesteśmy instytucją naukową, wcale nie dawało nam prawa do działania wyłącznie na podstawie Artykułu 3. – kluczowy okazał się cel, do jakiego model ma służyć.” (IDI)
W efekcie zespoły realizujące projekty finansowane z publicznych środków są zmuszone opierać się na znacznie bardziej restrykcyjnym Artykule 4. W tej sytuacji twórcy marnują swoje zasoby: czasu, mocy obliczeniowej i finansowe na analizowanie najróżniejszych, niestandardowych klauzul zastrzeżeń (opt-out).
„Brakuje jednego standardu – w przeciwieństwie do, powiedzmy, zastrzeżeń w branży farmaceutycznej, gdzie obowiązuje sztywna, powszechnie znana formuła. Tutaj informacje o ograniczeniach przyjmują najróżniejsze formy. To rodzi zasadnicze pytanie: która z nich jest prawnie wiążąca, a którą można zignorować?” (IDI)
Kluczowe rekomendacje: Zabezpieczenie przyszłości Otwartej Nauki w UE
Aby europejska, tworzona z myślą o pożytku publicznym sztuczna inteligencja mogła być swobodnie skalowana, proponujemy zestaw konkretnych zmian systemowych:
- Doprecyzowanie wyjątków dotyczących TDM: Unijne prawo musi jasno stwierdzać, że trenowanie i rozwój sztucznej inteligencji poprzez eksplorację tekstów i danych, jest obszarem chronionym zarówno przez Art. 3., jak i 4. Ustawodawca powinien też potwierdzić, że wydanie modeli LLM na otwartych licencjach mieści się w granicach działalności badawczej z Art. 3. i nie odbiera instytucjom prawa do korzystania z tych ulg.
- Wprowadzenie ustawowego prawa do dzielenia się danymi: Decydenci powinni wzmocnić Artykuł 3., dając instytucjom naukowym wyraźne prawo do hostowania, udostępniania i ponownego publikowania oczyszczonych zbiorów danych treningowych na potrzeby recenzji naukowych i weryfikacji wyników.
- Stworzenie zasad „bezpiecznej przystani” (ang. safe harbors): Naukowcy i organizacje działające dla dobra publicznego, które przestrzegają procedur i działają w dobrej wierze, powinni być prawnie chronieni przed roszczeniami z tytułu praw autorskich i odpowiedzialnością cywilną.
- Budowa europejskiej bazy danych treningowych: Unia Europejska musi zainwestować we wspólną infrastrukturę cyfrową i stworzyć wysokiej jakości publiczne zasoby danych. Pozwoliłoby to realnie wdrożyć cele wspólnoty dotyczące otwartego dzielenia się wiedzą.
Aby wdrożyć teoretyczny model europejskiej suwerenności cyfrowej w praktyce, przepisy prawa autorskiego muszą realnie wspierać innowacje użyteczne społecznie, a nie paraliżować je ryzykiem procesów sądowych. Dobrze rozwijające się środowisko cyfrowe potrzebuje stabilnego fundamentu prawa, które uznaje Otwartą Naukę oraz powszechny dostęp do wiedzy i kultury za fundamentalne dobra wspólne.
Z pełnym raportem można zapoznać się na stronie Stowarzyszenia COMMUNIA.