FutureTDM – start projektu

Gdyby wszystkie dane wytwarzane przez ludzkość nagrać na płyty CD i układać jedna na drugiej, to powstałoby kilka wież sięgających z Ziemi do Księżyca. Już w 2012 roku specjaliści z IBM szacowali, że każdego dnia wytwarzamy 2,5 tryliona bajtów danych. Oczywiście takiej ilości informacji nie potrafiłby przeanalizować żaden człowiek. Dlatego potrzebujemy narzędzi, które są w stanie automatycznie przetwarzać i selekcjonować dane według interesujących nas kryteriów. Efekty takiej analizy mogą przyspieszyć diagnostykę wielu chorób czy ostrzec przed zbliżającym się trzęsieniem ziemi. Narzędziem ułatwiającym takie działania jest Text and Data Mining (TDM) –  interdyscyplinarna metoda eksploracyjnej, komputerowej analizy danych.

Bariery prawne

Wykorzystanie pełnego potencjału TDM napotyka niestety na bariery prawne. Wyobraźmy sobie sytuację, w której opublikowane w tysiącach artykułów wyniki badań nad lekarstwem na raka analizuje ogromny zespół naukowców. Z punktu widzenia prawa takie działanie będzie dozwolone, ale za to mogłoby zająć kilka lat. Czas ten można zdecydowanie skrócić wykorzystując komputery. I tu już pojawia się problem. Aby zrealizować takie zadanie maszyny muszą wykonać kopię analizowanego materiału. W świetle prawa autorskiego i ochrony baz danych istnieją wątpliwości co do legalności takiego działania.

Wydawcy artykułów naukowych i właściciele baz danych chcą mieć kontrolę nad tym kto i jak analizuje te zasoby, dlatego zabraniają eksploracji tekstu i danych w regulaminach stron i umowach. Jest to sporym utrudnieniem nie tylko dla naukowców, ale dla każdego, kto szuka ważnych informacji.

FTDM-LOGO_L

Projekt FutureTDM

Dlatego właśnie realizowany jest projekt FutureTDM, który wystartował w połowie września tego roku. Spotkanie międzynarodowego konsorcjum, którego jesteśmy członkiem, odbyło się w Wiedniu. Wśród zaangażowanych ekspertów są m.in. Lucie Guibault (od wielu lat specjalizująca się w prawnych aspektach TDM), czy Petter Murray – Rust, autor hasła The right to read is the right to mine, które nawołuje do zniesienia barier prawnych TDM.

W ramach realizowanych działań będziemy ściśle współpracować z projektem OpenMinTed nastawionym na technologiczne aspekty eksploracji tekstu i danych. Wkrótce więcej informacji na temat tych projektów na naszym blogu.

Obrazek „The right to READ” pochodzi ze strony http://ubiquitypress.tumblr.com/post/96012592921/the-right-to-read-is-the-right-to-mine

 

flag_yellow_low
This project has received funding from the European Union’s Horizon 2020 research and innovation programme under grant greement No 665940.