FutureTDM – start projektu
Gdyby wszystkie dane wytwarzane przez ludzkość nagrać na pÅ‚yty CD i ukÅ‚adać jedna na drugiej, to powstaÅ‚oby kilka wież siÄ™gajÄ…cych z Ziemi do Księżyca. Już w 2012 roku specjaliÅ›ci z IBM szacowali, że każdego dnia wytwarzamy 2,5 tryliona bajtów danych. OczywiÅ›cie takiej iloÅ›ci informacji nie potrafiÅ‚by przeanalizować żaden czÅ‚owiek. Dlatego potrzebujemy narzÄ™dzi, które sÄ… w stanie automatycznie przetwarzać i selekcjonować dane wedÅ‚ug interesujÄ…cych nas kryteriów. Efekty takiej analizy mogÄ… przyspieszyć diagnostykÄ™ wielu chorób czy ostrzec przed zbliżajÄ…cym siÄ™ trzÄ™sieniem ziemi. NarzÄ™dziem uÅ‚atwiajÄ…cym takie dziaÅ‚ania jest Text and Data Mining (TDM) –  interdyscyplinarna metoda eksploracyjnej, komputerowej analizy danych.
Bariery prawne
Wykorzystanie pełnego potencjału TDM napotyka niestety na bariery prawne. Wyobraźmy sobie sytuację, w której opublikowane w tysiącach artykułów wyniki badań nad lekarstwem na raka analizuje ogromny zespół naukowców. Z punktu widzenia prawa takie działanie będzie dozwolone, ale za to mogłoby zająć kilka lat. Czas ten można zdecydowanie skrócić wykorzystując komputery. I tu już pojawia się problem. Aby zrealizować takie zadanie maszyny muszą wykonać kopię analizowanego materiału. W świetle prawa autorskiego i ochrony baz danych istnieją wątpliwości co do legalności takiego działania.
Wydawcy artykułów naukowych i właściciele baz danych chcą mieć kontrolę nad tym kto i jak analizuje te zasoby, dlatego zabraniają eksploracji tekstu i danych w regulaminach stron i umowach. Jest to sporym utrudnieniem nie tylko dla naukowców, ale dla każdego, kto szuka ważnych informacji.
Projekt FutureTDM
Dlatego wÅ‚aÅ›nie realizowany jest projekt FutureTDM, który wystartowaÅ‚ w poÅ‚owie wrzeÅ›nia tego roku. Spotkanie miÄ™dzynarodowego konsorcjum, którego jesteÅ›my czÅ‚onkiem, odbyÅ‚o siÄ™ w Wiedniu. WÅ›ród zaangażowanych ekspertów sÄ… m.in. Lucie Guibault (od wielu lat specjalizujÄ…ca siÄ™ w prawnych aspektach TDM), czy Petter Murray – Rust, autor hasÅ‚a The right to read is the right to mine, które nawoÅ‚uje do zniesienia barier prawnych TDM.
W ramach realizowanych działań będziemy ściśle współpracować z projektem OpenMinTed nastawionym na technologiczne aspekty eksploracji tekstu i danych. Wkrótce więcej informacji na temat tych projektów na naszym blogu.
Obrazek „The right to READ” pochodzi ze strony http://ubiquitypress.tumblr.com/post/96012592921/the-right-to-read-is-the-right-to-mine