Text and Data Mining

Czas trwania: 2016 - 2017

Obszary działań: Społeczny wymiar technologii

Ogromne ilości danych, jakie każdego dnia wytwarza ludzkość (zjawisko znanego szerzej, jako Big Data), zmuszają do poszukiwania narzędzi pozwalających w możliwie krótkim czasie na wyłowienie z tego morza konkretnych informacji, które będzie można przekuć w konkretną wiedzę.

Czym jest TDM?

Jednym z narzędzi jest Text and Data Mining (TDM) – interdyscyplinarna metoda eksploracyjnej, komputerowej analizy danych. TDM pozwala zautomatyzować proces przetwarzania danych, umożliwiając ich szybką klasyfikację, grupowanie, czy też ustalenie wzajemnych zależności. Do narzędzi TDM zalicza się m.in. programy służące do obróbki dokumentów tekstowych pozwalające chociażby tworzyć streszczenia artykułów i raportów. Narzędzia TDM umożliwiają więc wydobywanie informacji zawartych w materiale źródłowym bez konieczności bezpośredniego zapoznawania się z nim.

Projekt “FutureTDM”

Celem projektu realizowanego przez międzynarodowego konsorcjum, którego częścią jest Centrum Cyfrowe, jest zidentyfikowanie przeszkód (na poziomie prawnym, politycznym i organizacyjnym), stojących na drodze wykorzystania pełnego potencjału, jaki daje TDM. Efektem tych analiz będzie opracowanie rekomendacji na poziomie europejskim. Dodatkowo, projekt przyczyni się do popularyzacji samej koncepcji eksploracji danych oraz zaangażowania zróżnicowanego środowiska interesariuszy. Centrum Cyfrowe odpowiedzialne będzie w szczególności za analizy otoczenia prawnego oraz opracowanie raportu dotyczącego potencjału ekonomicznego możliwych przyszłych sposobów wykorzystania TDM.

Członkowie konsorcjum projektu “Future TDM”:

Synyo GmbH (koordynator)
Stichting Liber
Open Knowledge Foundation
Stichting Katholieke Universiteit
The British Library Board
Universiteit van Amsterdam
Athena Research and Innovation Center in Information, Communication & Knowledge Technologies
Ubiquity Press Ltd.
Centrum Cyfrowe Projekt: Polska

flag_yellow_low
 This project has received funding from the European Union’s Horizon 2020 research and innovation programme under grant greement No 665940.