Wspierajmy lokalne repozytoria
Na blogu Komisji Europejskiej komisarz Neelie Kroes ogÅ‚osiÅ‚a poparcie dla stworzenia jednej, zestandaryzowanej licencji dla otwartych danych w Europie oraz wyraziÅ‚a potrzebÄ™ zbudowania jednego „paneuropejskiego“ repozytorium danych. O ile cieszy mnie fakt, że komisarz wyraża takie opinie, to jednak budzÄ… one we mnie pewne obawy. Ciężko wypowiedzieć mi siÄ™ na temat jednej licencji, bo jestem jedynie jej potencjalnym użytkownikiem i nie angażujÄ™ siÄ™ bezpoÅ›rednio w tworzenie prawa. Inaczej jest jednak w przypadku repozytorium danych – współtworzÄ™ technologie otwartoÅ›ci w Polsce i ta część posta na blogu Kroes zmartwiÅ‚a mnie bardzo.
PomysÅ‚ stworzenia jednego, paneuropejskiego repozytorium danych od razu wywoÅ‚uje w moich myÅ›lach wizjÄ™, w której ogÅ‚asza siÄ™ przetarg na projekt architektoniczny budynku serwerowni, nastÄ™pnie ogÅ‚asza kilka przetargów na realizacjÄ™ technologicznÄ… i merytorycznÄ… projektu, zatrudnia kilkadziesiÄ…t osób utrzymujÄ…cych infrastrukturę itd., by ostatecznie wznieść gmach Archiwum. To wizja budowania centralnej biblioteki, która w jednym miejscu zbierze całą wiedzÄ™, produkowanÄ… przez wydawnictwa z najdalszych zakÄ…tków kontynentu, która otworzy program kwerend i stypendiów oraz zmagać siÄ™ bÄ™dzie ze stworzeniem ujednoliconego systemu katalogowania zbiorów. Problem jest tylko taki, że tempo rozwoju internetu, a wraz z nim spoÅ‚eczeÅ„stwa informacyjnego, nie daje – w mojej opinii – szans takiemu myÅ›leniu.
SÄ… dwa poziomy, na których warto spojrzeć na ten problem – spoÅ‚eczny i technologiczny. W pierwszym wypadku mam poczucie, że żyjemy w czasach, w których zróżnicowanie spoÅ‚ecznoÅ›ci lokalnych jest czymÅ› oczywistym. Inne potrzeby majÄ… ÅšlÄ…zacy na Opolszczyźnie, inne Kaszubi na Pomorzu. Inne majÄ… mieszkaÅ„cy Walii, inne Transylwanii. Paneuropejskie centrum danych naraża nas na próbÄ™ „wyrównania“ tych różnic. I można by powiedzieć, że w wypadku samego korzystania z danych publicznych nie ma aż tak wielkich różnic (choć i to byÅ‚oby odważnÄ… tezÄ…), ale mówiÄ…c o publikowaniu danych te różnice sÄ… ogromne. Każda spoÅ‚eczność ma swoje powody publikowania danych, każdorazowi odbiorcy różnić siÄ™ bÄ™dÄ… poziomem umiejÄ™tnoÅ›ci, dostÄ™pnoÅ›ci internetu, urzÄ…dzeÅ„ mobilnych i konkretnych potrzeb spoÅ‚ecznoÅ›ci oraz ram prawnych w jakich funkcjonujÄ… (nie wszystkie dane poddadzÄ… siÄ™ prostemu uogólnionemu licencjonowaniu). SkoÅ„czy siÄ™ na tym, że lokalni dziaÅ‚acze publikować bÄ™dÄ… dane dwukrotnie – raz na wÅ‚asnych platformach stworzonych dla potrzeb wÅ‚asnej spoÅ‚ecznoÅ›ci oraz drugi raz w paneuropejskim archiwum. W praktyce zaÅ› publikować bÄ™dÄ… jedynie u siebie, bo i tak bÄ™dÄ… musieli budować portale, na których dane te wykorzystajÄ…. Rozwój technologii pozwala w dzisiejszych czasach na bardzo szybkie i bardzo tanie tworzenie tzw. aplikacji webowych, wiÄ™c dylemat, czy tylko portal wykorzystujÄ…cy dane, czy jednak portal wraz z przestrzeniÄ… publikacji, jest zupeÅ‚nie nieaktualny.
Na poziomie technologicznym zaÅ› budowanie wielkich archiwów narażone jest na te same problemy, na które narażone byÅ‚y wielkie systemy biblioteczne – zanim zostaÅ‚y wdrożone, byÅ‚y już przestarzaÅ‚e. Jak Å‚atwo siÄ™ domyÅ›leć, realizacja takiego projektu to przynajmniej dwa, trzy lata. Wydaje siÄ™ niewiele, jak na skalÄ™ przedsiÄ™wziÄ™cia. Dwa lub trzy lata w internecie to jednak nie to samo, co dwa lub trzy lata na budowie. NajwiÄ™ksze portale spoÅ‚ecznoÅ›ciowe w ciÄ…gu pierwszych dwóch, trzech lat swojej dziaÅ‚alnoÅ›ci zdobywaÅ‚y miliony użytkowników, zmieniajÄ…c ksztaÅ‚t internetu w coÅ›, co od pewnego momentu nazywamy Web 2.0. ByÅ‚y systemy informatyczne, których pomysÅ‚y zrodziÅ‚y siÄ™ przed tÄ… zmianÄ…, a wdrożone zostaÅ‚y już po niej. Problemem byÅ‚o to, że po drodze zmieniÅ‚ siÄ™ odbiorca, sposób funkcjonowania internetu w życiu prywatnym i zawodowym oraz technologie sÅ‚użące do budowania narzÄ™dzi Web 2.0. Wydaje mi siÄ™, że w tym sensie tworzenie maÅ‚ych narzÄ™dzi ma dziÅ› wiÄ™ksze szanse powodzenia, bo ich cykl produkcyjny to kilka miesiÄ™cy, a koszta czÄ™sto niezauważalne. JeÅ›li sprawdzÄ… siÄ™ w swoim zadaniu, bÄ™dzie można rozwijać je dalej.
Wydaje mi siÄ™, że komisarz zrobiÅ‚aby lepiej, popierajÄ…c budowÄ™ dużej liczby maÅ‚ych, lokalnych repozytoriów danych dbajÄ…c jedynie o ich przejrzystÄ… dokumentacjÄ™ (w tym dokumentacjÄ™ prawnÄ…) oraz interoperacyjność i otwartość, by ograniczać koszta produkcji i zapewnić możliwość tworzenia nowych na podstawie wielu rozproszonych rozwiÄ…zaÅ„. Z perspektywy programisty nie jest dla mnie problemem, że narzÄ™dzia, które tworzÄ™ pobierajÄ… dane jednoczeÅ›nie z czterech różnych portali. Problemem jest to, że dane zamkniÄ™te sÄ… w jednym portalu, który nie udostÄ™pnia ich na zewnÄ…trz w postaci publicznego API. Nie jest dla mnie problemem, że jakieÅ› ministerstwo publikuje dane w plikach excelowskich (choć wolaÅ‚bym oczywiÅ›cie otwarte formaty), problemem jest to, że ministerstwo chce te dane opublikować dopiero za trzy lata, kiedy zostanÄ… już porzÄ…dnie zsemantyzowane. WiÄ™kszość ludzi, którzy pracujÄ… „na froncie”, najczęściej potrzebuje jedynie podstawowej infrastruktury, by realizować swoje cele – nie jest im potrzebny kolejny centralny, gmach (czy weźmiemy w koÅ„cu na serio postulaty budowania platform?).
Wszytko to podsumowaÅ‚ kiedyÅ› jeden z moich znajomych mówiÄ…c: „Opublikujcie te dane w dowolnej postaci i dajcie mojej fundacji te pieniÄ…dze, które wydacie na zbudowanie sieci semantycznej i systemu do publikacji tych danych. My wiemy, jak dziaÅ‚ać na rzecz zmiany spoÅ‚ecznej i wiemy, do czego i komu te dane sÄ… potrzebne. Chodzi o udostÄ™pnianie danych po to, żeby ktoÅ› ich używaÅ‚, a nie budowanie wielkich repozytoriów, z których nikt nie bÄ™dzie korzystaÅ‚.”
Krzysztof Trzewiczek
* wyrażone w tekście opinie są prywatnym poglądem autora i nie są oficjalnym stanowiskiem Centrum Cyfrowego Projekt: Polska