Hakaton Otwartych Danych 2013 – podsumowanie

Spotkanie z okazji Międzynarodowego Dnia Otwartych Danych zgromadziło w Centrum Cyfrowym ponad 50 osób, z czego blisko trzydziesci wzięło udział w części programistycznej wydarzenia.
Hakaton Otwartych Danych miał na celu znaleźć nowe zastosowania dla już dostępnych danych instytucji publicznych, doprowadzić do udostępnienia ciężko dostępnych danych programistom oraz wygenerować nowe zasoby informacyjne. Każdy z tych trzech celów zakończył się w dużej mierze sukcesem.

Open Data Day, Warsaw Edition
Projekty, które zostały rozpoczęte przez zespoły uformowane podczas hakatonu:

  1. Polska implementacja Politwoops, serwisu umożliwiającego podejrzenie tweetów wysłanych i usuniętych przez polityków. Projekt prowadzony przez Claygirl oraz Chastell jest w dużej części przetłumaczony, przerysowany oraz ma wprowadzoną garść poprawek do kodu. System powinien zostać uruchomiony publicznie w ciągu 2-3 tygodni, a wszystkie zaproponowane poprawki do oryginalnego kodu będą dostępne w sieci.
  2. Bibliopolis. Aplikacja webowa i mobilna, której głównym celem jest możliwość odnalezienia 5-10 ciekawych informacji o okolicy, w której się przebywa (np. przejazdem) za pomocą mechanizmu geolokalizacji. Informacje mają charakter ciekawostek turystycznych, które nie są powszechnie znane i dostępne np. jakiego lokalnie występującego dania warto spróbować lub jakiego wydarzenia w najbliższym czasie warto nie przegapić. Udostępniane przez aplikacje informacje zbierane są i publikowane przez biblioteki. Działający prototyp można znaleźć na stronie bibliopolis.q3k.me, sam projekt ma rozbudowane założenia i będzie nadal rozwijany. Informacja o zespole pracującym nad Bibliopolis – wkrótce.
  3. Bibliograficzna baza zawartości czasopism humanistycznych. Prace podjęte podczas hakatonu były krokiem do stworzenia serwisu do udostępnienia, uzupełniania, masowego importu i eksportu danych bibliograficznych. W ramach prac informatycznych wykonano konwersję danych z formatu bwmeta wykorzystywanego w zamkniętym systemie Yadda do bazy danych MongoDB i formatu JSON w znormalizowanej formie. Przekonwertowano 297 101 rekordów. Każdy z rekordów stanowi pełną informację bibliograficzną o jednym artykule z czasopisma. Łącznie udostępniono informacje o pełnej zawartości 242 tytułów czasopism z dziedzin humanistycznych i nauk społecznych. W ramach prac programistycznych wykonano kwerendę dotyczącą praktyk udostępniania informacji o zawartości czasopism. Podjęto prace nad usability systemu do prezentacji danych. Wyniki kwerend i stworzenie modelowych person pozwoliły sformułować listę funkcjonalności serwisu. Wszystkie wytworzone materiały zostały udostępnione w sieci. Nad projektem pracował zespół w składzie: Klaudia Grabowska, Jacek Głodek, Dominika Paleczna, Hanna Puchta, Iza Łach, Anna Plutecka, Dorota Szkodzińska, Michał Szczepański, Artur Szymański.
  4. Mobilna aplikacja do robienia zdjęć zabytków, umożliwiająca również weryfikację prawidłowości współrzędnych zabytku w bazie serwisu Otwarte Zabytki. System został doprowadzony do stanu działającego prototypu umożliwiającego działanie na danych geolokalizacyjnych, oraz prototypu aplikacji robiącej zdjęcia. Twórcy chcą doprowadzić przedsięwzięcie do udanego końca.
  5. Konwerter danych transportowych MPK Kraków ze strony WWW na format GTFS, umożliwiając programistom tworzenie aplikacji wykorzystujących rozkład jazdy. Projekt prowadzony przez Piotra Roszatyckiego, został doprowadzony do etapu, w którym duża część konwertera działa prawidłowo. Problemem do rozwiązania pozostaje m.in. pojawianie się „kursów widmo”, rozpoczynających trasę na nieprzewidzianych przystankach. Aktualny status projektu oraz opis głównych wyzwań można zobaczyć na stronie github.com/dex4er, zaś zdjęcie pokazujące jedną z tras opracowanych przy pomocy nowego konwertera jest dostępne w serwisie flickr
  6. Oprogramowanie do kopiowania danych z Biuletynów Informacji Publicznej do systemu Git, dzięki czemu możliwe jest prześledzenie historii zmian treści w BIPach. Projekt zapoczątkowany przez Mariusza Mazura został doprowadzony do etapu działającego prototypu – przez noc po hakatonie, stworzony przez Mariusza system mirrorował BIP jednego z ministerstw. System cały czas jest poprawiany, prawdopodobnie zostanie uzupełniony o funkcję szybkiego konwertowania plików PDF do postaci tekstowej oraz prosty system do podstawowych analiz. Po dokładnym przetestowaniu, całość zostanie udostępniona publicznie
  7. Rozszerzenie do systemu CiviCRM, umożliwiające wykorzystanie w nim baz danych zbieranych przez Sejmometr. Projekt jest koordynowany przez Michała Macha, stworzony w sobotę plugin wkrótce trafi do repozytorium rozszerzeń do CiviCRM.
  8. Budowa bazy danych i oprogramowania przyporządkowującego konkretną datę do składu rządu i parlamentu w danym momencie. System będzie rozwijany, a wśród jego pierwszych zastosowań będą tworzone w Centrum Cyfrowym prezentacje publicznych danych finansowych. Projekt koordynowany jest przez Alexa Urbanowicza, a efekt współpracy zespołu (Alex, Kamil Nikel, Piotr Janaszkiewicz oraz Karolina Pomarańska) można obejrzeć na stronie github.com/alexurbanowicz.
  9. Wizualizacja na mapie informacji zawartych w depeszach NOTAM, w celu ułatwienia planowania lotów przez pilotów „małego lotnictwa”. Zespół w składzie Antoni Grzymała, Paweł Lasek oraz Michał Kawalec przygotował działający prototyp. System będzie w dalszym ciągu rozwijany – działają już parsery komunikatów NOTAM oraz stworzono konwerter umożliwiający aktualizowanie informacji o współrzędnych stref w przestrzeni powietrznej.
  10. System umożliwiający obliczenie czasu przejazdu między dwoma punktami w Warszawie. Ma na celu dostarczenie odpowiednich danych osobom chcącym zaimplementować np funkcję „gdzie wynająć mieszkanie, by do pracy nie dojeżdżać dłużej niż kwadrans” w swoich serwisach internetowych. Projekt prowadzony przez Maćka Jaśkowskiego został doprowadzony do etapu działającego prototypu, umożliwiającego obliczenie czasu dojazdu na podstawie danych ZTM oraz zwizualizowanie tych danych na mapach Google. Projekt będzie w dalszym ciągu rozwijany przez autorów.

 
Informacja o projektach będzie uzupełniana, gdy tylko otrzymamy dodatkowe dane od twórców projektów.
 
Open Data Day, Warsaw Edition
 
Poza częścią programistyczną, podczas hakatonu można było wysłuchać prezentacji na temat otwartych danych i celów hakatonu (jej dłuższą wersję można znaleźć na stronach Slideshare) oraz opowieści, w jaki sposób unikać tworzenia aplikacji, które będą mało odkrywcze, albo po prostu kiepskie:

Odhd13 warsaw from Ton Zijlstra

 
W czasie hakatonu, ponaddwudziestoosobowy zespół pracował wspólnie z Grzegorzem Młynarskim nad nowymi, zaskakującymi sposobami wykorzystywania danych publicznych (na przykładzie zbiorów posiadanych przez przedsiębiorswa odpowiedzialne za czystość miast). Dokładny raport z warsztatów zostanie opublikowany po zakończeniu prac nad opracowaniem wyników.
 
Organizatorzy wydarzenia chcą bardzo podziękować wszystkim gościom, bez których warszawska edycja Międzynarodowego Dnia Otwartych Danych nie mogłaby zakończyć się sukcesem. Jednocześnie mamy nadzieję, że spotkamy się jeszcze nieraz, przy okazji kolejnych organizowanych w CC hakatonów oraz dyskusji poświęconych otwartym danym instytucji publicznych.