Laboratorium KDD
Cele
W Laboratorium Odkrywania Wiedzy w Bazach Danych (Knowledge Discovery in Databases, KDD) koncentrujemy się na analizie pojedynczych dokumentów (np. wydobywanie metadanych, nadawanie kodów klasyfikacyjnych) oraz całych kolekcji (np. ustalanie tożsamości autorów, bibliometria). Zazwyczaj do rozwiązania problemów badawczych stosujemy nowoczesne techniki uczenia maszynowego, a nasze podejścia weryfikujemy przy użyciu obszernych kolekcji dokumentów będących w posiadaniu CeON (ponad 20 milionów rekordów metadanych, ponad 7,5 miliona pełnych tekstów).
Nasze zainteresowania powyższymi tematami wynikają z zaangażowania w krajowe i międzynarodowe projekty badawczo-rozwojowe, a także z wewnętrznych potrzeb (pożądane cechy produktów tworzonych przez zespół programistyczny w CeON).
Wyniki naszych badań są trojakie:
- Publikacje — innowacyjne wyniki naszych działań są prezentowane na odpowiednich konferencjach i w czasopismach (zobacz listę naszych publikacji).
- Prototypy — prototypowe oporogramowanie jest publicznie udostępniane na otwartych licencjach, a także jest integrowane w produktach zespołu programistycznego w CeON (zobacz nasze rozwiązania i nasze repozytorium kodu).
- API — zapewnimy dostęp maszynowy, poprzez serwisy sieciowe, do naszych algorytmów i metadanych.
Projekty
Laboratorium KDD uczestniczy obecnie w czterech dużych projektach.
EuDML: The European Digital Mathematics Library, czyli Europejska Matematyczna Biblioteka Cyfrowa stawia za cel stworzenie innowacyjnej platformy umożliwiającej dostęp do europejskiej spuścizny matematycznej. Projekt jest częściowo finansowany przez Program ramowy na rzecz konkurencyjności i innowacji Komisji Europejskiej. Nasze badania związane są z pakietami WP7 i WP8.
OpenAIRE+: Kontynuacja projektu Open Access Infrastructure for Research in Europe (OpenAIRE), stawia sobie za cel rozwinięcie otwartej infrastruktury partycypacyjnej dla informacji naukowej, Projekt jest finansowany ze środków Siódmego Programu Ramowego Komisji Europejskiej. Jesteśmy liderem pakietu WP7 tego projektu.
POLON: Projekt zamówiony przez Ministersto Nauki i Szkolnictwa Wyższego, częściowo finansowany ze środków Programu Kapitał Ludzki. Celem jest stworzenie systemu informacji naukowej dla szkolnictwa wyższego. Jesteśmy zaangażowani jest w podzadanie 25.1 projektu.
SYNAT: System Nauki i Techniki stawia za cel stworzenie uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy. Jest to projekt badawczy zlecony przez Narodowe Centrum Badań i Rozwoju (NCBiR). Jesteśmy zaangażowani w etap A3 projektu.
Ludzie
Nasz zespół składa się z magistrantów, doktorantów i post-doców w dziedzinie informatyki i matematyki. Członkowie:
- dr Łukasz Bolikowski
- Artur Czeczko
- Piotr Jan Dendek
- Tomasz Kuśmierczyk
- Michał Łukasik
- Michał Siemiończyk
- Dominika Tkaczyk