Rozwiązania
SegmEdit
Program SegmEdit umożliwia przeglądanie i edycję plików XML (w formacie TrueViz) zawierających informacje o strukturze dokumentów PDF (słowa, wiersze, strefy) oraz o klasyfikacji stref (tytuł, autor, abstrakt itp.). Jednym z elementów programu jest serwer odpowiedzialny za sieciową dystrybucję dokumentów do przetworzenia.
SegmEdit powstał w celu utworzenia zbioru testowego dla algorytmów segmentacji dokumentów i klasyfikacji stref, które są częścią realizowanego przez nas procesu ekstrakcji metadanych.
Jest to otwarte oprogramowanie, napisane w języku Python z wykorzystaniem biblioteki wxWidgets. Kod na licencji GPL v3 jest do ściągnięcia z naszego repozytorium: https://svn.ceon.pl/research/SegmEdit/.