2021-09-30T15:32:28+00:00

Project Description

Produkty

eXtracToolbox

eXtracToolbox to zestaw narzędzi do ekstrakcji informacji z zeskanowanych dokumentów analogowych (papierowych). Wykorzystuje on zaawansowane algorytmy sztucznej inteligencji, aby odnajdywać, rozpoznawać i wydobywać informacje z nieustrukturyzowanych treści. Rozwiązanie to wykorzystuje m.in. algorytmy Named Entity Recognition oraz  Relation Detection.

eXtracToolbox posiada predefiniowane konfiguracje do wydobywania informacji z dokumentów o charakterze prawnym oraz urzędowym, np. aktów notarialnych, zawiadomień z ksiąg wieczystych oraz szerokiego zestawu dokumentów wchodzących w skład operatów geodezyjnych np. szkice polowe, wykazy współrzędnych.

Narzędzie ma formę usługi z klienckimi aplikacjami webowymi (graficzny interfejs użytkownika) i jest przygotowane do integracji z dowolnymi repozytoriami plików, systemami bazodanowymi (DBMS) czy usługami. Posiada możliwość zwracania danych w dowolnym formacie i protokole.

Kluczowe funkcjonalności eXtracToolbox:

  • Pozwala wydobywać zestawy informacji z dowolnych skanowanych dokumentów rastrowych (z OCR lub bez),
  • Posiada predefiniowane konfiguracje dla dokumentacji o charakterze urzędowym, prawnym oraz dla dokumentacji o charakterze geodezyjnym,
  • Posiada mechanizmy uczenia, dzięki którym możliwe jest przystosowanie narzędzia do dowolnych typów dokumentów,
  • Umożliwia zapis danych w wyjściowych w dowolnym formacie np. xml, json, rdf, csv lub import do dowolnej bazy danych np. PostreSQL, MSSQL, Oracle,
  • Pozwala na bardzo łatwą i szybką integrację z dowolnymi systemami i usługami,
  • Posiada udokumentowane API oraz elastycznie dostępny interfejs.

Oprogramowanie zostało opracowane w ramach projektu “Budowa Bazy Wiedzy o Nieruchomościach”, współfinansowanego przez Narodowe Centrum Badań i Rozwoju.