topqualityessays.com

OCR dla dokumentów prawno-finansowych

Technologia OCR jest rozwijana od dziesięcioleci. Na rynku od lat działa wiele firm z produktami które potwierdziły swoją skuteczność. Głównym zadaniem dostepnych rozwiązań OCR jest zmienianie skanów ciągłego tekstu na edytowalny ciąg znaków.  Rozwiązania konkurencji najczęściej są optymalizowane w celu przetwarzania dokumentów zawierających teksty ciągłe (e.g. książki, gazety czy umowy). Dużym problemem natomiast pozostają dokumenty nieustrukturalizowane, zawierające dużo treści niedających się zesłownikować (np. numery faktur, kody produktów, etc …). W tego typu przypadkach każdy błąd rozpoznania znaku może spowodować daleko idące konsekwencje, choćby przelanie złej kwoty, zaliczenie podatku VAT niewłaściwemu kontrahentowi itp.

Nasze rozwiązanie adresuje te problemy, maksymalizując stopień rozpoznania poszczególnych znaków, podziału zdań i wyrazów, rozpoznanie układu tabel, ale również stosując inteligentne słowniki, rozumiejące zagadnienia spotykane na fakturach i dokumentach prawnych – potrafiące wykryć i poprawić typowe błędy (takie jak np. sumy kontrolne w NIP, sposób zapisu adresów, stopnie podatkowe, imiona i nazwiska, kwoty, które powinny się poprawnie sumować itp.).

System jest zoptymalizowany aby rozponawać czcionki które występują na:

 

Nasz system jest wykorzystywany najczęściej w systemach automatycznego procesowania dokumentów.