Skan dokumentu pdf - wyrównanie

Skan dokumentu pdf - wyrównanie
LU
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 58
0

Szukam rozwiązania które umożliwi mi automatyczne wyrównanie dokumentu faktury (skany mogą być wykonane krzywo) bez utraty jakości. Skany są w formacie pdf. Chciałbym aby na wyjściu też był pdf (byte[], Stream), ponieważ stron w pdfie może być wiele, żeby tego nie dzielic na pojedyńcze obrazki.

UglyMan
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 2206
0

Wyrównywanie, czyli że co? Jak to są obrazki to jedyna opcja to znaleźć główny element na obrazku i go wyrównać - do tego potrzeba analizy obrazów (tak zwanego AI). Możesz poszukać jakichś usług pod to - zsatanawia mnie tylko po co tego potrzebujesz. Co chcesz przez to osiągnąć?

LU
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 58
0

@UglyMan: Wyrównanie czyli, jeżeli skan dokumentu (faktury) jest zrobiony krzywo, to chce wyprostować ten skan np według tekstu w nim zawartego (poniżej przykład). Potrzebne mi to ponieważ chce na pdf wykonywać ocr, a potem znaleźć konkretną wartość a następnie przeszukiwać dane po jego lewej stronie jak i powyżej, nic poza tym.
abbott2.jpgabbott2_textdeskew_a85_m2p0065.jpg

UglyMan
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 2206
0

No ale poco to równać, jak i tak w OCR wrzucasz?

LU
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 58
0

@UglyMan: Ponieważ jezeli znajde konkretna wartość to potem chce szukać po jej lewej stronie innych wartości. jeżli strona bedzie pochylona to ich nie znajdzieexmpl.png

UglyMan
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 2206
1

Określanie czegoś jako poniżej czy po lewej w przypadku OCRa to trochę słabe. Myślę, że powinieneś znaleźć inną metodę analizowania pól. Nie wiem, pod co to chcesz używać, ale jest dużo narzędzi, które skanują faktury i dodatkowo "uczą się" same na podstawie wyborów użytkownika.

Stefan_3N
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 145
0

Mam rozbudowane narzędzie, które analizuje pliki pdf i je "rozbiera" na atomy. Na wyjściu dostajesz listę obiektów (z typem obiektu, ewentualnym tekstem oraz współrzędnymi). Jeśli byłbyś zainteresowany, to napisz do mnie: office@3n.com.pl.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.