To na moje oko jest to trudne, ale wykonalne.
Po pierwsze ciężko z takiego OCR stwierdzić do czego należy dany tekst czy to miejscowość, czy to imię, trzeba trochę na prawdopodobieństwie liczyć lub jeśli zawsze jest taka sama struktura dokumentu to zawsze w takiej samej kolejności tekst wyświetli się.
Potem jeśli to jeden template lub strona z takimi samymi klasami lub identyfikatorami to łatwo to dopisać.
Jeśli różne formaty plików i ich sposoby obsługi pól to wszystko się coraz bardziej komplikuje.
Jak zamierzasz wprowadzać templaty do systemu, word, pdf, excel, jakaś strona internetowa czy coś innego.
Jeśli przytoczę słowa tego co napisał, że OCR i reszta to detale to jest wręcz odwrotnie.
OCR to darmowe narzędzie, ale to pomoże tylko z obrazu tekst uzyskać, a całą reszta to w pizdu roboty, no chyba że zrobisz tak, że pierwsze zdanie dasz do pierwszej kolumny, drugie do drugiej itp.
To wtedy teoretycznie jest w miarę prosto, oczywiście jak ogarnie się cały template gdzie ma być wszystko wklejane.
Czasem się zastanawiam ilu tu dzieci jeszcze siedzi na tym forum, mega dzieciarnia.