Digitalizacja odrecznie pisanego pamietnika.

0

Powiedzmy, ze mam dziennik odrecznie pisany, moze 100 stron, moze wiecej - duzy notatnik w formie A4, pisany jak kura pazurem, bardzo male literki blisko siebie - dla zaoszczedzenia miejsca. Probowane rozwiazania OCR wysiadaja, np ta platna aplikacja na Android - GeniusScanner, kompletnie nic nie odczyta. Rozwiazania z tego co widze sa 2:
1.) bardziej profesjonalne, rozwiniete byc moze stare rozwiazania OCR - jesli tak, to jakie? Mozna miec nadzieje
2.) wlasny model uczenia maszynowego. Np zrobic zdjecia ilus tam stron (ile? 10, 20 wystarczy?) - przepisac na komputerze odrecznie te 20 stron i zrobic mapowanie i wyuczyc model na tym. No nie wiem, jak efektywny bedzie taki model, czy ktos moze mi powiedziec, zanim potencjalnie strace na to czas? Czy ktos ma doswiadczenie z gotowymi platnymi serwisami, do takich wlasnie zadan?

Podsumowujac - chcialabym szybko i mozliwie automatycznie przepisac recznie pisany notatnik do formy cyfrowej i szukam gotowego rozwiazania, albo jak to zrobic mozliwie najprosciej i najszybciej.

2

100 stron to nie brzmi nawet na dużo, zakładając 300 słów na stronę i 100 wpm to około 5 godzin roboty, nie wiem czy jeśli istniejące modele nie potrafią tego odczytać to czy się zmieścisz ze zrobieniem swojego modelu zwłaszcza przyjmując że i tak musisz do tego przepisać ręcznie te 20 stron a potem robić mnóstwo poprawek.

screenshot-20241003145927.png

0

To na pewno nie jest "300 slow na stron" tylko znacznie więcej - drobnym druczkiem. Nie jest bardzo łatwo się odczytać samemu i przepisywanie samemu tez by trwało długo. Myślę, ze średnio z 800 slow na stronę.

3

To jak nie jest łatwo to odczytać samemu to tym bardziej model AI tego nie zrobi dobrze.

0

Proponuję zacząć od zeskanowania tych wszystkich stron w dobrej jakości, jak będziesz mieć to w formie cyfrowej to się zastanów czy w ogóle potrzebujesz to zamieniać na tekst - właściwie po co? Masz zamiar wyszukiwać informacje w tym pamiętniku?
Mając strony zeskanowane próbowałbym po prostu od czasu do czasu z nowymi modelami, musisz wziąć pod uwagę że jeszcze parę lat temu komputer nie był w stanie odczytać captchy, ty chcesz zrobić własne rozwiązanie które będzie potrafiło odczytać jeszcze trudniejszy tekst i to pewnie jeszcze z polskimi ogonkami. Na dzień dzisiejszy raczej nie miałbym dużych oczekiwań.

0
lambdadziara napisał(a):

Podsumowujac - chcialabym szybko i mozliwie automatycznie przepisac recznie pisany notatnik do formy cyfrowej i szukam gotowego rozwiazania, albo jak to zrobic mozliwie najprosciej i najszybciej.

  1. Dogadujesz się z kimś kto prowadzi kurs pisania maszynowego dla dzieciaków (przydatna umiejętność)
  2. Dajesz mu pamiętnik jako przedmiot ćwiczeń
  3. Dzieciaki go przepisują - masz X interpretacji
  4. Bierzesz jakiś wstępnie wytrenowany model do OCRa i używając RLHF fine-tuningujesz
  5. Masz model dostrojony do swojego rodzaju pisma
2

Rozczytywanie drobnego pisma pisanego "jak kura pazurem" to robota w większości polegająca na odgadywaniu na podstawie kontekstu. Podzielam opinię, że żaden współczesny OCR ani AI sobie z tym nie poradzi. Sam próbowałem coś takiego znaleźć na potrzeby odczytywania skanów ręcznie pisanych historycznych dokumentów i poległem.

Przepisywanie będzie pracochłonne, więc pomyśl po prostu o nagraniu się jak czytasz ten dziennik. Zamiana mowy na tekst to już dużo prostsza robota.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.