[c++] OCR

NE
  • Rejestracja:około 16 lat
  • Ostatnio:około 8 lat
0

Mam pytanie, bo nie wiem czy się dobrze do tego zabieram.

Chcę stworzyć OCR'a, który będzie w stanie na podstawie analizy obrazu wykonać wcześniej zdefiniowane funkcje.

Ja chcę rozwiązać to tak:

Program robi sobie print screena, ładuje do analizy wybrany obszar obrazu i na podstawie analizy koloru w danym pixelu wykonuje określone zadanie.

Pomijam fakt, że nie wiem jak poradzić sobie z przesunięciem, np. liczba 966 będzie wyświetlana w innej pozycji niż liczba 166 (jedynka jest mniej rozciągnięta niż 9, co przesuwa całą liczbę) - tutaj nie wiem jak sobie z tym poradzić.

Mój pomysł jest dobry, czy może są sposoby bardziej precyzyjne? Raczkuję w tym temacie a chciałbym tworzyć solidne funkcje działające na podstawie analizy obrazu.

KR
  • Rejestracja:prawie 16 lat
  • Ostatnio:6 miesięcy
  • Postów:2514
0

najpierw musisz obraz podzielić na ramki, czyli w taki sposób żeby mieć podzielony obraz na prostokąciki i w każdym prostokąciku jakaś litera. następnie proponuje użyć sztucznej sieci neuronowej do rozpoznawania liter.

EDIT:
ale zamiast printscreena można oszukać użytkownika. Lepiej odczytać tekst za pomocą winAPI, chyba że chodzi Ci o captcha itp..


░█░█░█░█░█░█░█░█░█░█░█░

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.