Jest tabela z przykładowymi tekstami coś na zasadzie sprawdzanie pracy czy to plagiat. Czyli np są zdania, które należy wyszukać w zadanym tekście:
- Za górami za lasami | za gorami za lasami (alternatywa bez polskich ogonkow)
- Babciu dlaczego masz takie duze uszy? | uszy ? | uszy ( bo nie wiadomo jak ktoś stawia znaki i czy w ogole je stawia)
Teraz mam jakiś tekst źródłowy gdzie ktoś napsiał bajkę:
Czemu babciu masz takie wielkie uszy ??? zdziwil sie kapturek
Jest jakiś projekt z ciekawym algorytmem który np powiedziałby że to zdanie moze miec 90% plagiatu?
Dałem taki przykład ale od czegoś trza zaczac