Jejku, następny co o sieciach neuronowych to słyszał chyba tylko w jakimś filmie sci-fi..
Jeśli w ogóle to juz prędzej być takich "zasad" nauczył drzewo decyzyjne albo system regułowy, ale zauważ że tutaj trzeba nauczyć rozkładu zdania, a to jest już w ogóle nietrywialne i wielu ludzi sobie z tym nie radzi, a co dopiero komputer. Zauważ ze w rozkładzie zdania na składowe potrzeba zaawansowanej analizy semantycznej, bo jakoś trzeba stwierdzić co jest podmiotem a co orzeczeniem. To juz samo w sobie wcale takie oczywiste nie jest.
Przeczytaj sobie np. http://www.ipipan.waw.pl/~wolinski/publ/znakowanie.pdf i zobacz że już samo określanie części mowy (a jeszcze nie części zdania!) jest trudne! Ba, dla języka polskiego już w ogóle sama lematyzacja jest trudna bo jak masz zdanie jak jakiś śmieć może śmieć!
to zauważ że dwa wystąpienia słowa śmieć
w rzeczywistości są wystąpieniami dwóch różnych słów, gdzie jedno to rzeczownik a drugie to czasownik. Albo był tam pik
- gdzie pik
może oznaczać rzeczownik od pikać
albo pik
jako kolor w kartach.
Serio, przetwarzanie języka naturalnego to nie jest prosta sprawa, a dla języka polskiego to już jest w ogóle masakra ;] Istnieje troche narzędzi do tego, słowników fleksyjnych, analizatorów morfologicznych, ale to wszystko są lepsze lub gorsze heurystyki.