Algorytm do klasyfikacji tekstów.

Algorytm do klasyfikacji tekstów.
vall75
  • Rejestracja: dni
  • Ostatnio: dni
0

Witam,

Myślę nad ulepszeniem w/w programu, obecnie klasyfikacja działa na zasadzie wyszukiwania kluczowych słów/wyrażeń (String).

Czy znacie jakiś w miarę prosty w implementacji algorytm, którego można użyć do klasyfikacji tekstu?

Pozdrawiam

Shalom
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Space: the final frontier
  • Postów: 26433
0

Chodzi ci o klasyfikację tekstów na zasadzie przynależenia tekstu do jakiejś kategorii tematycznej? To sie nazywa TopicModellig i masz trochę algorytmów do tego, najpopularniejsze są LSI oraz LDA.
Ale miej na uwadze że praktycznie każdy tekst przynależy jednocześnie do wielu kategorii (te algorytmy zwracają ci oprócz numeru tematu także % przynależności).
Jako jeden z projektów pisałem niedawno algorytm i aplikację która służy do oznaczania który fragment tekstu dotyczy danego tematu.

vall75
  • Rejestracja: dni
  • Ostatnio: dni
0

Witam,

znacie może jakiś przykład trywialny w/w, ewentualnie innych algorytmów?

Pozdrawiam

Shalom
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Space: the final frontier
  • Postów: 26433
0

Jak chcesz prosty przykład jakiegoś algorytmu to może cosine similarity? On jest prosty jak budowa cepa :)

vall75
  • Rejestracja: dni
  • Ostatnio: dni
0

Witam,

Shalom napisał(a):

Jak chcesz prosty przykład jakiegoś algorytmu to może cosine similarity? On jest prosty jak budowa cepa :)

Dzięki raz jeszcze, na razie udała mi się wstępna implementacja.

Jeżeli mógłbyś podrzucić jeszcze jakiś algorytm to byłbym wdzięczny.

Pozdrawiam

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.