Wykrywanie przestępstw - aplikacja

Wykrywanie przestępstw - aplikacja
UA
  • Rejestracja: dni
  • Ostatnio: dni
1

Witam.

Postanowiłem stworzyć aplikację, która będzie wykrywać przestępstwa w internecie, zastanawiam się nad funkcjonalnością, którą będzie oferować, nic innego nie przychodzi mi do głowy jak tylko przeszukiwanie "odpowiedzi" w poszukiwaniu słowa kluczowego. Jakiekolwiek sugestie byłby mile widziane. Z góry dzięki.

ZJ
  • Rejestracja: dni
  • Ostatnio: dni
4

Nie wiem, czy jest to dobry pomysł. Np. ktoś na jakimś forum napisze:

"Chcę zbudować bombę."

i wtedy ten program wykryje taki post? Ogólnie to by wymagało dość sporo NLP, podejrzewam że taki projekt to byłby dobry na doktorat. Wykrywanie po słowach/zdaniach kluczowych spowoduje Ci dużo przypadków jak "Zamordowałbym za pizzę", czy "Ta impreza była bombowa".

  • Rejestracja: dni
  • Ostatnio: dni
0

po co do tego aplikacja? odpalasz tora, wchodzisz na odpowiednie forum i masz listę samych przestępstw
nie wiem co ta aplikacja miałaby robić? liczyć na to że ktoś będzie umawiał zamach bombowy na facebooku?

Shalom
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Space: the final frontier
  • Postów: 26433
0

@usm_auriga a ty masz chociaż blade pojęcie o przetwarzaniu języka naturalnego? Bo mam wrażenie że nie za bardzo ;) Polecam jednak trochę się na ten temat douczyć (materiały po angielsku masz na stronach MIT, Stanforda etc). Z językiem polskim jest to znacznie bardziej skomplikowane. Jak bardzo chcesz to wyślij mi PM z mailem i podrzucę ci paczkę materiałów z Przetwarzania Języka Naturalnego z moich studiów.

02
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 1176
0

Zanim się dziarsko weźmiesz za pisanie aplikacji polecam najpierw przeczytać http://thewhereblog.blogspot.com/2008/12/paradox-of-false-positive.html
A potem wyestymować liczbę stron normalnych i tych z 'przestępstwami' i policzyć czy przypadkiem False Positive Paradox nie sprawi, że wyniki twojej aplikacji będą bezużyteczne.

UA
  • Rejestracja: dni
  • Ostatnio: dni
0

Shalom no właśnie nie mam :P ale dzięki za dobre intencje. Pozdrawiam.

vpiotr
  • Rejestracja: dni
  • Ostatnio: dni
0

Poszukaj artykułów / książek o:

  • data mining
  • text mining
  • NLP (Natural Language Processing)
  • clustering
  • document classification / text categorization
  • Naive Bayes

Ogólny artykuł na ten temat:
http://nltk.googlecode.com/svn/trunk/doc/book/ch06.html

Shalom
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Space: the final frontier
  • Postów: 26433
0

@usm_auriga przetwarzanie języka i data mining z heterogenicznych źródeł danych to jest baaaardzo skomplikowana sprawa ;) Na początek polecałbym popatrzeć na to wszystko z innej perspektywy - z perspektywy systemu ekspertowego. Spróbuj napisać sobie system ekspertowy który na podstawie jasno przedstawionych przesłanek wnioskowałby o czymś. Jeśli potrzebujesz narzędzi to ściągnij sobie genie:
http://genie.sis.pitt.edu/networks.html
To jest narzędzie do projektowania i testowania Sieci Bayesa (które stanowią jeden z modeli systemów ekspertowych).
Warto od tego zacząć, żeby uświadomić sobie że już sam silnik wnioskujący, nawet przy założeniu że dane wejściowe są podane "na tacy", to jest mocno skomplikowana sprawa.

codex
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 69
0

No i na to wszystko panowie nakłada się jeszcze jeden rozległy temat - samo prawo i jego interpretacja (wiemy jak to wygląda). Do tego fakt, że prawo obowiązuje do granic państwa.... jak napisanie os'a - jeden człowiek tego nie ogarnie nie ma h...

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.