Algorytm kNN

FO
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 38
0

Cześć :) natrafiłem na pewien problem w kNN i nie bardzo wiem jak w takiej sytuacji algorytm powinien się zachować. Polecenie zadania narzuca mi wybranie odległości euklidesowej i k=5

screenshot-20191023165853.png

Mając takie dane muszę zakwalifikować obiekt z samego dołu (3,3,1,2). W kolumnie F mam policzone odległości. Problem w tym że najniższe odległości to 0 o liczebności 1 i 1 o liczebności 6. Mam więc wybrać obiekt o odległości 0 i 4 losowe/o najniższym indeksie obiekty odległe o 1, czy zignorować k=5 i wybrać wszystkie elementy odległe o 1?

KA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 27
2

To jest problem otwarty i obie zaproponowane przez Ciebie opcje są dopuszczalne. Zauważ, że jeśli dopuścisz wszystkie równoodległe punkty to ostatecznie możesz dostać ich parzystą liczbę i jeśli później używasz głosowania do wyznaczenia klasy, to możesz znowu otrzymać remis. W przypadku losowania decyzje modelu będą niedeterministyczne, co też może być problemem. Tutaj masz dosyć dobrze podsumowane opcje i ich konsekwencje.

Osobiście gdyby takie przypadki remisów zdarzały się często to może to być wskazówka, żeby użyć innej metryki/modelu.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.