Python - Jupyter pomoc w zadaniu zaliczeniowym studia

Python - Jupyter pomoc w zadaniu zaliczeniowym studia
OJ
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 4
0

Hej
Mam problem, mianowicie dostałem zadanie od Profesora z informatyki a dokładniej to Pan powiedział żebym zrobił przykład wykorzystania PCA w redukcji wymiarowości, po wysłaniu zadania z chatu gpt (poniewaz w ogóle nie wiem jak to zrobic) dostałem informacje żebym dodał nastepujące rzeczy;
co to jest PCA, po co sie to robi, co to są główne składowe, kiedy możemy zastosować tę metodę a kiedy tego zrobić się nie da.
Proszę o pomoc
Z góry dziekuje za odpowiedz.

OJ
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 4
0

Zapomniałem dodać, że ma być w formie notatki w jupyter

MM
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 44
0

Ale czego dokładnie nie wiesz, czym jest PCA, czy jak użyc Jupytera w formie notatnika?

ledi12
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Wrocław
1

O jaką pomoc prosisz? Ja gotowiec to jest dział ogłoszenia drobne za $

OJ
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 4
0

A jaka to jest cena?

ledi12
  • Rejestracja: dni
  • Ostatnio: dni
  • Lokalizacja: Wrocław
1

213.70 zł

OJ
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 4
0

Jak zobacze jak to wyglada to jestem w stanie zaplacic

YA
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 2384
1

PCA - principal component analysis.

Miałeś podstawy algebry liniowej?

W PCA chodzi o to, żeby znaleźć taką podprzestrzeń oryginalnej przestrzeni features, która wyjaśniałaby możliwie największą wariację oryginalnych danych.
pca_1 = pierwszy komponent - kierunek największej wariancji oryginalnych danych
pca_2 = drugi komponent - prostopadły do pca_1 i max. wyjaśniający pozostałą wariancję
pca_3 - prostopadły do _1, _2 , ...

itd.

Główne założenia:

  • wartości feataerów są numeryczne, skoncentrowane wokół zera i tej samej skali (w jakiś sposób chcemy tę wariancję liczyć, a np. dla feature kolor, ciężko mówić o korelacji. Dlaczego wystarczy spojrzeć jak liczona jest wariancja i korelacja :-))
  • PCA jest wrażliwe na "outliers", więc należy je usunąć przed szukaniem komponentów

Im mniej komponentów PCA, tym więcej informacji tracimy. Im więcej, tym więcej szumu łapiemy.

LukeJL
  • Rejestracja: dni
  • Ostatnio: dni
  • Postów: 8487
1

Nie robiłem samemu PCA, ale widziałem kiedyś filmiki na YT o tym od StatQuest (on w ogóle fajnie tłumaczy te fundamenty machine learning, pokazuje z rysunkami itp.), więc jak nie wiesz nic, to pewnie dobry start by był.

Zarejestruj się i dołącz do największej społeczności programistów w Polsce.

Otrzymaj wsparcie, dziel się wiedzą i rozwijaj swoje umiejętności z najlepszymi.