Z jakich funkcji do testów parametrycznych korzystacie? Próbuję to uporządkować.
import scipy as sc
import statsmodels.api as sm
zakładam rozkład normalny, testy różnicy średnich:
niezależnych, N duże:
pvalue = sm.stats.ztest(df1.value, df2.value)[1]
jaki jest odpowiednik w scipy?
niezależnych, N małe, wariancja taka sama w próbkach:
pvalue = sm.stats.ttest_ind(df1.value, df2.value, usevar='pooled')[1]
lub
pvalue = sc.stats.ttest_ind(df1.value, df2.value, equal_var=True)[1]
niezależnych, N małe, wariancja różna w próbkach:
pvalue = sm.stats.ttest_ind(df1.value, df2.value, usevar='unequal')[1]
lub
pvalue = sc.stats.ttest_ind(df1.value, df2.value, equal_var=False)[1]
zależnych, N małe:
jaki jest odpowiednik w statsmodels?
lub
pvalue = sc.stats.ttest_rel(df1.value, df2.value)[1]