Regrese - výběr vhodného modelu
Dobrý den,
posuzuji vhodnost regresních modelů - lineární i kvadratický. Index determinace, reziduální rozptyl mi vyšel lepší u kvadratického modelu. Naopak p-hodnota u kvadratického mi vyšla vyšší než stanovená hladina významnosti - model není významný.
Otázka ale je: Proč není závěrem to, že vybírám lineární model, když P-hodnota vyšší než hladina významnosti? (teď nemluvím o významnosti F).
Děkuji za pomoc
Nikola M.
12. 04. 2020 02:45
1 odpověď
Výběr modelu je z části umění a není striktní návod, jak vybrat ten nejlepší, protože žádný "nejlepší" model neexistuje.
Vynechala jsi klíčové informace, třeba kolik parametrů má kvadratický model nebo jestli mluvíš o p-hodnotě všech nebo jednotlivých koeficientů nebo o jakou významnost požaduješ a co vyšlo.
Obecně, kdykoliv přidáš parametr, tak R^2 i rozptyl reziduí vždy vyjde lépe a kvadratický model bude mít určitě lepší výsledky než lineární. Z toho důvodu se místo R^2 používá adj. R^2 a místo rozptylu se díváš na samotná rezidua, u kterých musíš ověřit, že mají Normální distribuci, aby ses mohla opřít o p-hodnotu.
Teprve až když ověříš všechna kritéria a uvědomíš si, které statistiky mají vypovídající hodnotu a teprve když si projdeš všechny grafy a najdeš podivnosti v datech, pak se teprve rozhoduješ, který model je vhodnější.