Regrese - výběr vhodného modelu

Dobrý den,

posuzuji vhodnost regresních modelů - lineární i kvadratický. Index determinace, reziduální rozptyl mi vyšel lepší u kvadratického modelu. Naopak p-hodnota u kvadratického mi vyšla vyšší než stanovená hladina významnosti - model není významný.

Otázka ale je: Proč není závěrem to, že vybírám lineární model, když P-hodnota vyšší než hladina významnosti? (teď nemluvím o významnosti F).

Děkuji za pomoc


Obtížnost: Vysoká škola
Kategorie: Vysoká škola
Nikola M.

Nikola M.

12. 04. 2020   02:45

1 odpověď

Tomáš B.
Tomáš B.
12.04.2020 10:24:00

Výběr modelu je z části umění a není striktní návod, jak vybrat ten nejlepší, protože žádný "nejlepší" model neexistuje.

Vynechala jsi klíčové informace, třeba kolik parametrů má kvadratický model nebo jestli mluvíš o p-hodnotě všech nebo jednotlivých koeficientů nebo o jakou významnost požaduješ a co vyšlo.

Obecně, kdykoliv přidáš parametr, tak R^2 i rozptyl reziduí vždy vyjde lépe a kvadratický model bude mít určitě lepší výsledky než lineární. Z toho důvodu se místo R^2 používá adj. R^2 a místo rozptylu se díváš na samotná rezidua, u kterých musíš ověřit, že mají Normální distribuci, aby ses mohla opřít o p-hodnotu.

Teprve až když ověříš všechna kritéria a uvědomíš si, které statistiky mají vypovídající hodnotu a teprve když si projdeš všechny grafy a najdeš podivnosti v datech, pak se teprve rozhoduješ, který model je vhodnější.

Pro napsání komentáře se musíte přihlásit.