Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Regresja liniowa i logistyczna

No description
by

Marcin Mazurek

on 1 December 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Regresja liniowa i logistyczna

Regresja liniowa wieloraka
Przykład
Badając zależność pomiędzy nakładami na reklamę w mediach a poziomem sprzedaży produktu otrzymano następujące zestawienie:
x- nakład na reklamę
y - poziom sprzedaży
Kodowanie zmiennych
Przygotowanie danych
Eliminacja wartości odstających
Podział zbioru
Zbiór uczący
Zbiór testowy
Sformułowanie problemu
Dobór zmiennych do modelu
Istotność współczynników
Regresja logistyczna
Model

wariancja zmiennej celu wyjaśniona przez niezależne zmienne objaśniające (zmienne wejściowe)
Error
Wariancja nie wyjaśnia przez zmienne wejściowe modelu)
Corrected Total
- całkowia wariancja
DF
- liczba stopni swobody:
total: całkowita wariancja ma N-1 stopni swobody:
model: liczba współczynników (bez wyrazu wolnego)
error: iczba stopni swobody dla błedu jest różnicą pomiędzy DF całkowitej wariancji i DF modelu: 52 - 45 = 6
SSR
SSE
SST
MSR
MSE
p-value
skojarzone ze statystyką F. Wykorzystywane do testowania hipotezy zerowej, że wszystkie współczynniki modelu są równe 0
Adj R-sq wartość współczynnika R-kwadrat skorygowana przez uwzględnienie liczby zmiennych zmiennych objaśniających
Liczba stopni swobody dla zmiennych:
przedziałowych : 1
nominalnych: liczba unikalnych wartośści -1
Kodowanie zmiennych - binarna zmienna przyjmująca wartość 1, jeżeli w zbiorze wejśćiowym
degree
miał wartość
doctorate
Wyraz wolny w równaniu regresji
Wartości współczynników odpowiadających poszczególnym zmiennym niezależnym w równaniu modelu regresji
Błąd standardowy wartości współczynnika
Wartość statystyki t wykorzystywanej do testowania hipotezy o istotności współczynnika (czy wartość współczynnika jest różna od 0)
p-value
wykorzystywane do testowania hipotezy zerowej, że wartość współczynnika jest równa 0.

Na poziomie istotności 0.05 mamy 4 współczynniki istotne.
Imputacja brakujących wartości
Metody krokowe - dodawanie bądź odejmowanie stopniowo pojedynczych zmiennych
forward
selection - metoda krokowa w przód, zaczynamy od pustego modelu zawierającego wyłącznie stałą regresji, następnie dodajemy po jednej zmiennej najsilniej powiązaną ze zmienną zależną i spełniającą ktryteria istotności.
backward
- metoda krokowa w tył - zaczynamy od modelu zawierającego wszystkie zmienne i w kolejnych krokach odejmujemy po jednej zmiennej, która jest najsłabiej powiązana ze zmienną zależną i nie spełnia założonego kryterium istotności.
stepwise
-połączenie dwóch poprzednich
Metody bazujące na kryteriach - wyznaczenie
parametrów dla wszystkich możliwych kombinacji zmiennych opisujących. Przykładowe kryteria:
R-kwadrat
AIC
Cp
SBC

Regresja liniowa jednej zmiennej
Oszacowanie parametrów
Błędy oszacowania
Komponenty wariancji
Test F istotności modelu regresji
Liczba parametrów modelu (liczba zmiennych plus wyraz wolny)
Kryterium informacyjne Akaikego
Bayesowskie kryterium informacyjne Schwarza:
Statystyka CP Mallowa
Full transcript