Analiza Danych

Przykłady opisane w tej lekcji dostępne są w arkuszu Excela: Analiza Danych.xlsx tylko ich samodzielne przerobienie daje gwarancję zapamiętania tej lekcji.

Przykłady dla wszystkich lekcji szkolenia Excel 2013: ExcelSzkolenie.pl Cwiczenia Excel 2013.zip

 

Ta lekcja może być obejrzana lub przeczytana poniżej.

Film wygląda najlepiej jeśli będzie odtwarzany w rozdzielczości 720p HD, rozdzielczość można zmienić dopiero po uruchomieniu filmu klikając na ikonie trybika  która pojawi się w prawym dolnym rogu poniższego ekranu. Po kilku sekundach od zmiany obraz wyostrzy się.

 

 

 

 

 

 

 

 

Aby móc używać narzędzi Analizy Danych należy wybrać: Menu PLIK " Opcje " Karta Dodatki " przycisk Przejdź….

 

 

W oknie ‘Dodatki’ wybieramy ‘Analysis ToolPak’ i klikamy OK.

 

 

Analiza Danych będzie już dostępna, znajdziemy ją na karcie ‘Dane’.

 

 

Przykład 1.

(Arkusz z danymi: ‘Analiza Danych 1’)

(Arkusz z rozwiązaniem: ‘Analiza Danych 2’)

 

W pewnej firmie zauważono że istnieje duża zależność pomiędzy zmianą ceny a zmianą sprzedaży w sztukach.

Dane po kwartałach dla lat 2005-2009 przedstawione są w poniższej tabeli.

Przygotowano na ich podstawie wykres typu XY, dodano linię trendu i wyliczono funkcję opisującą tą zależność a także współczynnik R2.

Postanowiono posłużyć się Regresją aby dowiedzieć się czegoś więcej o tej zależności.

 

Aby skorzystać ze szczegółowej analizy regresji, należy wybrać polecenie ‘Analiza Danych’ z karty ‘Dane’.

 

 

A w oknie ‘Analiza danych’ wybrać ‘Regresja’ i kliknąć OK.

 

 

W oknie ‘Regresja’ w okienku ‘Zakres wejściowy Y:’ wprowadzamy dane zmiany sprzedaży w sztukach (ponieważ są one wynikiem zmian cen).

W okienku ‘Zakres wejściowy X’ dane zmian cen (mamy na nie wpływ i to one powodują zmiany sprzedaży).

Zaznaczamy jeszcze ‘Zakres wyjściowy’ i wprowadzamy adres komórki pod tabelą z danymi.

 

 

Wyniki Regresji zostaną wprowadzone po kliknięciu OK.

Trzy z nich to dokładniejsze wartości, które mieliśmy już dostępne na wykresie: R kwadrat i współczynniki równania.

 

 

To co nas szczególnie interesuje to ‘Błąd standardowy’.

Dzięki współczynnikom równania będziemy mogli obliczyć zmianę sprzedaży dla zakładanego poziomu zmian cen.

 

Aby określić jak bardzo rzeczywisty wynik może różnić się od przewidywanego posłużymy się błędem standardowym.

Z prawdopodobieństwem 68% możemy stwierdzić że rzeczywista wartość zmiany sprzedaży będzie znajdować się w przedziale wynik równania +/- błąd standardowy.

Z prawdopodobieństwem 95% możemy stwierdzić że rzeczywista wartość zmiany sprzedaży będzie znajdować się w przedziale wynik równania +/- 2*błąd standardowy.

 

 

 

Osoby zainteresowane interpretacją pozostałych wyników odsyłam do podręczników statystyki.

 

 

 

Przykład 2.

(Arkusz z danymi: ‘Analiza Danych 3’)

 

Histogram to rozkład częstości występowania danego parametru w bandanej próbie. Przedstawiane jest zawsze w podziale na przedziały.

W tym przykładzie 50 studentów pisało test w którym mogli zdobyć maksymalnie 100 punktów. W przypadku braku lub złej odpowiedzi otrzymywali 0 punktów, nie było punktów ujemnych za złe rozwiązanie.

 

Interesuje nas rozbicie wyników testu w podziale na grupy do 10, 20 itd. co dziesięć.

 

 

Wybieramy polecenia ‘Analiza danych’ z karty ‘DANE’.

A następnie ‘Histogram’.

 

 

W oknie ‘Histogram’ wskazujemy ‘Zakres komórek:’ czyli wyniki testów, ‘Zakres zbioru:’ czyli na jakie przedziały chcemy ten zbiór podzielić.

Zaznaczamy także aby tabela wynikowa zaczynała się w komórce $G$2, oraz aby oprócz tabeli został dodany także wykres.

Klikamy OK.

 

 

 

Wynikiem będzie tabela z częstościami i wykres pokazane na poniższym rysunku.

 

 

 

 

Przykład 3.

(Arkusz z danymi: ‘Analiza Danych 4’)

 

Generowanie liczb pseudolosowych służy do przygotowywania zbiorów liczb losowych wg założonych parametrów.

W Exelu istnieje funkcja LOS() dzięki której także możemy generować takie liczby, jednak to narzędzie umożliwia wiele opcji niedostępnych dla tej funkcji.

 

Dokładnie rzecz biorąc generator nie przygotuje liczb losowych a jedynie pseudolosowe, które pod wieloma względami są nieodróżnialne od ciągu uzyskanego z prawdziwie losowego źródła. Dla większość zastosowań takie liczby są w zupełności wystarczające.

Ograniczenie to wynika z faktu, że każdy program wybierający liczby opiera się na pewnych założeniach, które przyjmują skończoną liczbę możliwości i po ich wyczerpaniu wróci do pierwszej.

 

Wybieramy ‘Analiza danych’ i ‘Generowanie liczb pseudolosowych’.

 

 

Następnie wypełniamy pola okna ‘Generowanie liczb pseudolosowych’..

 

Liczba zmiennych to liczba kolumn które chcemy wypełnić liczbami pseudolosowymi.

Liczba wartości to liczba wierszy które chcemy wypełnić liczbami pseudolosowymi. W tym przypadku wynikiem będzie 1000 liczb (ponieważ 1*1000=1000).

 

Parametry ‘Pomiędzy’ ‘oraz’ to informacja z jakiego przedziału mają być generowane liczby.

 

Zakres wyjściowy to lewa górna komórka zakresu w której mają pojawić się liczby pseudolosowe.

 

 

Jeśli chodzi o Rozkład, to gdy wybierzemy tak jak w powyższym przykładzie Jednostajny, liczby będą losowane z takim samym prawdopodobieństwem w każdym z przedziałów od 1 do 1000.

 

Inną możliwością jest wybranie rozkładu Normalnego w którym liczby są losowane zgodnie z prawdopodobieństwem typowym dla wybranych parametrów rozkładu normalnego.

 

Rozkład liczb po ich wygenerowaniu można sprawdzić używając opisanego powyżej histogramu.

 

 

 

 

Inne możliwe rozkłady to:

·         Bernoulliego

·         Dwumianowy

·         Poissona

·         Wg wzorca

·         Dyskretny

 

 

Osoby zainteresowane innymi poleceniami z menu ‘Analiza Danych’ odsyłam do podręczników statystyki, zrozumienie co chcemy obliczyć jest tu o wiele ważniejsze od umiejętności posługiwania się Excelem.