Statystyczna analiza danych (wykład)

Opis przedmiotu
Informacje ogólne
Organizator:Wydział Matematyki, Informatyki i Architektury Krajobrazu - Instytut Matematyki i Informatyki
Kod ECTS:11900-XXXX-1001WYK0299
Kierunek studiów: Informatyka (stacjonarne I stopnia)
Lokalizacja w planach rocznych:
Etap:Rok II - Semestr 4
Punkty ECTS: 5
Forma zaliczenia: Egzamin
Rozkład zajeć
Lokalizacja w programie modułowym:
Moduł programowy:Przedmioty kształcenia podstawowego » Statystyczna analiza danych
Cele przedmiotu
Wymagania wstępne
PRZEDMIOTY WPROWADZAJĄCE ORAZ WYMAGANIA WSTĘPNE:
Podstawy metod probabilistycznych
ZAŁOŻENIA I CELE PRZEDMIOTU:
CEL ZAJĘĆ:
Celem kształcenia w zakresie przedmiotu Statystyczna analiza danych jest zapoznanie studentów z metodami i procedurami statystyki opisowej i statystyki matematycznej. W trakcie wykładu studenci poznają podstawowe cele i metody statystyki opisowej, takie jak miary statystyczne, wykresy i grafy. Zapoznają się także z elementami wnioskowania statystycznego bazującego na statystyce matematycznej, które obejmują zasady konstrukcji estymatorów, przeprowadzania wybranych testów i formułowania odpowiednich wniosków.
ZAMIERZONE EFEKTY KSZTAŁCENIA:
WIEDZA:
Student zna podstawowe rozkłady probabilistyczne.
Student zna podstawowe miary statystyki opisowej i wykresy.
Student potrafi porównać różne testy statystyczne i wybrać właściwy w danym problemie.
Student zna podstawowe pojęcia statystyki matematycznej, takie jak estymator, błąd statystyczny, hipoteza statystyczna, poziom istotności, predykcja.
Student zna wybrany pakiet statystyczny.
Student zna podstawowe elementy analizy regresji.
UMIEJĘTNOŚCI:
Student umie posłużyć się statystycznymi charakterystykami populacji i ich odpowiednikami dla próbki.
Student umie wykorzystać narzędzia komputerowe w analizie danych za pomocą metod statystyki opisowej.
Student umie przeprowadzić proste wnioskowanie statystyczne.
Student umie wykorzystać narzędzia komputerowe do prostego wnioskowania statystycznego.
Student umie przeprowadzić proste wnioskowanie dla analizy regresji.
Student umie zaproponować prostą prognozę na podstawie analizy regresji.
Efekty kształcenia dla przedmiotu
Metody dydaktyczne
Treści programowe przedmiotu
[dr M. Romaniuk - 2011/12]

TREŚĆ ZAJĘĆ:
Zadania statystyki matematycznej - przykładowe problemy statystyki matematycznej, podstawowy aparat pojęciowy statystyki matematycznej (populacja, próba, zmienna losowa), skale pomiarowe cech statystycznych. Podstawowe pojęcia statystyczne - dystrybuanta empiryczna, informacja o twierdzeniu Gliwenki, szeregi rozdzielcze, szeregi czasowe, dane przedziałowe, liczebności zwykłe i skumulowane. Miary położenia dla danych dokładnych i przedziałowych - średnia, mediana, kwartyle dolny i górny, kwantyle, moda, porównanie cech różnych miar położenia. Miary zmienności dla danych dokładnych i przedziałowych - odchylenie standardowe i wariancja, rozstęp, odchylenie ćwiartkowe, wskaźnik zmienności, porównanie cech różnych miar zmienności. Inne miary opisowe dla danych - wskaźnik skośności, wskaźnik spłaszczenia. Graficzna analiza danych - konstruowanie i własności histogramów, analizowanie wykresu typu "pudełko z wąsami", wykresy częstości, kołowe i inne. Wybrane rozkłady prawdopodobieństwa - omówienie własności wybranych dyskretnych (rozkład dwumianowy, Poissona) i ciągłych (rozkład normalny, wykładniczy, t-Studenta) rozkładów prawdopodobieństwa. Estymacja nieznanych parametrów rozkładu cechy w populacji - estymatory punktowe i ich pożądane własności (nieobciążoność, zgodność), metoda momentów, metoda największej wiarygodności. Estymacja przedziałowa - konstruowanie estymatorów przedziałowych (dla średniej i wariancji). Testy statystyczne - hipoteza zerowa i alternatywna, poziom istotności testu, błąd I i II rodzaju, obszar krytyczny w teście. Wybrane testy parametryczne (testy dla średniej i wariancji). Wybrane testy nieparametryczne (test zgodności chi-kwadrat). Testy normalności rozkładu. Elementy analizy wielowymiarowej populacji - badanie zależności w próbie (współczynnik kowariancji i korelacji), analiza regresji (metoda najmniejszych kwadratów, współczynnik determinacji, testy istotności parametrów dla trendu liniowego), nieliniowa analiza regresji. Szeregi czasowe i ich analiza - wygładzanie szeregów czasowych średnią ruchomą, wskaźniki dynamiki, elementy prognozowania zachowania się szeregu czasowego. Wprowadzenie do symulacyjnych metod statystycznych - metody Monte Carlo w estymacji parametrów rozkładu cechy i innych problemach statystycznych, elementy badania niezawodności informatycznych systemów z wykorzystaniem symulacji statystycznych.
Kryteria oceny i sposoby weryfikacji zakładanych efektów kształcenia
METODY I POMOCE DYDAKTYCZNE:
FORMA ZAJĘĆ:
Wykład (z elementami dyskusji)
WYMAGANIA DOTYCZĄCE POMOCY DYDAKTYCZNYCH:

FORMA I WARUNKI ZALICZENIA:
Egzamin pisemny (100%)
Literatura podstawowa i uzupełniająca
LITERATURA PODSTAWOWA:
W. Niemiro, Rachunek prawdopodobieństwa i statystyka matematyczna, Biblioteka Szkoły Nauk Ścisłych, 1999
D. Aczel, Statystyka w zarządzaniu, PWN, 2000
LITERATURA UZUPEŁNIAJĄCA:
R. Zieliński, Siedem wykładów wprowadzających do statystyki matematycznej, WNT, 1990
J. Bartoszewicz, Wykłady ze statystyki matematycznej, PWN, 1989
H. Kassyk-Rokicka, Statystyka nie jest trudna. Mierniki statystyczne, PWE 2001