Popis kurzu
Cílem mikrocertifikace Analýza dat pro ekonomy je seznámit studenty s metodami optimalizace a kvantitativními metodami používanými v ekonomických analýzách a modelování. Studenti získají znalosti v oblasti formulace reálných problémů vedoucích na lineární, celočíselné či nelineární programování, jako jsou problémy z oblasti rozvrhování procesů, dopravy a logistiky, řízení výroby, hodnocení efektivity (DEA), klasifikace a data miningu, řízení portfolia a statistického zpracování dat. Dále se studenti naučí základní metody řešení těchto optimalizačních problémů, včetně metod přesných a heuristických, a získají přehled o dostupných optimalizačních solverech. Kurz zahrnuje také kvantitativní metody běžně využívané při ekonomických analýzách a modelování, přičemž předpokládá znalost statistické teorie na úrovni kurzu Statistické metody v analýze dat a základní práci v programu R. Semináře kladou důraz na aplikace teoretických konceptů pomocí statistického programu R, kde studenti získají také dovednosti v programovacích technikách v R.
Náplň kurzu
Kurz pokrývá optimalizační problémy včetně formulace optimalizačních problémů a jejich rozlišení na spojité vs. diskrétní optimalizace a lineární vs. nelineární problémy. Studenti se seznámí s případy použití, jako jsou problémy z oblasti dopravy a logistiky, různé varianty TSP a práci s procesy včetně rozvrhování a řízení procesů (job scheduling). Kurz zahrnuje aplikace do finanční analýzy, včetně řízení portfolia, a na DEA a hodnocení efektivity. V oblasti data miningu se studenti naučí aplikace v klasifikaci, analýze dat a data miningu. Kurz zahrnuje základní algoritmy optimalizace pro lineární, nelineární a diskrétní programování, heuristické a metaheuristické metody pro obtížné optimalizační problémy. Studenti se seznámí s modelovacími jazyky, solvery, numerickými problémy a implementačními otázkami, stejně jako s výpočetní složitostí optimalizačních problémů. Kurz zahrnuje také práci v programu R se specifickými úlohami, včetně programování a vizualizačních nástrojů v R pro potřeby ekonometrických aplikací. Studenti se naučí základní práci s daty, datovými strukturami, importem, exportem a transformací dat, stejně jako řešení specifických problémů s daty (chybějící, odlehlá a kontaminovaná pozorování). V oblasti lineární regrese se kurz zabývá klasickým lineárním regresním modelem, jeho formulací, průřezovými a dynamickými modely, speciálními regresory (např. dummy či trendové proměnné) a estimátory a jejich vlastnostmi, včetně OLS, GLS, MLE a robustních estimátorů. Studenti se naučí testovat a řešit důsledky heteroskedasticity a autokorelace, měřit multikolinearitu a aplikovat tyto znalosti v makroekonomické a mikroekonomické oblasti. Kurz dále zahrnuje modely s diskrétními a omezenými vysvětlovanými proměnnými, jako jsou lineární pravděpodobnostní modely, cenzorované a seříznuté regresní modely, logitové, probitové a tobitové modely. Studenti se naučí o ML estimátorech a problémech specifikace a aplikují tyto modely ve scoringových modelech. V oblasti vícerovnicových modelů a panelových dat se kurz zabývá obecnou formulací soustav, SUR soustavou, modely pro panelová data, soustavou simultánních rovnic, identifikací a estimátory. Nakonec kurz zahrnuje časové řady, včetně jednorozměrných časových řad (dekompoziční metody, Box-Jenkinsova metodologie, stacionarita) a jejich aplikací v teorii portfolia. Vícerozměrné časové řady zahrnují zobecnění jednorozměrných metod, vektorovou autoregresi, Grangerovu kauzalitu, kointegraci a modely korekce chyby.