EuroMISE centrum – Kardio, spolunositelské pracoviště Vysoká škola ekonomická Praha

Projekt STULONG – přehledný popis

Projekt Stulong sleduje dva hlavní cíle:

Rizikové faktory aterosklerózy byly sledovány u 1 419 mužů v letech 1976–1999 v souladu s celkovou metodikou projektu. Při vstupním vyšetření byly zjišťovány hodnoty 244 atributů. Hodnoty 219 z nich byly číselné kódy nebo výsledky měření. Dále bylo provedeno 10 610 kontrolních vyšetření, při kterých byly zjišťovány hodnoty 66 atributů.

Dobýváním znalostí z databází (DZD) se rozumí analýza často rozsáhlých observačních dat s cílem nalézt netušené vztahy a sumarizovat data novými způsoby tak, že jsou srozumitelná a užitečná pro jejich majitele. V této souvislosti se používá i anglický termín data mining.

Metodologie CRISP DZD je dlouhý a složitý proces, který zahrnuje několik vzájemně provázených a dále členěných etap. Je k dispozici několik metodologií, jedna z nejznámějších je metodologie CRISP, viz obrázek (kliknutím na obrázek získáte jeho větší verzi).

V projektu STULONG se jedná o etapy:

Důležitou roli při formulaci a řešení analytických otázek hrají různé výchozí znalosti.

Součástí projektu Stulong jsou i dva výzkumné projekty:

Projekt Stulong započal v první polovině sedmdesátých let jako rozsáhlá epidemiologické studie primární prevence aterosklerózy. Sběr dat probíhal na několika pracovištích. Prvotní data byla později upravena do elektronické podoby a zpracována základními statistickými postupy. Poté byla analyzována v rámci výzkumu aplikací metod dobývání znalostí v medicíně. Na těchto pracích se podílí rozsáhlý kolektiv autorů.

K projektu se také vztahuje řada publikací. Pro analýzy dat se v rámci projektu Stulong významným způsobem používá systém LISp-Miner.


Datum: 21. 07. 2017

URL: