Navigační lišta
Projekt Stulong sleduje dva hlavní cíle:
Rizikové faktory aterosklerózy byly sledovány u 1 419 mužů v letech 1976–1999 v souladu s celkovou metodikou projektu. Při vstupním vyšetření byly zjišťovány hodnoty 244 atributů. Hodnoty 219 z nich byly číselné kódy nebo výsledky měření. Dále bylo provedeno 10 610 kontrolních vyšetření, při kterých byly zjišťovány hodnoty 66 atributů.
Dobýváním znalostí z databází (DZD) se rozumí analýza často rozsáhlých observačních dat s cílem nalézt netušené vztahy a sumarizovat data novými způsoby tak, že jsou srozumitelná a užitečná pro jejich majitele. V této souvislosti se používá i anglický termín data mining.
DZD je dlouhý a složitý proces, který zahrnuje několik vzájemně provázených a
dále členěných etap. Je k dispozici několik metodologií, jedna
z nejznámějších je metodologie
CRISP, viz obrázek
(kliknutím na obrázek získáte jeho větší verzi).
V projektu STULONG se jedná o etapy:
porozumění problematice kdy s využitím metodiky projektu stanovíme analytické otázky, na které je třeba odpovědět,
porozumění prvotním datům, které zahrnuje zejména základní frekvenční analýzu pro všechny pozorované atributy,
transformace dat do formy nutné pro řešení analytických otázek dostupnými analytickými metodami,
řešení analytických otázek a interpretace výsledků.
Důležitou roli při formulaci a řešení analytických otázek hrají různé výchozí znalosti.
Součástí projektu Stulong jsou i dva výzkumné projekty:
prezentace výsledků analýz v přirozeném jazyce,
on-line analýzy, které umožňují on-line klást vlastní analytické otázky po Internetu a získávat bezprostředně odpovědi.
Projekt Stulong započal v první polovině sedmdesátých let jako rozsáhlá epidemiologické studie primární prevence aterosklerózy. Sběr dat probíhal na několika pracovištích. Prvotní data byla později upravena do elektronické podoby a zpracována základními statistickými postupy. Poté byla analyzována v rámci výzkumu aplikací metod dobývání znalostí v medicíně. Na těchto pracích se podílí rozsáhlý kolektiv autorů.
K projektu se také vztahuje řada publikací. Pro analýzy dat se v rámci projektu Stulong významným způsobem používá systém LISp-Miner.
Navigační lišta:
Mail to: webmaster ; datum poslední aktualizace: 22. 10. 2003