Použitie fuzzy zhlukovej analýzy v biometrike

Kategorie: Biológia (celkem: 966 referátů a seminárek)



Použitie fuzzy zhlukovej analýzy v biometrike

Ľuboš Bandry
Kľúčové slová: fuzzy množina, fuzzy zhluková analýza, stupeň príslušnosti, fuzzy zhluk
Keywords: fuzzy set, fuzzy cluster analys, fuzzy number, fuzzy cluster

Summary:
Článok pojednáva o možnosti aplikácie fuzzy množín v biometrike. Vysvetľuje rozdiely medzi klasickou zhlukovou analýzou a fuzzy zhlukovou analýzou. Načrtá možnosti aplikácie v konkrétnom príklade v zootechnike ,rastlinnej výrobe a možnosti ďalšieho použitia.

V biometrickej praxi sa často stretávame s požiadavkou roztriediť súbor zvierat do niekoľkých skupín, či už pomocou triednych intervalov, prípadne použitím iných štatistických metód ako sú zonálna analýza, zhluková analýza. Mnohé z týchto metód však vyžadujú, aby súbor mal aspoň približne normálne rozdelenie a určitý počet sledovaných prvkov ( zvierat, odrôd, počet zŕn a iné). Pozrime sa teraz na klasickú zhlukovú analýzu. Jej použitie v biometrike má nezastupiteľné miesto. Pomocou nej môžeme vytvoriť množiny, teda zhluky, ktorých prvky sú si navzájom podobné. Majme teda 5 zvierat- hovädzí dobytok, pričom 2 z nich sú Slovenské strakaté, 2 české strakaté a jedno primitívne plemeno. Pri počte zhlukov 2 jeden zhluk obsahuje slovenské a české strakaté, druhý primitívne plemeno. Táto metóda však nerozlišuje, že medzi slovenským a českým strakatým plemenom sú určité rozdiely (obrázok 1). Túto možnosť nám ponúka fuzzy zhluková analýza, ktorá zakomponuje do klasickej metódy prvok neurčitosti. Pojem fuzzy množina sa objavil v roku 1968, keď Zadeh publikoval prvý článok o fuzzy množinách. Z matematickej analýzy je známa definícia charakteristickej funkcie cA množiny A zobrazujúcej množinu U do dvojprvkovej množiny {0,1}, kde cA(x)=0 ak x nepatrí A alebo cA(x)=1 ak x patrí A. Z definície vyplýva, že funkcia cA nadobúda hodnotu 1 pre také prvky x z U , ktoré patria do množiny A a hodnotu 0 pre také prvky x z U, ktoré do množiny A nepatria. Uvažujme zobrazenie mA, ktoré každému prvku x z U priradí hodnotu z intervalu <0,1>, v závislosti čím sme si viac istý že prvok x patrí do A tým zobrazenie mA bude bližšie k číslu 1. Nech U je množina. Fuzzy množina A v univerzu U je určená funkciou príslušnosti mA®<0,1>. Funkcia príslušnosti priradí každému x z množiny U prvok mA(x), ktorý nazývame stupeň príslušnosti prvku x množiny A. Pri fuzzy zhlukovej analýze je každému prvku priradený stupeň príslušnosti k danému zhluku, teda ak je počet zhlukov 5 je prvok x charakterizovaný 5 stupňami príslušnosti t. j. ku každému zhluku 1.

Súčet stupňov príslušnosti je konštantný a je to vždy číslo 1. Týmto spôsobom môžeme posudzovať či daný prvok je určite súčasťou daného zhluku, či sa k nemu približuje, prípadne určite nie je členom daného zhluku. Vráťme sa teraz k príkladu s 5 zvieratami. Vytvoríme 2 zhluky výsledky sú v tab. 1

číslo zvieraťa a plemeno zhluk č. 1 stupeň príslušnosti zhluk č. 2 stupeň Príslušnosti
1-slovenský strakatý 0,91 0,09
2- slovenský strakatý 0,91 0,09
3- český strakatý 0,80 0,2
4- český strakatý 0,80 0,2
5- primitívne plemeno 0,1 0,9

Ako vidíme z tabuľky je zrejmé že do zhluku 1 patria určite slovenský a český strakatý dobytok, pretože stupeň príslušnosti je vysoký a blíži sa k číslu 1. Je zrejmé že slovenský a český strakatý dobytok určite nepatrí do zhluku č. 2. Ako vidíte, rozdiel medzi slovenským a strakatím dobytkom je veľmi malí ale odlíšený mA(x) slovenského a mA(x) českého dobytka je odlišný. Viac by to bolo zrejmé ak by sme pridali zviera holštajnského plemena, ktoré by malo mA(x) k prvému zhluku 0,65 tj. približuje sa. Týmto spôsobom sme vlastne dostali zhluky, ktoré nemajú striktne dané hranice, ako to mala klasická zhluková analýza ( buď prvok patrí do daného zhluku alebo nepatrí) ale neohraničené zhluky takzvané fuzzy zhluky. Skutočne veľmi málokedy sa stáva aby jeden prvok x mal mA(x)=1 k jednému zhluku a tým k ostatným mA(x)=0. tabuľka 2
stupeň príslušnosti slovný popis
0.8-1.00 určite patrí do zhluku
0,7-0,8 veľmi sa približuje k zhluku
0,6-0,7 približuje sa
0,4-0,6 rovnako vzdialený aj k jednému aj k druhému zhluku ( počet zhlukov 2)
0,3-0,4 vzdialený k zhluku
0-0,3 určite nepatrí
Grafické riešenie tohoto príkladu je na obrázkoch 1-2

obrázok 1 – klasická zhluková analýza v prvom zhluku nerozlišue rozdiel medzi slovenským a českým strakatým dobytkom, sú teda striktne v jednom zhluku bez rozlíšenia rozdielov






obrázok 2 – fuzzy zhluková analýza počet zhlukov 2, zhluky nie sú ostro ohraničené, jedná sa o fuzzy zhluky, v prvom zhluku sú teda rozlíšené rozdiely medzi slovenským strakatým a českým strakatým.

K záveru dodávam, že použitie fuzzy zhlukovej analýzy je širokospektrálne. Možnosti použitia ako v zootechnike, tak aj v botanike, fyziológii, teda všade tam, kde sme doteraz používali klasickú zhlukovú analýzu. Na rozdiel od nej však fuzzy zhluková analýza má širšie uplatnenie, predovšetkým v prípadoch, kedy rozdiely medzi jednotlyvými prvkami sú minimálne, počet prvkov je malý. Vdedy nám táto metóda poskytuje korektné výsledky. Software je pre túto metódu dostupný aj na Slovensku.

Literatúra:
BANDRY, Ľ.: Použitie fuzzy množín v zootechnickom výskume, Zborník zo 4 odborného semináru študentov a doktorandov Genetika a šlechtění zvířat Přerov, 2001
STEHLÍKOVÁ, B.: O výbere dôležitých deskriptorov, Sborník příspěvků z Medzinárodní vědecké konference kateder statistiky a systémové a operační analýzy, l999
NOVÁK, V.: Fuzzy množiny a jejich aplikace, Praha, 1986

Ľuboš Bandry
Katedra genetiky a plemenárskej biológie
AF SPU Nitra
bandry@pobox.sk.

Nový příspěvek



Ochrana proti spamu. Kolik je 2x4?