Přejít na hlavní obsah

Dataset IRT snímků srnčat

Citace

Bumbálek, R., Zoubek, T., Tesař, J., Polenský, J., Kuneš, R., Bartoš, P., Liška, M., Filip, M., and Šramhauser, K. (2025). Dataset of young deer (IRT images) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.18197469

Popis výstupu

Dataset po augmentaci obsahuje 29 150 snímků a anotace ve formátu MS COCO pro sledované třídy „zvíře“ a „osoba“, přičemž celkový počet objektů spadajících do první kategorie činí 62 781 a v rámci druhé kategorie je v datasetu vyznačeno 18 349 objektů. V tomto datasetu je nahrazena třída „srnče“ třídou „zvíře“, protože dle IRT snímků nelze konkrétní druh zvěře relevantně určit, avšak na většině obrázcích se nachází právě srnčata. Struktura datasetu IRT snímků srnčat je detailně popsána v tabulce 1, která shrnuje vybrané statistické charakteristiky anotovaných instancí obou sledovaných tříd

Tabulka 1: Vybrané vlastnosti objektů trénovacího a validačního datasetu

Třída zvíře Třída osoba
Počet instancí 62 781 18 349
Min. šířka 1 1
Max. šířka 240 139
Prům. šířka 19,03 17,60
Min. výška 2 3
Max. výška 321 155
Prům. výška 21,07 22,09
Min. plocha 0,001 0,001
Max. plocha 18,81 4,04
Prům. plocha 0,22 0,15
Min. počet obvodových bodů 8 8
Max. počet obvodových bodů 400 316
Prům. počet obvodových bodů 59 69

Rozměrové charakteristiky objektů vykazují u obou tříd značnou variabilitu, přičemž minimální rozměry dosahují extrémně nízkých hodnot. Minimální šířka činí u obou tříd 1 pixel, minimální výška pak 2 pixely u třídy zvíře a 3 pixely u třídy osoba. Tyto hodnoty indikují přítomnost velmi malých a vzdálených objektů, případně instancí zachycených pouze částečně. Maximální rozměry se mezi třídami výrazně liší. U třídy zvíře dosahuje maximální šířka 240 pixelů a maximální výška 321 pixelů, zatímco u třídy osoba jsou tyto hodnoty nižší, konkrétně 139 pixelů na šířku a 155 pixelů na výšku. To naznačuje, že zvířata se v datasetu vyskytují v širším spektru měřítek a častěji zabírají větší část obrazu než osoby.

Průměrné hodnoty šířky a výšky jsou u obou tříd relativně nízké a vzájemně si blízké. U třídy zvíře činí průměrná šířka 19,03 pixelů a průměrná výška 21,07 pixelů, zatímco u třídy osoba dosahují tyto hodnoty 17,60 a 22,09 pixelů. To potvrzuje, že většina objektů v datasetu patří mezi malé instance, což klade zvýšené nároky na schopnost modelu detekovat jemné struktury a drobné objekty v obraze.

Z hlediska relativní plochy polygonálních anotací je patrná dominance velmi malých objektů. Minimální plocha dosahuje u obou tříd hodnoty 0,001, zatímco maximální plocha se výrazně liší. U třídy zvíře dosahuje maximální plocha hodnoty 18,81, což odpovídá případům, kdy objekt zabírá významnou část snímku. Naproti tomu u třídy osoba činí maximální plocha pouze 4,04, což potvrzuje, že osoby jsou v datasetu zpravidla zachyceny v menším měřítku. Průměrné hodnoty plochy jsou nízké – 0,22 u zvířat a 0,15 u osob – a opět poukazují na převahu malých instancí.

Poslední sledovanou charakteristikou je počet obvodových bodů polygonálních masek, který reflektuje tvarovou komplexitu jednotlivých instancí. Minimální počet bodů je u obou tříd shodně 8, což odpovídá velmi jednoduchým polygonálním tvarům. Maximální počet obvodových bodů činí 400 u třídy zvíře a 316 u třídy osoba, což naznačuje, že zvířata mohou vykazovat složitější a členitější obrysy než lidské postavy. Průměrné hodnoty se pohybují na úrovni 59 bodů u zvířat a 69 bodů u osob, přičemž vyšší průměr u třídy osoba odráží relativně konzistentní, avšak tvarově komplexnější siluetu lidské postavy i u menších instancí.

Z uvedených dat vyplývá, že dataset je charakteristický vysokým zastoupením velmi malých objektů a značnou variabilitou jejich tvarové i rozměrové struktury. Přítomnost dvou odlišných tříd s rozdílným rozsahem velikostí a komplexity masek zajišťuje dostatečnou diverzitu trénovacích dat, která je nezbytná pro robustní učení modelu a jeho schopnost generalizovat na reálné scénáře.

Obrázky 1, 2 a 3 znázorňují analýzu velikosti všech polygonálních masek obsažených v datasetu, jejich rozložení v obrazu a vztah mezi počtem obvodových bodů a relativní plochou vůči obrazu.

Vizualizace rozDataset_young_deerměrů anotací obsažených v trénovacím datasetu
Obrázek 1: Vizualizace rozDataset_young_deerměrů anotací obsažených v trénovacím datasetu
Vizualizace polohy objektů v rámci sledované scény
Obrázek 2: Vizualizace polohy objektů v rámci sledované scény
Vizualizace souvislosti mezi plochou polygonálních anotací a počtem jejich obvodových bodů
Obrázek 3: Vizualizace souvislosti mezi plochou polygonálních anotací a počtem jejich obvodových bodů