Jak to działa

Poniżej wyjaśnimy w jaki sposób to wszystko funkcjonuje. W skrócie - stworzyliśmy robota, który robi większość czynności za nas, korzystając z otwartych informacji polskiej Wikipedii.

Tworzenie listy roślin występujących w Polsce

Robot czyta nazwy łacińskie roślin wyszczególnionych w następujących artykułach z Wikipedii:

Sprawdzanie poprawności nazw i poszukiwanie synonimów

Po zebraniu nazw łacińskich roślin, robot korzysta z bazy The Plant List sprawdzając, czy dana nazwa jest nazwą główną, czy synonimem. Jeśli okazuje się synonimem - korzysta z nazwy głównej. .

Pobieranie informacji z Wikipedii

Robot ściąga artykuły dla roślin obecnych w Wikipedii, a następnie przetwarza je tak, by uzyskać jak najwięcej informacji na temat morfologii. Uzyskane w ten sposób cechy grupuje w sposób zdefiniowany przez nas i dodaje do bazy danych atlasu.

Następnie robot poszukuje taksonomii danej rośliny w bazie GBIF i dodaje wynik do bazy atlasu. W ostatnim etapie, korzystając z API Wikipedii, robot pobiera zdjęcia roślin z polskiej Wikipedii oraz z Wikimedia. Informacje o autorstwie zdjęć i zasadach udostępniania są pobierane z użyciem API wmflabs.

Dodatkowe zdjęcia robot pobiera ze strony http://www.actaplantarum.org/acta/galleria.php udostępnianych na zasadach Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License oraz z http://www.biolib.de udostępniającej skany z książek botanicznych, które przeszły do Domeny Publicznej.

Potwierdzanie informacji

Wpisy dotyczące nowych roślin są przeglądane przez człowieka, cechy charakterystyczne są na tym etapie ewentualnie modyfikowane. Zduplikowane zdjęcia również są usuwane. Uwaga: nie jesteśmy w stanie na bieżąco przeglądać bazy (zapraszamy do współpracy!), dlatego zawsze podchodź do prezentowanych tu informacji ostrożnie i potwierdź w innych źródłach.

Zawartość bazy danych

Baza zawiera 2381 roślin rosnących dziko bądź w uprawie na terenie Polski. Baza zawiera również 80730 miejsc występowania roślin z bazy GBIF oraz 432 wprowadzonych przez Użytkowników atlasu. Dla łatwiejszej identyfikacji, baza zawiera 68136 zdjęć (+ 2879 dodanych przez Użytkowników) różnych części roślin udostępnianych w Internecie na zasadach Creative Commons bądź będących w domenie publicznej.
Nie wszystkie rośliny występują w bazie: z informacji o roślinach występujących w Polsce [1, 2, 3] wynika, że brakuje nam około 954 roślin (zobacz poniżej jak możesz to zmienić), co więcej - w przypadku 68 roślin nie posiadamy zdjęć co znacznie utrudnia ich identyfikację (zobacz poniżej jak możesz to zmienić). Wierzymy, że z upływem czasu baza będzie systematycznie uzupełniana, m.in. dzięki Wam.

Histogram liczby cech przypisanych roślinom

Statystyki poszczególnych cech przypisanych roślinom

GrupaCecha# roślin
ogólne roślina barwierska 2
ogólne krzewinka 33
ogólne drzewo 279
ogólne krzew 210
ogólne roślina wodna 113
ogólne roślina trująca 301
ogólne roślina lecznicza 457
ogólne roślina jadalna 261
ogólne roślina miododajna 174
barwa kwiatów płatki pomarańczowe 54
barwa kwiatów płatki białe 814
barwa kwiatów płatki różowe 515
barwa kwiatów płatki czerwone 340
barwa kwiatów płatki fioletowe 475
barwa kwiatów płatki niebieskie 178
barwa kwiatów płatki żółte 726
barwa kwiatów płatki zielone 327
barwa kwiatów płatki brązowe 95
kształt korony korona o płatkach zrośnietych 4
kształt korony korona o płatkach wolnych 3
kształt korony kwiaty zwisające 140
kształt korony kwiatostan 615
kształt korony baldachy 231
kształt korony kwiat złożony 32
liczba płatków płatki trzy i mniej 46
liczba płatków płatki cztery 79
liczba płatków płatków pięć 214
liczba płatków płatków sześć i więcej 17
symetria kwiatu kwiat promienisty 85
symetria kwiatu kwiat grzbiecisty 131
symetria kwiatu kwiat motylkowy 80
blaszka liściowa liście okrągłe 95
blaszka liściowa liście lancetowate 714
blaszka liściowa liście nerkowate 40
blaszka liściowa liście wąskie i wydłużone 297
blaszka liściowa liście najszersze w połowie długości 38
blaszka liściowa liście najszersze przy końcu 187
blaszka liściowa liście najszersze przy nasadzie 89
blaszka liściowa igły 60
blaszka liściowa liście sercowate 214
blaszka liściowa bez zielonych liści 2
blaszka liściowa liście jajowate 809
ulistnienie ząbkowany 372
ulistnienie karbowany 150
ulistnienie całobrzegie 275
ulistnienie piłkowane 223
ulistnienie liście pierzaste 405
ulistnienie liście skrętoległe 270
ulistnienie naprzeciwległe 230
ulistnienie okółkowe 17
ulistnienie naprzemianległe 43
ulistnienie dłoniastodzielne 10
ulistnienie liście owłosione 647
ulistnienie ogonek liściowy obecny 456
ulistnienie bezogonkowe 339
ulistnienie u dołu łodygi lub odziomkowe 360
ulistnienie wcinane (wrębne, sieczne i klapowane) 290
kolor owoców fioletowe 11
kolor owoców białe 62
kolor owoców żółte 134
kolor owoców pomarańczowe 25
kolor owoców zielone 113
kolor owoców niebieskie 17
kolor owoców czarne 119
kolor owoców brązowe 222
kolor owoców czerwone 152
kształt owoców puch kielichowy 2
kształt owoców łuszczyna 81
kształt owoców rozłupki 142
kształt owoców mieszek 44
kształt owoców torebki 485
kształt owoców skrzydełka 108
kształt owoców jagoda 135
kształt owoców kuliste 285
kształt owoców niełupki 250
kształt owoców duże 19
kształt owoców ziarniak 60
kształt owoców strąki 100
kształt owoców orzechy 205
powierzchnia owocu pomarszczona 32
powierzchnia owocu żeberkowana 56
powierzchnia owocu gładka 89
powierzchnia owocu szorstka 11
powierzchnia owocu owłosiona 203
powierzchnia owocu kanciasta 49
sok pędu sok mleczny 17
wygląd łodygi łodyga trójkanciasta 47
wygląd łodygi łodyga czterokanciasta 69
wygląd łodygi łodyga gałęzista 686
wygląd łodygi łodyga szorstka 107
wygląd łodygi łodyga owłosiona 655
wygląd łodygi łodyga żebrowana 8
wygląd łodygi łodyga gładka 353
wygląd łodygi łodyga pełzająca 214
szacowana wysokość łodygi do kostki (0 < x < 15 cm) 123
szacowana wysokość łodygi od kostki do kolana (15< x <60 cm) 15
szacowana wysokość łodygi od kolana do pasa (60 < x < 100 cm) 358
szacowana wysokość łodygi od pasa do wysokości człowieka (100 < x < 200 cm) 224
szacowana wysokość łodygi wyższa od człowieka (> 200 cm) 266
zapach łodygi zapach aromatyczny 18
zapach łodygi zapach czosnkowy 2
zapach łodygi zapach nieprzyjemny 10
pora kwitnienia grudzień 2
pora kwitnienia luty 9
pora kwitnienia marzec 67
pora kwitnienia kwiecień 227
pora kwitnienia maj 603
pora kwitnienia czerwiec 992
pora kwitnienia lipiec 1074
pora kwitnienia sierpień 844
pora kwitnienia wrzesień 429
pora kwitnienia październik 125
pora kwitnienia listopad 8
siedlisko null 1

Aktualizacja bazy danych

Korzystając z powyżej przedstawionego schematu, robot sprawdza co tydzień czy pojawiły się nowe rośliny w polskiej Wikipedii oraz czy obecne już w naszej bazie rośliny nie zostały zaktualizowane - jeśli tak, nanosi poprawki w atlasie.

Jak wynika z powyższego opisu, by uaktualnić bazę atlasu należy uaktualnić polską Wikipedię. Zachęcamy do samodzielnego dodawania artykułów o polskich roślinach (można to zrobić bez zakładania konta) - nie tylko wzbogacisz Wikipedię, ale jednocześnie atlas. Oczywiście Wikipedia (czy bardziej ogólnie - Wikimedia) umożliwia również dodawanie zdjęć roślin.

Jeśli jesteś zainteresowana/y dodaniem nowych roślin do Wikipedii, poniżej przygotowaliśmy spis pozycji, które prawdopodobnie występują w Polsce, ale nie występują w Wikipedii:

Warto pamiętać, że polscy Wikipedyści tworzą artykuły dotyczące roślin według pewnego schematu, który jest opisany tutaj.

Jeśli brakuje w atlasie rośliny, która jest obecna w Wikipedii, możesz albo nam o tym napisać, albo uzupełnić któryś z poniższych spisów roślin w Wikipedii:

Rozpoznawanie roślin na podstawie zdjęć

Rozpoznawanie wykorzystuje sieć neuronową resnet 101 wytrenowaną na podstawie zdjęć z atlasu za pomocą mxnet. Model można pobrać tutaj (licencja GPL).

Dokładność algorytmu rozpoznawania roślin na podstawie zdjęcia*:

w 77%przypadków roślina ze zdjęcia pojawia sięjako pierwsza na liście wyników
w 91%w pierwszej piątce
* - wyniki dla 25642 losowych, ogólnodostępnych w internecie zdjęć roślin, po wyłączeniu zdjęć użytych do trenowania sieci neuronowej (validation set, dlatego w rzeczywistości dokładność będzie nieznacznie mniejsza)

Licencja

Zawartość atlasu udostępniana jest na zasadach licencji Creative Commons BY-SA 3.0, ponieważ pochodzą one z Wikipedii. Zdjęcia natomiast opatrzone są informacją o licencji i autorstwie przy powiększeniu ich do pełnego rozmiaru. Jest to zazwyczaj licencja z rodziny Creative Commons lub domena publiczna. Jeśli Twoje zdjęcie znalazło się tu wbrew licencji, zgłoś to nam korzystając z przycisku Zgłoś błąd po prawej stronie okna.

Kod źródłowy

Kod źródłowy atlasu roślin jak i aplikacji na telefony mobilne można pobrać z repozytorium. Kod udostępniany jest na wolnej licencji GPL.