Recenze  |  Aktuality  |  Články
Doporučení  |  Diskuze
Fotoškola  |  Seriály
Fotoaparáty  |  Objektivy
Fotomobily  |   Software
Příslušenství  |  Ostatní
Svět hardware  |  TV Freak
Svět mobilně

Unsplash uvolnil dataset 2 milionů bezplatných snímků např. pro vývoj AI

8.8.2020, Milan Šurkala, aktualita
Fotobanka Unsplash je mezi mnohými fotografy nenáviděna, protože jiní autoři zde dávají snímky k bezplatnému použití. Nyní navíc uvolňuje ke stažení dataset 2 milionů snímků v jednom velkém archivu.
Na trhu je mnoho fotobank a jednou z nich je i Unsplash. Zde fotografové mohou dávat snímky k bezplatnému použití jako public domain (licence CC0). Použít je tedy můžete v podstatě k čemukoli. Není divu, že se Unsplash setkává s velkou nenávistí u mnoha jiných fotografů, kteří své snímky dávají do fotobank, kde zákazníci za stažení platí (a fotograf dostává provizi, byť mnohdy pěkně mizernou). Nyní tato fotobanka dává volně ke stažení obrovský dataset 2 milionů snímků od více než 200 tisíc fotografů v jednom velkém archivu.
 
Unsplash
 
Celý archiv má 16 GB a není přímo určen jen k tomu, aby lidé používali takové fotografie na svých stránkách. To už mají mnohem jednodušší si najít cílové snímky přímo na stránkách a stáhnout jen konkrétní snímky. Tak obrovský dataset kvalitních snímků je však naprosto ideálním zejména pro vývoj systémů umělé inteligence (AI). Ta totiž potřebuje obrovské množství označených trénovacích dat, což se může hodit zejména pro ty systémy AI, které nějakým způsobem pracují s obrazem. Může jít např. o algoritmy pro rozpoznávání obrazu, vyhodnocování kompozice a jiná určení.
 
Proto jsou všechny snímky doplněny i o klíčová slova generována komunitou i systémy AI, mají EXIF, záznam o lokaci, pamětihodnostech, kategorii i podkategorii, statistiky o počtu shlédnutí a stažení. Díky tomuto jsou při trénování k dispozici všechna důležitá data, kterými AI může vyhodnotit, jak moc se trefila při zpracování snímku. Tedy např. zda opravdu rozpoznala to, co měla rozpoznat. Omezený dataset na 25 tisíc snímků lze využít i komerčně, plný dataset 2 milionů snímků je ale uvolněn jen k nekomerčnímu použití, takže např. vědeckým účelům (příkladem mohou být další nové typy algoritmů AI).
 


Autor: Milan Šurkala
Vystudoval doktorský program v oboru informatiky a programování se zaměřením na počítačovou grafiku. Nepřehlédněte jeho seriál Fotíme s Koalou o základech fotografování.