ūüď£ Meghirdetj√ľk az II. sz√©kelydata adatvizualiz√°ci√≥s versenyt! Ak√°rcsak a tavaly, p√°ly√°zat c√©lja id√©n is az adatfeldolgoz√°s √©s adatvizualiz√°ci√≥ n√©pszerŇĪs√≠t√©se iskol√°sok √©s friss egyetemista fiatalok k√∂r√©ben.

ūüď§ Beny√ļjt√°si hat√°ridŇĎ: 2019.12.31

ūüŹĘ Az idei verseny √ļj√≠t√°sa, hogy elind√≠tunk egy ny√≠lt adatsor kateg√≥ri√°t is: ide olyan c√©gek √©s mag√°nszem√©lyek jelentkez√©s√©t v√°rjuk, akik √ļgy gondolj√°k, hogy potenci√°lisan aranyat √©rŇĎ adatokon √ľlnek, de eddig m√©g nem volt idej√ľk/lehetŇĎs√©g√ľk vizu√°lisan feldolgozni ŇĎket. Most jelentkezhetnek adatokkal egy k√ľl√∂nd√≠j d√≠j felaj√°nl√°sa fej√©ben!

ūüé® A tavalyi verseny nagy sikernek √∂rvendett, sŇĎt, megszervezt√ľk az elsŇĎ erd√©lyi adatvizualiz√°ci√≥s mini-konferenci√°t is. 2020-ban meg szeretn√©nk ezt ism√©telni!


ūüßĺ Szab√°lyzat

  • A p√°ly√°zat c√©lja az adatfeldolgoz√°s √©s adatvizualiz√°ci√≥ n√©pszerŇĪs√≠t√©se iskol√°sok √©s friss egyetemista fiatalok k√∂r√©ben.
  • A teljes p√°ly√°zati ki√≠r√°st, felt√©teleket, esetleges m√≥dos√≠t√°sokat, adatsort √©s b√°rmilyen m√°s ezzel kapcsolatos h√≠rt a sz√©kelydata blogon nyilv√°noss√°gra hozunk. Fenntartjuk a szab√°lyzat b√°rmikori megv√°ltoztat√°s√°nak jog√°t.
  • A p√°ly√°zatra b√°rki jelentkezhet aki 1994.01.01 ut√°n sz√ľletett. Ezt az esetleges d√≠j√°tv√©telkor igazolni kell.
  • A p√°ly√°zatra NEM jelentkezhetnek adatelemzŇĎi √©s/vagy adatvizualiz√°ci√≥s tev√©kenys√©get teljes idejŇĪ munkak√∂rben folytat√≥ fiatalok. Ezt az esetleges d√≠j√°tv√©telkor igazolni kell.
  • A p√°lyamunk√°kat szakmai zsŇĪri b√≠r√°lja el. Ennek √∂sszet√©tel√©t a¬†sz√©kelydata blogon nyilv√°noss√°gra hozzuk.
  • A p√°lyamunk√°kat k√©t kateg√≥ri√°ban pontozzuk: adatanal√≠zis minŇĎs√©ge (content) √©s vizualiz√°ci√≥ sz√©ps√©ge (beauty). A Kantar Information is Beautiful Awards szolg√°l √ļtmutat√≥ul minŇĎs√©gben.
  • Nincsenek megk√∂t√©sek a beadott p√°lyamunk√°t illetŇĎen: lehet statikus vagy interakt√≠v adatvizualiz√°ci√≥, infografika, vide√≥.
  • Egy p√°ly√°z√≥ t√∂bb p√°lyamunk√°t is beny√ļjthat.
  • P√°ly√°z√≥ lehet egy szem√©ly vagy t√∂bb tagb√≥l √°ll√≥ csapat, de a d√≠jak √∂sszege nem szem√©lyre, hanem p√°lyamunk√°ra vonatkozik.
  • A p√°ly√°zatra nyelv/√°llampolg√°rs√°g, illetve b√°rmilyennemŇĪ hovatartoz√°st√≥l f√ľggetlen√ľl b√°rki jelentkezhet. Ellenben a beny√ļjtott p√°lyamunka nyelve magyar vagy angol lehet. A nyelvnek nincs jelentŇĎs√©ge az elb√≠r√°l√°s sor√°n.
  • Abban az esetben ha a zsŇĪri √ļgy √≠t√©li meg, hogy egyetlen p√°lyamunka sem √©ri el a minim√°lis szakmai szintet, fenntartjuk a d√≠j kioszt√°s√°nak elt√∂rl√©s√©t b√°rmely kateg√≥ri√°ban.
  • A verseny k√©t fordul√≥ban zajlik.
    • Az elsŇĎ fordul√≥ban a jelentkez√©si ŇĪrlapot kit√∂ltve kell a p√°lyamunk√°t beny√ļjtani.
    • A beny√ļjtott p√°lyamunk√°k k√∂z√ľl a zsŇĪri n√©h√°nyat kiv√°laszt a m√°sodik fordul√≥ra. Itt egy √©lŇĎ bemutat√≥ban kell majd a p√°lyamunk√°t megv√©deni .
    • A m√°sodik fordul√≥ helysz√≠ne a II. erd√©lyi adatvizualiz√°ci√≥s mini-konferencia, Kolozsv√°r, 2020 janu√°r 11.
    • Ha egy m√°sodik fordul√≥ra kiv√°lasztott p√°ly√°z√≥nak nem ny√≠lik lehetŇĎs√©ge a bemutat√≥napon val√≥ √©lŇĎ r√©szv√©telre, virtu√°lis megold√°st biztos√≠tunk.
  • B√°rmilyen felmer√ľlŇĎ k√©rd√©st a sz√©kelydata blogon kell feltenni a p√°ly√°zatot meghirdetŇĎ bejegyz√©s¬†alatt, komment form√°ban. Szem√©lyes k√©rd√©seket a mail@csaladen.es email c√≠mre lehet k√ľldeni, ellenben a komment a prefer√°lt m√≥d.

ūüď䬆Adatok

1. Közös adatsor kategória

A 2019-es √©v glob√°lisan legmeghat√°roz√≥bb t√©m√°ja a kl√≠mav√°ltoz√°s. Nem titkolt inspir√°ci√≥ Ed Hawkins #ShowYourStripes vizualiz√°ci√≥ja, ami egy eg√©sz mozgalmat ind√≠tott el vil√°gszerte a vizualiz√°ci√≥ – ergo adatalap√ļ diskurzus ter√©n a kl√≠mav√°ltoz√°s t√©m√°ban. Ez√©rt a II. sz√©kelydata adatvizualiz√°ci√≥s verseny k√∂z√∂s adatsora Rom√°nia √©s Magyarorsz√°g idŇĎj√°r√°s-√°llom√°sai √°ltal r√∂gz√≠tett hossz√ļt√°v√ļ, nagyfelbont√°s√ļ kl√≠maadatai.

Az adatsor a https://szekelydata.csaladen.es/verseny/2019/data c√≠men √©rhetŇĎ el. Ak√°rcsak a tavalyi versenyn√©l, id√©n is hamarosan r√©szletes le√≠r√°st k√∂zl√ľnk az adatokr√≥l (UPDATE: itt).

A sz√©kelydata sz√°m√°ra fontos szempont, hogy minden elemz√©s √©s munka amit v√©gz√ľnk, az ingyenesen √©s nyilv√°nosan el√©rhetŇĎ legyen. A nagyfelbont√°s√ļ, hossz√ļt√°v√ļ idŇĎj√°r√°s-adatok √°ltal√°ban mindig fizetŇĎsek. Kiv√©telt k√©peznek a NOAA (Amerikai √Čghajlat- √©s √ďce√°ntanulm√°nyoz√°si √úgyn√∂ks√©g) adatb√°zis√°ban vil√°gszerte regisztr√°lt idŇĎj√°r√°s-√°llom√°sok adatai. Ez√©rt ezt az adatb√°zist (NCDC/NCEI) haszn√°ltuk fel a verseny k√∂z√∂s adatsor√°nak elk√©sz√≠t√©s√©hez. Az adatokat a k√∂vetkezŇĎ lek√©rdez√©ssel nyert√ľk: Country ‚Üí Romania/Hungary ‚Üí Surface Data (Hourly Global) ‚Üí SIMPLIFIED ‚Üí I AGREE ‚Üí Country: Romania/Hungary ‚Üí Selected ROMANIA/HUNGARY stations ‚Üí Mindent kiv√°laszt ‚Üí 1931/01/01 – 2019/10/01 (Select Only Obs. on the Hour nincs kiv√°lasztva!) ‚Üí Inventory Review kipip√°lva, captcha, email c√≠m ‚Üí Submit Request

Az adatokat több fájlban tároltuk, ebben a mappában, Romániára és Magyarországra lebontva. Ezek a mappák zip-pel összecsomagolt txt szövegfájlokat tartalmaznak. Mindegyik zip fájlban 3 txt fájl található:

  • egy dat v√©gzŇĎd√©sŇĪ, ezek az adatsorok
  • egy stn √©s egy stn+ v√©gzŇĎd√©sŇĪ (tartalomra azonos), ezek a meta-adatok

Minden adatsor egy azonos√≠t√≥ (USAF oszlop) alapj√°n, idŇĎj√°r√°s-√°llom√°sok szerint rendezett idŇĎsor (time series). A stn f√°jlok az azonos√≠t√≥ szerint tartalmazz√°k az idŇĎj√°r√°s-√°llom√°sok nev√©t, koordin√°t√°it √©s f√∂ldrajzi magass√°g√°t. Az adatsorok t√∂bbi oszlopainak le√≠r√°s√°t 3505doc.txt f√°jlban tal√°lhatod (angolul – ha seg√≠ts√©ged van ford√≠t√°sra, k√©rlek kommentben jelezd).

A k√∂z√∂s adatsor kateg√≥ria t√©m√°ja a kl√≠mav√°ltoz√°s, ellenben az adatok felhaszn√°l√°sa ebben a t√©mak√∂rben nem szŇĪk√≠tett az itt megadott adatokra! Felhaszn√°lhatsz p√©ld√°ul m√°s orsz√°gokat is a fenti adatb√°zisb√≥l (persze itt neked kell az √ļj adatb√°zis-lek√©rdez√©st v√©grehajtani), vagy ak√°r a rom√°niai (Nemzeti Statisztikai Hivatal, Orsz√°gos Meteorol√≥giai Hat√≥s√°g) vagy magyarorsz√°gi (K√∂zponti Statisztikai Hivatal, Orsz√°gos Meteorol√≥giai Szolg√°lat) forr√°sokat. Budapesti viszonylatban az √ĀTL√ď adatvizualiz√°ci√≥s mŇĪhely egy szuper anyagot k√©sz√≠tett m√°r errŇĎl, de Maarten Lambrechts idŇĎj√°r√°s-vizualiz√°ci√≥j√°t is megeml√≠ten√©m inspir√°ci√≥nak. Egyetlen kik√∂t√©s, hogy ha tov√°bbi adatokat haszn√°lsz a p√°lyamunk√°d elk√©sz√≠t√©s√©hez, akkor ezek nyilv√°nosan √©s ingyenesen el√©rhetŇĎek kell legyenek.

2. Nyílt adatsor kategória

Az idei verseny √ļj√≠t√°sa, hogy elind√≠tunk egy ny√≠lt adatsor kateg√≥ri√°t is. Ide olyan c√©gek √©s mag√°nszem√©lyek jelentkez√©s√©t v√°rjuk, akik √ļgy gondolj√°k, hogy potenci√°lisan aranyat √©rŇĎ adatokon √ľlnek, de eddig m√©g nem volt idej√ľk/lehetŇĎs√©g√ľk vizu√°lisan feldolgozni ŇĎket. √ćgy most a II. sz√©kelydata adatvizualiz√°ci√≥s verseny ny√≠lt adatsor kateg√≥ri√°j√°ba jelentkezhetnek adataikkal, adatsoronk√©nt egy k√ľl√∂nd√≠j d√≠j felaj√°nl√°sa fej√©ben. Ennek a m√©rt√©ke term√©szetesen a felaj√°nl√≥t√≥l f√ľgg, de minimum 200 ‚ā¨ a javasolt √©rt√©k. Ez a kateg√≥ria ugyan√ļgy k√©tfordul√≥s, az elb√≠r√°l√°si krit√©riumok azonosak a fŇĎkateg√≥ri√°√©val, ellenben itt adatsoronk√©nt egy d√≠j ker√ľl kioszt√°sra – illetve a felaj√°nl√≥ eld√∂ntheti, ha t√∂bb d√≠jat is ki szeretne osztani.

ūüďĚ Ny√≠lt adasor ŇĪrlap

ūüď§ Beny√ļjt√°si hat√°ridŇĎ: 2019.11.30

Az adatsorok egyetlen krit√©riuma, hogy legal√°bb 1000 adatpontot tartalmazzanak √©s legal√°bb 4 dimenzi√≥ban v√°ltozzanak. Egy ilyen p√©lda: egy c√©g munkapontjainak napi √°rbev√©tele. Minden munkapont tartalmaz egy azonos√≠t√≥t, helysz√≠nt, illetve a k√ľl√∂nb√∂zŇĎ kereskedelmi tev√©kenys√©geket le√≠r√≥ c√≠mk√©ket √©s √©rt√©keket, napi idŇĎb√©lyeggel ell√°tva.

A d√≠jak semmilyen jogi k√∂telezetts√©get nem vonnak maga ut√°n egyik f√©l r√©sz√©rŇĎl sem. Ny√≠lt adatsorok javaslat√°ra egy√©nek √©s c√©gek jelentkez√©s√©t ennek az ŇĪrlapnak a kit√∂lt√©s√©vel v√°rjuk 2019.11.30-ig. B√°rmilyen k√©rd√©st a mail@csaladen.es c√≠men tehetnek fel.


ūüďÜ Fontos d√°tumok

  1. ELSŇź FORDUL√ď beny√ļjt√°si hat√°ridŇĎ: 2019.12.31
  2. NY√ćLT ADATSOR beny√ļjt√°si hat√°ridŇĎ: 2019.11.30
  3. M√ĀSODIK FORDUL√ď √©lŇĎ bemutat√≥k: 2020.01.11

EREDM√ČNYHIRDET√ČS: 2020.01.11

ūüŹÖ D√≠jak

FŇĎd√≠j: 500 ‚ā¨
Legjobb adatelemz√©s: 200 ‚ā¨
Legszebb adatvizualiz√°ci√≥: 200 ‚ā¨

Ny√≠lt adatsor kateg√≥ria: 200 ‚ā¨ adatsoronk√©nt

A díjak Csala Dénes és számos magánszemély, illetve cég adományai.

A díjak jogilag személyes, baráti ajándék formáját öltik.
A d√≠jak semmilyen jogi k√∂telezetts√©get nem vonnak maga ut√°n egyik f√©l r√©sz√©rŇĎl sem. Esetleges tov√°bbi d√≠jak, felaj√°nl√°sok, adom√°nyok javaslat√°ra egy√©nek √©s c√©gek jelentkez√©s√©t v√°rjuk a mail@csaladen.es c√≠men.


ūüßģ P√°lyamunka

A p√°lyamunk√°k a sz√©kelydata blogbejegyz√©seinek szok√°sos form√°tum√°t k√∂vetik: egy fŇĎ vizualiz√°ci√≥, esetleg t√∂bb egyszerŇĪbb infografika √°ltal k√≠s√©rve, az adatfeldolgoz√°shoz √©s a vizualiz√°ci√≥k elk√©sz√≠t√©s√©hez haszn√°lt k√≥dr√©szletek, illetve egy r√∂vid t√∂rt√©netmes√©l√©s.

√ćgy a p√°ly√°zathoz is 3 beny√ļjt√°si mezŇĎ tartozik: VIZ, K√ďD √©s LE√ćR√ĀS. A p√°lyamunka t√≠pus√°t√≥l f√ľggetlen√ľl aj√°nlott a GitHub haszn√°lata. Itt egy repository-ban csoportos√≠thatsz mindent. A sz√©kelydata blog GitHub csatorn√°ja √ļtmutat√≥ul szolg√°lhat e t√©ren.

A VIZ mezŇĎbe k√©rlek illeszd be a p√°lyamunk√°d vizualiz√°ci√≥s r√©sz√©hez mutat√≥ hyperlinket. Ha nem siker√ľl a GitHub be√°ll√≠t√°sa/haszn√°lata, akkor a k√∂vetkezŇĎ alternat√≠v√°kat haszn√°ld:

  • Statikus vizualiz√°ci√≥/infografika eset√©n: Dropbox, Onedrive, GDrive vagy IMGUR
  • Vide√≥ eset√©n: YouTube vagy Videa
  • HTML vizualiz√°ci√≥ eset√©n: GitHub, Heroku
  • Tableau/PowerBI/Excel m√°s eszk√∂z√∂k eset√©n a be√©p√≠tett online megoszt√°si linket haszn√°ld

A K√ďD mezŇĎbe k√©rlek illeszd be az adatfeldolgoz√°sra √©s a vizualiz√°ci√≥ megval√≥s√≠t√°s√°ra haszn√°lt k√≥d el√©r√©sez mutat√≥ hyperlinket. GitHub, JSBin, JSFiddle vagy m√°s hasonl√≥ szolg√°ltat√°sok haszn√°lata aj√°nlott.

A LE√ćR√ĀS mezŇĎbe k√©rlek √≠rd be a k√∂vetkezŇĎket, √∂sszesen maximum 300 sz√≥ban:

  • Honnan j√∂tt az √∂tlet?
  • Hogyan v√©gezted az adatfeldolgoz√°st?
  • MirŇĎl sz√≥l a vizualiz√°ci√≥?
  • Mi√©rt √©rdekes?
  • Szeretn√©l-e ilyesmivel foglalkozni ezut√°n is?

ūüďĚ JELENTKEZ√ČSI ŇįRLAP


ūüöÄ SOK SIKERT!

  •  
  •  

Csala Dénes

adatblogger

4 hozzászólás

Zsolt Kiraly · 2019-11-25 - 10:30

Jo napot kivanok!

A 3505doc.txt filehoz kaphatnek-e egy magyar forditast?

Elore is koszonom!
Zsolt

Kiraly Zsolt · 2019-12-04 - 14:45

Köszönöm szépen!

sz√≥lj hozz√° | iratkozz fel ‚Üď