Két fejlesztésről szeretnék most beszámolni.
Az egyik hír, hogy a járványügyi adatok frissültek a CISID adatbázisban, ez azért fontos, mert ez alapján készítettem – többek között – az európai országok járványügyi helyzetét összehasonlító elemzéseket is. Mivel felkerültek a 2013-as év adatai is, így ezek a térképek és grafikonok egy évvel frissíthetővé váltak, amit most meg is tettem. Az összkép nem változott...
A másik egy sokkal izgalmasabb, bár némileg technikai jellegű fejlemény. Mint azt már annak idején is megírtam, az ilyen és ehhez hasonló adatvizualizációkat R statisztikai programcsomag alatt készítem (mely a biostatisztikai munka alapeszköze manapság). Amikor elkezdtem írni a blogot, grafikára egyszerűen az R alap grafikai eszköztárát ("base R graphics") használtam; az ábrák is így készültek. Azóta azonban felfedeztem Deepayan Sarkar fantasztikus csomagját, a lattice-t, mely egészen megváltoztatta a képemet az adatvizualizációról. Az adatok grafikus megjelenítése minden elemzési feladat fontos lépése kell legyen – sajnos az orvosi területen, pláne magyar viszonylatban, nagyon sokszor nem törődnek eléggé ezzel az aspektussal, pedig ha átgondoltan csinálja az ember, hihetetlen ereje tud lenni, és a későbbi elemzéseket is nagyban megkönnyíti, illetve csökkenti a hibázások esélyét. (Ahogy már Tukey is megmondta: "there is no excuse for failing to plot and look"...)
A lattice általános célú vizualizációs csomag, azonban egészen kiválóan alkalmas orvosi, epidemiológiai adatok vizualizációjára is. Mint a fentiekből is látszik, ez szívügyem, próbálok a publikációimban is minél többet megmutatni a jó adatábrázolások hasznából. A lattice pedig ezt remekül támogatja: a szintaxisa hihetetlenül logikus, szinte kiolvasható mondatokban kell leírni, hogy mit akarunk látni az ábrán, külön előnye, hogy mindig rákényszerít az adatok dimenzionalitásának végiggondolására és tudatos használatára, valamint, nem mellesleg, nagyon esztétikus a végeredménye.
Ezek okán már régóta a fejemben volt, hogy fogni kellene magam, és a blog grafikáit a nulláról újraírni teljesen lattice alá. Jelenthetem: a legelején említett adatfrissítés végre rávitt erre! Ha már egyszer hozzányúlok, akkor csináljuk jól... Úgyhogy mind az idősoros (longitudinális) adatok, mind a keresztmetszeti adatok ábrázolása immár teljesen lattice alatt történik.
Szokásosan a transzparencia jegyében (meg persze mert hátha valakinek hasznos) közzéteszem a teljes kódot, ami az ábrákat készíti:
http://medstat.hu/vakcina/FerenciTamasVedooltasokrolATenyekAlapjanGrafikonrajzolo.R
Kedvcsináló gyanánt egy kis összehasonlítás! (Néhol persze a végeredményben nincs hatalmas különbség: az csak a fenti szkriptből látszik, hogy mennyivel tisztább a kód, hogy mennyivel kevesebb külső csomagra volt szükség, és nem mellesleg, hogy mennyivel rövidebb – az új szkript hossza kevesebb mint a fele a réginek!)
Longitudinális adatok; ilyen volt:
Ilyen lett:
Keresztmetszeti adatok, oszlopdiagrammal; ilyen volt:
Ilyen lett:
Keresztmetszeti adatok, térképpel; ilyen volt:
Ilyen lett: