Din 2015 lista medicilor care primesc bani de la companii farmaceutice trebuie să fie publică. Dar autoritățile pun documentele în locuri și feluri extrem de greu de accesat — practic este ratată miza. Un bărbat a luat datele, le-a curățat și a creat un motor de căutare simplu. Îl vom numi S, pentru că a preferat să nu îi fie dată identitatea.

În continuare puteți vizualiza datele (cele inițiale și cele curățate), căuta medici și afla cum se face data scraping și data cleaning — metodele au minusurile lor, dar sunt un important punct de plecare pentru informare publică și investigații jurnalistice.

De ce e important ca aceste date să fie accesibile?

Banii primiți de doctori de la companii farmaceutice îi pot deturna: ajung să servească interesul companiei, în timp ce interesul pacientului trece în plan secund. Pot înclina să prescrie medicamentele companiei de unde iau bani, indiferent de eficiența lor, sau chiar pot ajunge să facă experimente pe pacienți.

Nu înseamnă că orice medic va proceda așa, dar riscul există, fiindcă banii oferiți vin la pachet cu obligații (implicite sau explice).

Tocmai de asta, în majoritatea statelor, relația doctor - companie farmaceutică este strict reglementată.

Ce spune legea din România: Legea privind reforma în domeniul sănătății (nr. 95/2006) spune că „exercitarea profesiei de medic este incompatibilă cu calitatea de angajat sau colaborator al unităților de producție ori de distribuție de produse farmaceutice sau materiale sanitare”. Pentru șefii unităților de primire a urgențelor situația e și mai strictă: „medicii și asistenții-șefi ai unităților de primire a urgențelor nu pot fi sponsorizați și/sau finanțați, direct sau indirect, pentru participare la conferințe, congrese și alte tipuri de manifestări, de către firmele care comercializează produse farmaceutice și/sau materiale sanitare ori firmele care reprezintă interesele acestora și nici de către firmele de aparatură medicală”.

Care medici români iau cei mai mulți bani?

Cine reușește să găsească documentele cu sponsorizări primite de medici de pe site-ul Agenției Naționale pentru Medicamente și Dispozitive Medicale nu poate afla infomații de tipul: cine a luat cei mai mulți bani, care este totalul sponsorizărilor, cine a dat cei mai mulți bani — practic calculele ar fi trebuit făcute de mână, pe o bază de date cu vreo 75,000 de înregistrări. Dar S a rezolvat problema: după scrapuirea și curățarea datelor, calculele durează câteva minute.

Puteți afla mai multe despre Lupuliasa Dumitru, șeful Colegiului Medicilor și restul doctorilor din top în acest articol Digi24

Iar aici găsiți datele inițiale și cele curățate, pe baza cărora s-au făcut calculele





Grafice realizate cu Tableau de Datavizuri.blogspot.ro

Cum au fost ascunse datele publice și ce l-a determinat pe S. să le facă accesibile?

Teoretic, accesarea informațiilor ar trebui să poată fi făcută pe site-ul Agenției pentru Medicamente. Dar oricine intră pe site sau folosește motoare de căutare nu le poate vedea. De ce? Iată cât neintuitivă este locația documentelor: trebuie intrat pe categoria “Medicamente de uz uman”, unde apar enumerate “Anunțuri importante”, trebuie deschis un astfel de anunț (fără nume) în care scrie asta: “In conformitate cu prevederile art. 814 alin.4 din Legea 95/2006 si art. 35 din OMS 194/2015, raportat la art. 22 alin. 2 din Legea 677/2001, ANMDM a postat pe website-ul propriu, la sectiunea Publicitate, Registrul declaratiilor activitatilor de sponsorizare aferente anului 2015, destinat informarii si deschis spre consultare publicului in general sau oricarei persoane care probeaza un interes legitim” — pe cuvântul “Publicitate” este hyperlinkul care duce la documente. Iar de acolo încep alte piedici.

“Știam de dezbaterea privitoare la moralitatea sponsorizarilor și mă enerva că (autoritățile și media n.r.) scoteau doar câte puțin și nu dădeau datele globale”, spune S, care nu este informatician, dar a lucrat în diverse domenii, de la șofat la brokeraj.Voia să știe cine a luat cei mai mulți bani, cine a dat cei mai mulți bani și pune la dispoziția publicului instrumente să poată face diverse căutări.

Pentru a găsi listele pe anm.ro, S a trebuit să downloadeze tot site-ul. Apoi a căutat metode să genereze un sistem inspirat după cel din SUA, unde cetățenii pot afla cine le sponsorizează doctorul.

Scurt ghid pentru obținerea informațiilor din fișiere problematice

S a găsit un soft opensource (gratuit) cu care a extras toate paginile site-ului care conțineau sponsorizări — a durat 2 ore. Un alt soft pentru acest proces este import.io, care nu a funcționat de data asta (dura prea mult prelucrarea). Apoi S a pus cap la cap cele 145 de pagini extrase printr-un add-in Excel.

Curățarea datelor (data cleaning) a fost cel mai dificil proces. A folosit instrumente online ca Rstudio, Trifacta Wrangler, GoogleRefine (un soft produs de Google, la licența căruia au renunțat, iar acum e întreținut de entuziaști ai open source-ului).

“Curățarea datelor nu-i rezolvată complet și nici nu va fi. Volumul de date e prea mare, iar datele au fost introduse fără rigurozitate. Sunt doua abordări posibile:

- manual - și poti să fii riguros, dar nu termini niciodată;

- automatizat - îți faci treaba dar renunti la rigoare, introduci erori peste cele care sunt deja in date: corectezi unele și generezi altele”.

De asta, S punctează că sistemul creat de el este doar un prim pas:

“Am făcut un instrument. Nu dă verdicte, nu condamnă pe nimeni. Îl folosești așa cum folosești google: îți dă tot felul de informații la o căutare și e treaba fiecăruia să caute mai departe ce e credibil și ce nu.

Orice ziarist local poate să intre acolo, să caute șeful de secție dintr-un spitalul judetean, și dacă găsește ceva interesant, să-si construiască o investigație cu diverse alte surse mult mai riguroase.

Vizualizarea făcută de mine te ajută să găsești acul în carul cu fân”

În România s-a format o coaliție pentru date deschise, prin care diverse organizații militează sau pun la dispoziție instrumente care fac accesibile datele publice. Multe instituții românești încă nu respectă legea și nu oferă informații publice sau o fac sub forme care îngreunează accesul, spune Elena Calistru, de la Funky Citizens, unul dintre ONG-urile implicate în coaliție. “Explicațiile sunt multiple: obișnuința unei culturi a opacității, teama că s-ar putea să le fie modificate documentele (aceasta este printre cele mai absurde, am primit replici de tipul <<nu vreau să îmi modificați excelul>>), dar și lipsa echipamentelor sau chiar neobișnuința de a lucra cu date deschise”, detaliază aceasta. Elena crede că lucrurile s-au îmbunătăți în ultimii ani, așa că că e optimistă. Chiar și datele ANMDM au apăut anul acesta într-o formulă ușor îmbunătățită, față de 2015.

Ce s-a întâmplat cu datele pe 2014?

S a analizat și datele publicat anul trecut: ANMDM a primit listele cu sponsorizări de la companiile farmaceutice ca Excel (reiese din proprietățile documentelor), format care permite calcule și transparența datelor. Dar le-a pus pe site în versiuni PDF: “locul unde informațiile sunt trimise să moară”, glumește S și îmi dă linkul ăsta cu detalii. Mai mult, documentele nu puteau fi salvate, deși alte PDF-uri de pe site-ul agenției se descărcau fără probleme.

Jurnaliștii Digi24 au stat săptămâni întregi să prelucreze de mână informațiile. La final au reușit să afle care au fost doctorii care au luat cei mai mulți bani și de ce ordin au fost sumele totale încasate. Laurențiu Mihu, unul dintre jurnaliștii implicați în campania Digi24, își amintește că, la o singură firmă, a trebuit să treacă prin 7.144 de poziții de tabel și să introducă manual în calculator sumele pentru a calcula totalul. A durat mult.

Scrapingul și curățarea datelor scurtează timpul și permite oricui să scotocească în volumul imens de informații, odată ce ele sunt curățate și puse online: cum sunt exemplele oamenilor care vor să afle ce companii farmaceutice le sponsorizează doctorul sau jurnaliști care fac investigații în domeniul medical. Cu mențiunea că pot apărea erori, într-un volum atât de mare de date, transmise de autorități în formate greoaie și puțin riguroase. E doar punctul de plecare. Și e tehnologia care schimbă jurnalismul și modul în care oamenii pot accesa informații.

Puteți urmări Opinii și Analize care explică actualitatea (like) pe Facebook

Cele mai recente reportaje despre Afacerea Medicamentul găsiți aici: Cum promovează doctorii medicamentele - în spital, la mall și în caravană națională, Topul sumelor virate de firmele farma — Medicii, detronaţi de un farmacist, Firmele farma au dat medicilor și spitalelor cu 24 de milioane de lei mai mult decât în 2014