[Nota: Aquest reportatge ha estat publicat a la revista nº6 de la Fundació Pasqual Maragall. També pots llegir-lo aquí]
La pandèmia de la COVID-19 va aturar en sec durant tres mesos les visites dels participants dels estudis de prevenció de l’Alzheimer que tenim en marxa al centre de recerca de la Fundació Pasqual Maragall, el Barcelonaβeta Brain Research Center (BBRC). No obstant això, la nostra activitat científica no va parar, ja que els investigadors disposaven de dades per analitzar i de nous sistemes per recollir-les, gràcies a l’ingent treball de digitalització en el qual estem immersos.
Per fer-te una idea del volum de dades que tractem: actualment, tenim prop d’una quinzena d’estudis de recerca en marxa que generen, per exemple, més de 10.000 variables. És a dir, informació sobre el sexe i l’edat del participant, el seu pes, si fuma, l’exercici que fa, les hores de son, els aliments que menja, etc. A aquesta xifra se li sumen les més de 180.000 variants genètiques relacionades amb malalties neurodegeneratives que obtenim als estudis d’associació del genoma complet; els prop de 18.000 registres de neuroimatge que generem amb informació sobre l’estructura i la funcionalitat del cervell, i tota la informació provinent de les variables obtingudes després d’analitzar els biomarcadors de les més de 50.000 mostres biològiques que tenim emmagatzemades. En definitiva, una allau de dades que creix de forma exponencial cada any i pot ser clau per contribuir a trobar la forma de prevenir l’Alzheimer.
Al BBRC lideren el projecte de digitalització de les dades els membres del Data Center, una unitat multidisciplinària puntera, formada per experts en l’anàlisi i la gestió de dades, neuroimatge i programació. "La nostra missió és posar les dades al servei dels investigadors en el mínim temps possible, garantint els màxims estàndards de qualitat i traçabilitat", assegura David Fusté, responsable del Data Center i director de Sistemes i Organització de la Fundació Pasqual Maragall.
El sistema de recollida i gestió de dades que estan usant i desenvolupant segueix unes regles molt estrictes, similars a les que s’utilitzen als assaigs clínics. Ho explica la Dra. Karine Fauria, gerent científica del BBRC: "La nostra cohort conté dades d’una qualitat excepcional que garanteixen la integritat de la recerca científica. Això fa que la nostra investigació pugui ser fàcilment replicable i compartida arreu del món".
En aquest sentit, les dades recollides als nostres estudis segueixen les quatre regles d’or dels principis FAIR, establerts el 2016 per un consorci internacional de científics: que es puguin trobar fàcilment de forma automàtica (Findable); que siguin accessibles després de passar per un procés d’autentificació i autorització (Accessible); que puguin conviure amb altres sistemes i aplicacions d’anàlisi, emmagatzematge i processament de les dades (Interoperable), i que puguin ser reutilitzables per a altres estudis (Reusable).
En l’última dècada, la comunitat científica ha accelerat la posada en marxa de centenars d’iniciatives relacionades amb l’emmagatzematge i gestió de dades massives provinents de la recerca. El director del BBRC i la Fundació Pasqual Maragall, el Dr. Arcadi Navarro, coneix de primera mà els beneficis d’aquest tipus de projectes, ja que dirigeix des de Barcelona una d’aquestes iniciatives: l’European Genome-Phenome Archive (EGA), una enorme base de dades europea que conté resultats d’estudis científics amb informació genètica i fenotípica de milers de persones. "La compartició de dades és crucial per accelerar la recerca a tot el món. Per fer més ciència, i per fer-la millor, cal que prenguem consciència que la recerca no és un projecte d’un centre, una ciutat o un país: és un projecte global de tota la humanitat. Compartir és bàsic per avançar", destaca el Dr. Navarro.
Cada camp de recerca té els seus repositoris de referència. En el cas de la malaltia d’Alzheimer, un dels més destacats és la Global Alzheimer’s Association Interactive Network (GAAIN), impulsada per l’associació americana de l’Alzheimer. Es tracta d’una plataforma de recerca en línia, dissenyada per posar en contacte científics, i compartir dades i eines d’anàlisi sofisticades. En aquesta plataforma, hi ha disponibles les variables de prop de mig milió de persones d’arreu del món.
Entre les dades publicades a la GAAIN, hi ha centenars de variables dels participants del nostre estudi Alfa+, creat al BBRC amb l’impuls de la Fundació “la Caixa”, i de la plataforma de neuroimatge internacional TRIBEKA, que colidera el director del Programa de Prevenció de l’Alzheimer del BBRC, el Dr. José Luis Molinuevo, juntament amb investigadors de la Universitat d’Edimburg. Aquestes dades sempre són proporcionades garantint l’anonimat dels participants, i poden ser utilitzades pels científics de tot el món que ho sol·licitin per dur a terme projectes de recerca.
La quantitat de dades que generem, processem i compartim al BBRC creix dia a dia, gràcies al suport continuat dels participants dels nostres projectes de recerca, i a la feina dels investigadors i membres del Data Center. El procés de digitalització en el qual estem immersos permet accelerar l’avenç de la recerca de la malaltia d’Alzheimer de forma sostenible i conjunta, i és també possible gràcies al suport sostingut de socis i sòcies, mecenes i donants que mantenen aquesta indispensable i alhora costosa infraestructura al servei de la ciència.