Mayor base de datos genética: usos, riesgos y futuro

Última actualización: mayo 26, 2026
  • Las grandes bases de datos genéticas actuales están dominadas por genomas de ascendencia europea, lo que introduce un sesgo importante en la investigación y la medicina de precisión.
  • Estos repositorios permiten reconstruir la historia humana, desarrollar tratamientos personalizados y acelerar el estudio de enfermedades complejas.
  • Países como Japón están creando grandes bases de datos privadas para adaptar la atención sanitaria a su población envejecida y reducir el dominio de datos europeos.
  • El uso comercial, la privacidad y el acceso policial a los datos de ADN plantean retos éticos y legales que deben equilibrarse con su enorme valor científico y sanitario.

base de datos genética

La carrera por construir la mayor base de datos genética del mundo está transformando tanto la medicina como la forma en la que entendemos la historia de las poblaciones humanas. Millones de personas se hacen ya pruebas de ADN cada año, desde sencillos test de saliva hasta complejos estudios clínicos, y todos esos datos acaban, antes o después, en gigantescos repositorios genómicos públicos o privados.

Al mismo tiempo, esta explosión de información genética viene acompañada de dudas éticas y legales: quién controla esos datos, para qué se usan realmente, qué beneficios obtiene la persona que los aporta y hasta qué punto se protege su privacidad. Además, hay un problema científico de fondo que condiciona el futuro de la medicina personalizada: la inmensa mayoría de las secuencias genómicas analizadas pertenecen a personas de ascendencia europea, lo que genera un sesgo enorme en las bases de datos.

El enorme sesgo europeo en la mayor base de datos genética

biología computacional
Related article:
Biología computacional: qué es, aplicaciones y futuro

Uno de los puntos más preocupantes de las grandes bases de datos genómicas actuales es que no representan por igual a todas las poblaciones humanas. La mayor parte de las muestras biológicas que se han recogido en grandes proyectos internacionales proceden de personas de origen europeo, y se calcula que alrededor de un 70-80 % de los datos genómicos disponibles en repositorios públicos corresponden a individuos con esta ascendencia.

Este desequilibrio implica que la información genética de muchos otros grupos poblacionales —como pueblos indígenas, comunidades africanas, asiáticas o latinoamericanas— está muy poco presente en las bases de datos. Desde el punto de vista científico y sanitario, esto supone una limitación enorme, porque la frecuencia de muchas variantes genéticas es distinta entre poblaciones y, por tanto, también lo son los riesgos asociados a determinadas enfermedades.

Además, una misma mutación puede tener efectos distintos según el entorno genético en el que se encuentre. El genoma de cada persona no es una lista aislada de variantes, sino un conjunto de interacciones complejas. El contexto genético medio de una población europea no es igual que el de una población asiática, africana o americana; por eso, extrapolar conclusiones obtenidas en europeos al resto del planeta es científicamente arriesgado.

Esto repercute de forma directa en la medicina de precisión: los modelos de predicción de riesgo, las puntuaciones poligénicas y muchos algoritmos clínicos se han calibrado principalmente con datos europeos. Como resultado, tienden a funcionar peor cuando se aplican a individuos de otras procedencias, con la injusticia sanitaria que eso conlleva.

Globalmente, no resulta raro que, cuando se empiezan a secuenciar genomas de poblaciones poco estudiadas, aparezcan variantes completamente nuevas que no figuraban en las grandes bases de datos. En realidad, esto es una consecuencia lógica del sesgo de muestreo: si la mayoría de secuencias registradas pertenecen a una misma región del mundo, buena parte de la diversidad genética global seguirá oculta hasta que se amplíe el espectro de poblaciones analizadas.

Genómica y reconstrucción de la historia humana

Las bases de datos genéticas no solo son una herramienta médica; también se han convertido en un recurso clave para estudiar la historia de la humanidad. Al analizar variantes concretas del ADN y compararlas entre diferentes grupos humanos, los investigadores pueden reconstruir rutas migratorias, detectar mezclas entre poblaciones y estimar fechas aproximadas de eventos históricos.

Un buen ejemplo es el estudio de la colonización del continente americano. Durante décadas, la arqueología, la lingüística y la antropología han intentado explicar cómo y cuándo llegaron los primeros humanos a América. La genómica ha aportado una pieza fundamental: comparando genomas de poblaciones indígenas americanas con los de otras regiones del mundo se han podido reconstruir varias oleadas migratorias, posibles rutas y periodos de aislamiento.

Los investigadores se apoyan en grandes repositorios de datos para identificar patrones de variación genética que actúan como huellas del pasado. Ciertos marcadores en el ADN, cuando se observan con suficiente escala poblacional, permiten deducir cuellos de botella demográficos, expansiones rápidas, contactos entre grupos y otros fenómenos históricos que no siempre quedan reflejados en los restos materiales.

Te puede interesar:  CBD y la era de las apps: bienestar, datos y movimiento ciudadano

Cuanto más diversas sean las bases de datos genómicas, más fina y detallada puede ser esta reconstrucción histórica. Sin embargo, el mismo sesgo hacia Europa que afecta a la medicina genómica también limita la capacidad de comprender bien la historia de regiones infrarrepresentadas. De ahí la importancia de incorporar al máximo número posible de comunidades en los proyectos de secuenciación.

Japón, envejecimiento y construcción de una de las mayores bases de datos privadas

Japón es uno de los países más envejecidos del planeta. La proporción de personas de 65 años o más ha batido récord tras récord y supera ya con holgura el 29 %, según las estimaciones oficiales del Ministerio del Interior y Comunicaciones japonés. Esta presión demográfica ha convertido la salud de las personas mayores en una prioridad nacional.

En este contexto, los científicos y las empresas tecnológicas japonesas están impulsando nuevas estrategias para que la población pueda vivir no solo más años, sino más años con buena salud. Una de las líneas que más está creciendo es la evaluación de riesgos genéticos como herramienta para anticiparse a enfermedades complejas relacionadas con el envejecimiento.

Una compañía especialmente destacada en este campo es Genequest, fundada por la bióloga molecular Takahashi Shoko. Su propuesta consiste en ofrecer pruebas de ADN a partir de una simple muestra de saliva, con el objetivo de obtener un perfil de salud personalizado para cada usuario. A partir de la información genética recogida, la empresa estima el riesgo individual de padecer enfermedades como el cáncer, la diabetes o diferentes cardiopatías.

En Japón la esperanza de vida ronda los 84 años, pero la llamada “esperanza de vida saludable” apenas alcanza los 74. Es decir, muchas personas viven una década final con limitaciones importantes. Desde la perspectiva de Shoko, ha llegado el momento de pasar de un sistema sanitario homogéneo —en el que a casi todos se les trata de la misma manera— a uno mucho más refinado, donde los tratamientos se ajusten a los genes y a la constitución física de cada individuo.

El procedimiento que ofrece Genequest es relativamente sencillo: el usuario recibe un kit, deposita saliva y lo devuelve para su análisis. Otra empresa se ocupa de extraer el ADN de la muestra y de generar el perfil genético. Pasadas unas semanas, el cliente obtiene un informe en el que se analizan aspectos como el metabolismo, la predisposición a determinados problemas de salud y cómo su estilo de vida puede interactuar con sus variantes genéticas.

Este tipo de estudios ayuda a detectar conexiones que antes eran invisibles entre secuencias concretas de ADN y el riesgo de desarrollar enfermedades. En cáncer, por ejemplo, portar una variante específica no implica que la persona vaya a enfermar sí o sí, pero sí puede incrementar de forma notable la probabilidad en comparación con quienes no la tienen. El objetivo es usar esa información para reforzar o modificar hábitos y vigilar con mayor precisión a quienes tienen más riesgo.

La ambición de Shoko va más allá del servicio directo al consumidor: quiere que Genequest se convierta en la mayor empresa de análisis genético de Asia y levantar una de las mayores bases de datos privadas de ADN de Japón. De lograrlo, el país contaría con un recurso de enorme valor para diseñar estrategias de medicina personalizada adaptadas a su propia población.

Estos datos, convenientemente anonimizados y analizados de forma agregada, podrían aprovecharse también en entornos sanitarios fuera de Japón. El motivo es que, hasta ahora, las grandes bases de datos genómicas globales han estado claramente dominadas por muestras de ascendencia europea. A medida que Japón y otros países asiáticos amplíen sus repositorios, se reducirá el sesgo y será posible diseñar tratamientos que funcionen mejor para japoneses y para otras poblaciones vecinas, cuyas variantes genéticas y patrones de metabolización de fármacos pueden ser muy diferentes.

¿Qué es una base de datos de ADN y cómo funciona?

Una base de datos de ADN es, en esencia, un gran repositorio en el que se almacenan perfiles genéticos de individuos que han cedido sus datos. Esos perfiles pueden proceder de pruebas de consumo (los clásicos tests de saliva para conocer ancestros o rasgos de salud), de estudios clínicos, de investigaciones académicas o de análisis forenses, entre otros orígenes posibles.

En la mayoría de los casos, los datos llegan a la base de datos después de que la persona acepte explícitamente que su información genética se incluya en el sistema de la empresa o del laboratorio. Esta aceptación suele recogerse en los formularios de consentimiento informados y en las políticas de privacidad que el usuario firma o marca al comprar el test.

Te puede interesar:  ¿Cómo analizar tuits pasados? - seguidores.online

Las finalidades de estas bases de datos pueden ser muy variadas. Algunos repositorios son casi exclusivamente de uso médico y científico, y sirven para estudiar enfermedades, identificar variantes asociadas a patologías concretas o desarrollar tratamientos. Otros, en cambio, se centran en aplicaciones comerciales, como la genealogía genética y la construcción de árboles familiares. Y también hay bases de datos orientadas sobre todo al ámbito forense, que ayudan a identificar sospechosos o víctimas en investigaciones policiales.

Cada entidad que gestione una base de datos de ADN debe definir con claridad en sus cláusulas qué uso va a dar a la información. Un laboratorio clínico puede comprometerse a usar los datos únicamente con fines médicos o de investigación interna, mientras que una empresa privada podría reservarse el derecho a compartirlos (anonimizados) con socios comerciales o farmacéuticas, siempre que el usuario lo haya autorizado.

El lado polémico de las grandes bases de datos genéticas

Aunque las bases de datos de ADN tienen un potencial enorme para la ciencia, en los últimos años se han situado en el centro de varias polémicas éticas y comerciales. La principal fuente de tensión es el uso secundario de estos datos por parte de compañías privadas que, en muchos casos, los han convertido en un activo de negocio muy valioso.

Existen empresas de análisis genético que ofrecen incentivos a sus clientes a cambio de que “donen” su perfil genético a la base de datos. En algunos casos, la recompensa son criptomonedas; en otros, participaciones o acciones de la propia compañía. Ejemplos como EncrypGen o LunaDNA han explorado precisamente ese modelo de compensar a las personas por compartir sus datos, intentando equilibrar el potencial comercial con la percepción de justicia por parte del usuario.

Uno de los casos que más debate generó fue el de 23andMe, cuando se supo que había vendido datos genéticos de sus clientes a la farmacéutica Almirall S.A.. El objetivo declarado era desarrollar medicamentos para enfermedades como la psoriasis, un fin claramente sanitario y potencialmente beneficioso para muchos pacientes. Sin embargo, la operación puso sobre la mesa un dilema importante: la empresa de ADN estaba obteniendo un beneficio económico de unas muestras facilitadas por individuos que, además, habían pagado por el test.

Para muchos usuarios, la idea original al aceptar compartir sus datos era contribuir a investigaciones científicas de interés general, no convertirse en la base de un negocio en el que ellos no recibían retorno alguno. La comparación con una hipotética empresa de sangre resulta bastante ilustrativa: ¿aceptarías donar sangre a una compañía que luego vende esa sangre a los hospitales en lugar de distribuirla dentro de un sistema público o sin ánimo de lucro?

Este tipo de escenarios ha despertado un debate intenso sobre quién debe beneficiarse de la explotación de los datos genéticos y cómo debería repartirse ese valor. Algunas voces defienden modelos más cooperativos, en los que los participantes tengan más control e incluso un cierto retorno económico o en forma de mejoras de salud derivadas directamente de la investigación realizada con sus genomas.

Privacidad, protección de datos y usos forenses

La protección de la privacidad en las bases de datos de ADN es un reto mayúsculo, porque la información genética es extremadamente sensible: no solo identifica a la persona de forma única, sino que también permite inferir datos de salud, origen familiar e incluso rasgos físicos o comportamentales en algunos casos.

En el pasado, ha habido situaciones en las que los usuarios no sabían con claridad qué empresas accedían a sus datos ni para qué fines exactos. Además, algunos acuerdos permitían que la información se compartiera con terceros —incluidas entidades forenses o compañías privadas— sin un conocimiento detallado por parte de los titulares de los datos.

En el ámbito policial, las bases de datos de ADN se han revelado como una herramienta potentísima. La comparación de perfiles genéticos permite identificar a sospechosos a partir de restos biológicos recogidos en escenas del crimen, relacionar casos entre sí e incluso reabrir investigaciones de hace décadas que habían quedado sin resolver. En algunos países, las autoridades han intentado acceder a plataformas comerciales para cruzar datos y localizar parientes lejanos de un posible agresor, lo que plantea dilemas añadidos de consentimiento.

Te puede interesar:  Inteligencia geoespacial de Google Earth AI: así cambia la forma de entender el planeta

Con la entrada en vigor de normativas más estrictas sobre protección de datos —como el Reglamento General de Protección de Datos (RGPD) en Europa—, el nivel de exigencia legal se ha incrementado notablemente. Hoy en día, las empresas están obligadas a concretar de forma precisa y transparente los fines que darán a los datos genéticos, el tiempo de conservación, las cesiones a terceros y los mecanismos que el usuario tiene para retirar su consentimiento.

Esto significa que, en teoría, la persona que entrega su ADN dispone ahora de mucha más información y capacidad de control. Puede decidir si autoriza o no el uso de su muestra para investigación, si permite que se comparta con socios externos o si limita su utilización exclusivamente al informe que ha contratado. Además, conserva el derecho a revocar esos permisos en el futuro y a solicitar el borrado de sus datos cuando lo considere oportuno.

Ventajas científicas, médicas y sociales de las grandes bases de datos genéticas

Más allá de las controversias, las bases de datos de ADN ofrecen beneficios enormes para la ciencia, la medicina y la sociedad. Un aspecto evidente es su utilidad en determinadas pruebas genéticas de consumo, como los tests de ancestros: cuantos más perfiles haya en la base de datos de un laboratorio, más precisa será la estimación de los orígenes geográficos y más fácil será encontrar posibles parientes desconocidos.

En el terreno de la investigación biomédica, el acceso a millones de genomas acelera de forma brutal el estudio de enfermedades. Sin estas bases de datos, identificar variantes raras o establecer correlaciones sólidas entre mutaciones concretas y patologías complejas podría llevar décadas. Con grandes cohortes, los científicos pueden realizar estudios de asociación genómica amplia (GWAS) y otros análisis sofisticados en un plazo mucho más corto.

También permiten diseñar investigaciones más robustas y completas en diferentes campos de la biología y la medicina. Cruzar información genética con datos clínicos, ambientales y de estilo de vida facilita detectar patrones que de otro modo quedarían ocultos. Esto es especialmente valioso en enfermedades hereditarias, trastornos neurodegenerativos o patologías multifactoriales, donde el peso de la genética se mezcla con el entorno.

En el caso de enfermedades con un fuerte componente hereditario, disponer de una gran base de datos puede ayudar a rastrear el origen de ciertas mutaciones, identificar familias afectadas y proponer estrategias tempranas de prevención o seguimiento médico. Para enfermedades degenerativas, como algunos tipos de demencia, los grandes repositorios abren la puerta a comprender mejor los mecanismos biológicos que las desencadenan y a explorar dianas terapéuticas que antes ni siquiera se imaginaban.

Por otro lado, las bases de datos de ADN han permitido a muchas personas localizar familiares que jamás habrían encontrado por vías tradicionales. Individuos adoptados que descubren a sus progenitores biológicos, hermanos que se reencuentran después de décadas, o ramas familiares desconocidas que salen a la luz gracias a coincidencias genéticas en plataformas de genealogía.

En el ámbito forense y policial, estos repositorios han sido determinantes para cerrar multitud de casos, tanto recientes como antiguos. Cruces masivos de perfiles genéticos han ayudado a resolver crímenes que llevaban años enquistados, a identificar cuerpos de víctimas sin nombre y a exonerar a personas condenadas injustamente gracias a la evidencia del ADN.

Todo este panorama muestra hasta qué punto las bases de datos de ADN se han vuelto una pieza central en el ecosistema científico y sanitario actual. Su potencial para derribar tabúes en torno a enfermedades como el cáncer, mejorar diagnósticos y diseñar terapias personalizadas es enorme, siempre que se gestionen con rigor ético, representen de forma justa a las distintas poblaciones y se garantice que las personas conservan el control real sobre su información genética.

  • Sesgo europeo en las bases de datos genómicas que limita la medicina de precisión a escala global.
  • Uso histórico y médico de los repositorios genéticos para reconstruir migraciones y mejorar diagnósticos.
  • Expansión de grandes bases de datos privadas como la que impulsa Japón para adaptar la sanidad a su población.
  • Dilemas éticos de privacidad y negocio frente al enorme valor científico y sanitario de estos datos.

La combinación de beneficios científicos, oportunidades de salud personalizada y desafíos éticos hace que el debate sobre la mayor base de datos genética del mundo esté más vivo que nunca. A medida que nuevos países, como Japón, construyen repositorios propios y se incorporan poblaciones poco representadas, la medicina genómica podrá hacerse realmente global, pero será crucial que las personas sigan siendo las dueñas de sus datos y que la diversidad genética del planeta quede reflejada sin sesgos en esos gigantescos archivos del ADN humano.