COMPLEXSA Sociedad Científica · Pensamiento sistémico en salud
Sitio principal
Datos & repositorios España · Latinoamérica Abril 2026
Publicación de apoyo a la investigación abierta — misma línea visual que complexsa.org (Montserrat · Open Sans · navy / cyan).

Repositorios y datos de salud abiertos — España y Latinoamérica

Recursos públicos y regionales para investigación, política sanitaria e innovación basada en evidencia. Documento metodológico COMPLEXSA (abril 2026).

Barra superior oscura: saltos rápidos (ranking, tabla, cohortes…). Mapa numerado a la derecha en pantallas anchas; en el móvil, Mapa del documento debajo. El buscador filtra el índice y las secciones. Tecla / para buscar.

Mapa del documento — saltar a una sección

    Ranking: infraestructuras y descubridores (gratuitos o capa gratuita relevante)

    Criterio COMPLEXSA (ordinal, no bibliométrico): utilidad para localizar literatura, datos o metadatos reutilizables sin coste de acceso principal, cobertura internacional, estabilidad institucional y documentación en abierto. No es un “impact factor”: sirve para decidir por dónde empezar antes de profundizar en la tabla por país o en cohortes. Mapa geolocalizado y globo 3D con los mismos “tops” a escala mundial y banderas por país.

    # Plataforma Tipo Por qué está arriba Enlace
    1 Europe PMC / PubMed Central Literatura OA + preprints Texto completo y metadatos masivos; base universal antes de LILACS/SciELO regional. europepmc.org
    2 ClinicalTrials.gov Registro de ensayos Gratis, API y descargas; referencia para diseño de estudios y cohortes vinculadas a trials. clinicaltrials.gov
    3 WHO · Global Health Observatory / IRIS Indicadores + publicaciones OMS Capa gratuita de comparabilidad internacional; útil para contexto de política sanitaria. who.int/data/gho
    4 Zenodo (CERN) Repositorio de datos y preprints DOI gratuito, comunidad científica; donde muchos grupos depositan datasets de artículo. zenodo.org
    5 re3data Directorio de repositorios de datos Descubrimiento disciplinar; filtra por país, política de acceso y licencia. re3data.org
    6 OpenDOAR Directorio de repositorios institucionales OA Encuentra el OAI-PMH / portal de la universidad antes que el PDF suelto. v2.sherpa.ac.uk/opendoar
    7 OpenAIRE Explore Proyectos, publicaciones, datos Cruce financiación EU → outputs; enlaza grupos e instituciones europeas. explore.openaire.eu
    8 CORDIS Proyectos europeos (Horizonte, etc.) Identifica consorcios, coordinadores y resultados esperados de I+D en salud. cordis.europa.eu
    9 Dryad Datos asociados a publicaciones Curación y citación; muy usado en ciencias de la vida. datadryad.org
    10 OSF (Open Science Framework) Proyectos, preprints, materiales Grupos documentan diseño antes del paper; útil para auditoría metodológica. osf.io
    11 Figshare Datos y figuras con DOI Capa gratuita con límites; mucha producción biomédica gris depositada aquí. figshare.com
    12 CORE Agregador de OA Búsqueda transversal sobre repositorios institucionales (incl. muchos no indexados en PubMed). core.ac.uk
    13 Dataset Search (Google) Meta-buscador de datasets Descubrimiento amplio; verificar siempre la fuente y licencia en el repositorio de origen. datasetsearch.research.google.com
    14 HAL (CCSD) · Francia Repositorio nacional multirrama Acceso abierto masivo a informes, tesis y preprints de grupos franceses. hal.science
    15 ZB MED · Alemania Información biomédica especializada Portal y repositorios en salud (incl. ámbito de datos y publicaciones alemanas). zbmed.de

    Grupos e instituciones: identificadores y redes (gratis)

    Para enlazar cohortes, biobancos y proyectos sin confundir siglas homónimas.

    Recurso Para qué sirve Enlace
    ROR (Research Organization Registry) ID persistente de instituciones; integración en metadatos de datos y publicaciones. ror.org
    GRID (histórico, migrado a ROR) Muchos ficheros antiguos citan GRID; comprobar equivalencia en ROR. grid.ac
    ORCID Autores → afiliaciones; seguimiento de producción de un grupo vía perfiles. orcid.org
    OpenAlex Grafo abierto de obras, instituciones y conceptos; API gratuita para bibliometría ligera. openalex.org

    Estados Unidos: portales como CDC data o WONDER añaden capas sanitarias públicas (con matices de granularidad). Reino Unido: UK Data Service mezcla registros gratuitos y bajo contrato según conjunto.

    Tops mundiales (biomedicina, medicina y ciencia abierta): mapa y globo 3D

    Selección COMPLEXSA de infraestructuras de primer orden a escala planetaria (literatura, datos, registros, directorios y agregadores). Las posiciones son aproximadas (sede, consorcio o ancla). El globo usa textura de la Tierra (proyecto three.js, WebGL); arrastra para rotar y pasa el ratón sobre los puntos para ver repositorio y tipo.

    Mapa 2D + Globo 3D

    Izquierda: OpenStreetMap (ODbL) vía Leaflet — zoom por país, tooltips en puntos, clic para enlace. Derecha: globo con textura satélite/atmosférica (repositorio de texturas three.js), campo de estrellas y marcadores; pasa el ratón sobre un punto para nombre y tipo; clic abre la web del repositorio.

    Leaflet · OSM (open data)
    Three.js · WebGL · textura Tierra + nodos

    Impresión: mapa y globo se ocultan; permanece la tabla con banderas. Sin WebGL el panel del globo puede mostrarse vacío.

    Tabla de cumbres con banderas

    Orden aproximadamente geográfico (continentes); no implica preferencia numérica respecto al ranking ordinal superior.

    Bandera País / región Infraestructura Tipo Enlace
    🇦🇺 Australia ARDC (Australian Research Data Commons) Infraestructura nacional de datos ardc.edu.au
    🇧🇪 Bélgica (UE) CORDIS Proyectos europeos de I+D cordis.europa.eu
    🇧🇷 Brasil (BIREME / OPS) LILACS · BVS Literatura y evidencia regional LILACS
    🇨🇭 Suiza WHO · Global Health Observatory Indicadores sanitarios globales who.int/data/gho
    🇨🇭 Suiza (CERN) Zenodo Repositorio general (datos, software, informes) zenodo.org
    🇨🇳 China CNKI / portales nacionales abiertos (capa pública variable) Literatura y metadatos (ámbito regional) cnki.net
    🇩🇪 Alemania re3data (registry) Directorio de repositorios de datos re3data.org
    🇩🇪 Alemania ZB MED Información biomédica especializada zbmed.de
    🇫🇷 Francia HAL (CCSD) Repositorio nacional multidisciplinar hal.science
    🇯🇵 Japón J-STAGE (JST) Revistas y actas científicas jstage.jst.go.jp
    🇰🇷 Corea del Sur KISTI · ScienceON / KoreaMed Portal nacional de literatura biomédica scienceon.kisti.re.kr
    🇳🇱 Países Bajos (UE) OpenAIRE Explore Publicaciones, datos, proyectos EU explore.openaire.eu
    🇬🇧 Reino Unido / EMBL-EBI Europe PMC Literatura de acceso abierto + preprints europepmc.org
    🇬🇧 Reino Unido BioStudies (EBI) Estudios -omics y metadatos ebi.ac.uk/biostudies
    🇬🇧 Reino Unido CORE Agregador de literatura OA core.ac.uk
    🇬🇧 Reino Unido OpenDOAR Directorio de repositorios institucionales OpenDOAR
    🇬🇧 Reino Unido Figshare Datos y figuras con DOI figshare.com
    🇺🇸 Estados Unidos (NIH) PubMed Central Literatura biomédica OA PMC
    🇺🇸 Estados Unidos (NIH) Gene Expression Omnibus (GEO) Datos transcriptómicos NCBI GEO
    🇺🇸 Estados Unidos (NIH) ClinicalTrials.gov Registro de ensayos clínicos clinicaltrials.gov
    🇺🇸 Estados Unidos Dryad Datos asociados a publicaciones datadryad.org
    🇺🇸 Estados Unidos OSF (COS) Proyectos, materiales, preprints osf.io
    🇺🇸 Estados Unidos Dataset Search (Google) Meta-buscador de conjuntos de datos datasetsearch…

    Nota: América Latina y España siguen detalladas en la tabla por país y en el ranking ordinal; aquí el foco es la capa global de referencia.

    Resumen ejecutivo

    La capa universitaria e I+D (RECOLECTA, RODERIC, DIGITAL.CSIC, Dialnet, repositorios LA Referencia) aporta tesis, preprints y datos de proyecto que los portales clínicos no indexan; conviene cruzarla con bases bibliográficas (IBECS, LILACS) sin asumir cobertura exhaustiva por disciplina.

    La mayoría de lo que se etiqueta como “repositorio de salud” en la región mezcla tres cosas distintas: literatura científica (PDFs y metadatos), datos agregados o microdatos públicos (estadística y epidemiología), y registros regulatorios (ensayos clínicos). Conviene no confundirlas: lo que sirve para una revisión sistemática no sirve para entrenar un modelo con registros clínicos individuales, y al revés.

    Para cohortes de pacientes, datos -ómicos o fenotípicos con acceso bajo comité (no “carpetas abiertas”), hay una sección aparte con repositorios y ecosistemas orientados a datos curados (EGA, dbGaP, BBMRI, OMOP/OHDSI, etc.); los portales de estadística y vigilancia de este documento raramente sustituyen ese tipo de diseño.

    Ventaja real regional: visibilidad de producción iberoamericana, cobertura de revistas locales y documentos grises que PubMed ignora o indexa tarde. Límite real: calidad heterogénea, metadatos incompletos, duplicación entre bases (LILACS vs SciELO vs institucional) y escasez de datasets clínicos “listos para ML” por ley y por gobernanza.

    Cada reutilización de datos debe ajustarse a la licencia del conjunto y a la normativa de protección de datos aplicable.

    Profundidad: mapa en cuatro capas (no todo es “repositorio”)

    Ordenar el caos ayuda a no perder meses. En la práctica conviene separar: (1) Descubrimiento bibliográfico — LILACS, SciELO, BVS, institucionales; (2) Depósito y preservación — RECOLECTA (agregador nacional), repositorios institucionales (p. ej. RODERIC, DIGITAL.CSIC), REPISalud, CONICET Digital, LA Referencia, Zenodo; (3) Estadística y vigilancia — INE, DATASUS/Tabnet, DEIS, RIISP, OPS Open Data; (4) Regulación y transparencia — REEC, CTIS/EU, registros nacionales de ensayos. Quien diseña un producto mezclando capas sin contrato de datos ni hipótesis acaba con un “dashboard” que nadie puede auditar.

    Brasil no es “un país más” en esta lista: DATASUS concentra volumen y sistemas (SIM, SINASC, SINAN, CNES) con décadas de historia; la complejidad operativa (Tabwin, calidad subregional) es el precio de esa riqueza. España comparte encaje europeo: microdatos INE muy utilizables para encuestas, pero ENDS/EEDS son gobernanza federada, no carpetas ZIP públicas de pacientes.

    Criterio crítico (perspectiva de comité técnico)

    “Open” ≠ replicable. Muchos conjuntos vienen sin pipeline de limpieza documentado; el artículo que afirma hallazgos sin código y sin versión del dataset es opinión con CSV adjunto.

    Duplicación interbases. El mismo artículo puede aparecer en SciELO, revista propia y repositorio institucional; si no deduplicas por DOI/título/año, inflas revisiones y revisiones sistemáticas.

    Agregadores muertos. REDIB dejó de actualizar servicios de facto desde 2022; confiar en rankings o enlaces heredados de REDIB es pérdida de tiempo — ir a la fuente (revista o repositorio institucional).

    OPS y BM/OCDE suavizan brechas entre países con imputaciones y armonización; sirven para comparar tendencias, no para adjudicar culpas sin leer el fichero técnico de cada indicador.

    CTIS vs REEC vs ClinicalTrials.gov: ensayo “global” puede estar en varios registros con ligeras discrepancias en fechas y estados; el metaanálisis serio cruza fuentes y el paper.

    Zenodo y similares: excelente para cumplir mandatos de datos y DOI; también albergan basura con DOI. El filtro es el afiliación, el README y si el dataset tiene diccionario de variables.

    Cohortes y datos curados: dónde buscar más allá de portales “abiertos”

    Si lo que necesitas son cohortes de pacientes (seguimiento longitudinal, fenotipos vinculados a -ómicos, imágenes clínicas anonimizadas o tablas analíticas listas para estudio), el catálogo anterior (estadística oficial, vigilancia, literatura) suele no bastar: esos sistemas priorizan agregados, transparencia regulatoria o publicaciones, no un diseño de cohorte con criterios de inclusión explícitos y gobernanza de acceso.

    Los repositorios “de cohorte” reales combinan tres cosas: (1) datos con identidad mínima o seudonimizados bajo política; (2) metadatos y diccionarios que permiten saber qué significa cada variable; (3) un mecanismo de acceso (comité de datos, DAC, credencial institucional, o entorno seguro federado). Sin eso, “dataset de pacientes” en un ZIP público es señal de alerta legal y metodológica, no de oportunidad.

    Tabla orientativa: ecosistemas útiles para cohortes y datos de investigación curados

    Enlaces de referencia; el acceso efectivo depende de cada política (proyecto aprobado, país, institución). Cruza siempre con la normativa de protección de datos aplicable (RGPD, HIPAA según caso, leyes locales).

    Recurso / ecosistema Qué aporta para cohortes Nota de acceso
    EGA (European Genome-Phenome Archive) Almacenamiento federado de datos sensibles (-ómicos y fenotipos) con metadatos EGA; base para estudios que replican o meta-analizan cohortes europeas. ega-archive.org — acceso vía comités/DAC según estudio.
    dbGaP (NIH) Estudios con datos genómicos y fenotípicos depositados en el ecosistema NIH; referencia mundial para cohortes con componente genético. ncbi.nlm.nih.gov/gap — acceso controlado por proyecto.
    GDC (Genomic Data Commons) Portal unificado (p. ej. TCGA, TARGET) para datos oncológicos: útil cuando la cohorte está ligada a proyectos con datos ya armonizados. portal.gdc.cancer.gov — controlado según conjunto.
    UK Biobank Cohorte muy grande (fenotipos, -ómicos, imágenes en subconjuntos); referencia para diseño de estudios observacionales y validación de instrumentos. ukbiobank.ac.uk — solicitud de proyecto; no es descarga libre.
    All of Us (NIH) Programa de cohorte multimodal con énfasis en diversidad poblacional; útil para hipótesis que requieren representatividad. researchallofus.org — entorno de investigación registrado.
    BBMRI-ERIC Infraestructura europea: directorio de biobancos, muestras y metadatos para localizar cohortes y material biológico enlazable a estudios. bbmri-eric.eu — contacto por biobanco/estudio.
    OHDSI / OMOP No es un único repositorio de ficheros: es un modelo común de datos y comunidad para observacional en red; permite “cohorte lógica” federada sin centralizar siempre los datos crudos. ohdsi.org — útil para definir cohortes comparables entre centros.
    PhysioNet (y conjuntos asociados) Ondas fisiológicas, ECG, MIMIC (UCI) tras formación/credencial; cohortes hospitalarias muy citadas en ML clínico. physionet.org — credenciales CITI u otros requisitos según dataset.
    España RECOLECTA (datos de proyecto) Agregador nacional: cuando grupos depositan datasets de investigación con DOI, aparecen aquí; no sustituye un registro de cohorte clínica, pero es vía de descubrimiento de conjuntos curados españoles. recollecta.fecyt.es — revisar licencia y contacto por conjunto.

    Cómo encajar esto con el resto del documento

    Literatura y repositorios institucionales (LILACS, SciELO, RECOLECTA de publicaciones) sirven para ver si alguien ya publicó una cohorte y con qué N y exclusiones. Portales de estadística y vigilancia (DATASUS, INE, RIISP…) sirven para población y tendencias, raramente para tablas individuales con seguimiento clínico fino. Para construir o alimentar cohortes, la vía seria suele ser: (1) datos secundarios curados en repositorios con DAC (EGA, dbGaP, etc.); (2) biobancos/redes (BBMRI, acuerdos locales); (3) estudios propios con consentimiento y CEIm; (4) en desarrollo y pruebas, datos sintéticos o simulados (p. ej. perfiles tipo Synthea, cohortes sintéticas bien documentadas) sin confundirlos con evidencia clínica real.

    Latinoamérica tiene cohortes importantes publicadas en artículos y, cada vez más, datos en repositorios institucionales o regionales; la fragmentación es mayor que en EE. UU./UE — conviene triangular con registros de ensayos, tesis en RECOLECTA/LA Referencia y contacto directo con grupos (muchas cohortes no están “en un solo clic”).

    Selección curada: para qué sirve cada uno

    Saltos dentro de la tabla España · adm. · UE · CTIS · España · univ. / agregadores · Regional · bases · Latam · BVS / México · Regional · repos. fed. · Latam · Cono Sur… · Global / UE FEDERA

    Recurso Qué es / para qué Acceso
    España — Administración, estadística, BVS, SciELO, REEC, INE, REPISalud, ENDS #
    España
    datos.gob.es — Salud y bienestar
    Catálogo nacional de conjuntos de datos abiertos de administraciones (no solo Sanidad). Útil para series, localización de recursos, reutilización según licencia de cada dataset. datos.gob.es/salud-bienestar
    España
    Banco de datos — Ministerio de Sanidad
    Estadísticas oficiales (Barómetro Sanitario, Encuesta de Salud de España, etc.). Investigación social y epidemiológica descriptiva; no es un almacén de historias clínicas. sanidad.gob.es — bancoDatos
    España
    Catálogo de datos abiertos MSCBS
    Datasets reutilizables del departamento (centros de atención primaria del SNS, etc.). Pensado para transparencia y análisis; revisar formato y actualización por fichero. sede.mscbs.gob.es — datos abiertos
    España
    BVS España / BNCS (ISCIII)
    Biblioteca virtual y puerta de acceso a bases, catálogos y recursos de ciencias de la salud en España, enlazada con la red BVS regional. bvsalud.isciii.es · bvsalud.org
    España
    SciELO España
    Revistas españolas de salud en modelo SciELO (texto completo abierto, metadatos estructurados). Muy útil para difusión y evaluación bibliométrica nacional; cobertura depende de las revistas admitidas. scielo.isciii.es · búsqueda SciELO
    España
    REEC (AEMPS)
    Registro público de estudios clínicos con medicamentos y estudios observacionales relevantes. Transparencia regulatoria y seguimiento de ensayos; no es base de datos de resultados agregados para metaanálisis masivos sin curación. reec.aemps.es
    España
    Revista Española de Salud Pública (OJS)
    Revista oficial en acceso abierto sobre salud pública y gestión; útil para políticas y ciencia aplicada en contexto español. ojs.sanidad.gob.es/resp
    España
    INE — Salud y microdatos
    Encuestas de salud, morbilidad hospitalaria, defunciones por causa, etc. Microdatos anonimizados (R, SAS, Stata, CSV según serie); obligatorio citar al INE. Capa estadística de referencia en España; no son registros clínicos ni biobancos. INEbase — salud · microdatos · ESdE en datos.gob.es
    España
    REPISalud (ISCIII)
    Repositorio institucional federado (ISCIII, IIS, fundaciones) para publicaciones y producción científica en salud; calidad de metadatos relativamente alta. Depósito académico, no “dataset nacional de pacientes”. repisalud.isciii.es
    España
    ENDS — Espacio Nacional de Datos de Salud
    Marco federado (comunidades autónomas) para uso secundario regulado de datos sanitarios (investigación, planificación). Posiciona a España ante el EEDS europeo; no es un portal de descarga masiva anónima tipo datos abiertos clásicos. ends.gob.es
    Unión Europea — Registro de ensayos (CTIS / EMA) #
    UE
    CTIS — Registro público UE (EMA)
    Consulta de ensayos clínicos con medicamentos bajo el Reglamento (UE) 536/2014 (sistema CTIS). Imprescindible si el estudio tiene alcance europeo actual; ensayos anteriores pueden seguir en EU CTR/EudraCT. euclinicaltrials.eu · clinicaltrialsregister.eu
    España — Ciencia abierta: RECOLECTA, CSIC, IBECS, RODERIC, PCUV, Dialnet, REBIUN #
    España
    RECOLECTA (FECYT / REBIUN)
    Agregador nacional de repositorios institucionales de acceso abierto (universidades y centros). Punto único para localizar tesis, artículos y conjuntos depositados en nodos como RODERIC, e-Archivo, DOCUTRACE, etc.; filtrar por materia y repositorio de origen. No sustituye a bases Medline: es descubrimiento institucional. recolecta.fecyt.es · buscador de proyectos
    España
    DIGITAL.CSIC
    Repositorio institucional del CSIC: artículos, tesis doctorales, datasets y patrimonio digital de institutos (biología, biomedicina, química, etc.). Complementa repositorios universitarios; políticas de depósito por centro. digital.csic.es
    España
    IBECS (BNCS / ISCIII)
    Índice bibliográfico en ciencias de la salud con enfoque en producción indexada en España; enlaces a texto completo cuando existe. Complementa Medline/Embase para visibilidad nacional; no es repositorio de ficheros masivos. ibecs.isciii.es · BNCS
    España
    RODERIC — Universitat de València
    Repositorio institucional UV (tesis, preprints, capítulos, datos según políticas). Pieza central para la producción académica valenciana en biomedicina y otras áreas; multidisciplinar — filtrar por materia y tipo de documento. roderic.uv.es
    España
    PCUV · vivero · I2SysBio (València)
    Parc Científic UV: incubadora y vivero de empresas, institutos y transferencia. El I2SysBio (UV–CSIC) integra biología de sistemas y bioinformática; el máster oficial en Bioinformática de la UV articula formación. No es archivo documental: es ecosistema (contratos, spin-offs, redes) que condiciona qué termina en abierto. pcuv.es · i2sysbio.es · Máster Bioinformática (UV)
    España
    Dialnet
    Portal de la Fundación Dialnet (Universidad de La Rioja): literatura científica hispánica, tesis y documentos grises con fuerte presencia iberoamericana. Útil como capa cruzada; criterios de inclusión y acceso al texto completo varían por documento. dialnet.unirioja.es
    España
    REBIUN (CRUE)
    Red de Bibliotecas Universitarias Españolas: marco de políticas, interoperabilidad y catálogo colectivo; enlaza con el ecosistema RECOLECTA. Referencia institucional más que “un solo buscador biomédico”. rebiun.org
    Regional — BVS/BIREME, LILACS, SciELO (bases bibliográficas) #
    Regional
    BVS / BIREME / OPS
    Red regional de bibliotecas virtuales en salud; eje para LILACS, recursos educativos y portales nacionales. Punto de partida casi obligatorio para búsqueda en español/portugués. bvsalud.org · bireme.org
    Regional
    LILACS
    Base cooperativa de literatura latinoamericana y del Caribe en ciencias de la salud (artículos, tesis, informes). Referencia regional; solapamiento con otras bases exige estrategia de deduplicación. lilacs.bvsalud.org
    Regional
    SciELO (red global)
    Publicación electrónica cooperativa; módulos por país. Alta visibilidad en acceso abierto; criterios de calidad varían por colección. scielo.org
    Latinoamérica — BVS nacionales, México (RIISP, ENI, UNAM, datos abiertos, INEGI), Colombia (RID), OPS #
    Latam
    BVS Brasil / BVS MS
    Portales nacionales de salud en Brasil (volumen bibliográfico enorme, legislación y recursos técnicos). Imprescindibles si el foco es Brasil o comparación Lusofónica. brasil.bvs.br · bvsms.saude.gov.br
    Latam
    BVS Argentina (MSAL)
    Portal argentino de la BVS con bases y directorios alineados al modelo regional. bvs.msal.gov.ar
    Latam
    RIISP (INSP, México)
    Repositorio integrado de microdatos e información en salud pública (nacimientos, egresos, etc., según disponibilidad). Pensado para investigación con manejo estadístico; acceso puede requerir registro o filtros institucionales según conjunto. riisp.insp.mx
    Latam
    ENI Salud (CONAHCYT)
    Ecosistema informático de salud: herramientas y enlaces a grandes bases; orientado a análisis y visualización más que a un único “dump” descargable. repositorio-salud.conahcyt.mx · conacyt (hist.)
    Latam
    UNAM — RI y repositorio de salud
    Repositorio institucional de la UNAM (tesis, libros, producción académica amplia) y repositorio temático de ciencias de la salud. Referencia obligada para producción mexicana que no pasa por PubMed; metadatos y tipos de documento desiguales. repositorio.unam.mx · repositoriosalud.unam.mx
    Latam
    Datos abiertos — Secretaría de Salud (México)
    Conjuntos epidemiológicos y anuarios (morbilidad, COVID-19, etc.). Útiles para series de tiempo y mapas; revisar granularidad y definiciones. gob.mx/salud — datos abiertos
    Latam
    INEGI — Salud (México)
    Estadísticas de salud en establecimientos y otras series oficiales; integración con censos y encuestas. inegi.org.mx — salud
    Latam
    RID — Ministerio de Salud (Colombia)
    Repositorio institucional de documentos técnicos, normativa e informes del sector. No sustituye a datos.gov.co para datasets tabulares abiertos. minsalud.gov.co — RID
    Latam
    Revista Panamericana de Salud Pública (OPS)
    Revista en acceso abierto con enfoque en políticas y sistemas de salud en las Américas. journal.paho.org
    Regional — Repositorios federados (U. Chile), LA Referencia, Redalyc, OPS datos #
    Regional
    Red de Repositorios Latinoamericanos (U. de Chile)
    Buscador transversal sobre muchos repositorios institucionales de la región. Útil para tesis e informes grises; resultados desiguales según institución. repositorioslatinoamericanos.uchile.cl
    Regional
    LA Referencia
    Red federada de repositorios institucionales (metadatos cosechados de países miembros). Buscador transversal de producción científica en abierto; calidad depende del repositorio de origen. lareferencia.info · buscador
    Regional
    Redalyc
    Red de revistas y otros contenidos de acceso abierto de América Latina y el Caribe; visibilidad regional complementaria a SciELO y repositorios institucionales. Calidad editorial heterogénea por colección. redalyc.org
    Regional
    OPS — Open Data / PLISA
    Indicadores básicos (desde mediados de los 90), tableros temáticos (ENT, envejecimiento, ODS-3, emergencias). Fuente regional harmonizada; cuidado con comparar países sin leer definiciones y fuentes nacionales subyacentes. opendata.paho.org · observatorio OPS
    Latinoamérica — Cono Sur y Andes (CONICET, DATASUS, Chile, Perú, Uruguay, Ecuador, CCSS, Bolivia, Paraguay, Colombia) #
    Latam
    CONICET Digital + datos de investigación
    Producción del sistema CONICET (artículos, tesis) y repositorio específico de datasets de investigación con políticas de depósito. Punto fuerte para Argentina; cobertura sesgada a carrera CONICET. ri.conicet.gov.ar · datos de investigación
    Latam
    DATASUS + datos abiertos SUS (Brasil)
    Departamento de Informática del SUS: Tabnet/Tabwin, microdatos (SIM, SINASC, SINAN, CNES, etc.). Probablemente la fuente pública más voluminosa de la región; curva de aprendizaje y problemas de calidad/completitud por estado municipal. datasus.saude.gov.br · dados abiertos SUS · gov.br/saude
    Latam
    RNDS (Brasil)
    Red nacional de interoperabilidad en salud (HL7 FHIR). Infraestructura para intercambio seguro entre sistemas; relevante para integración técnica y APIs credenciadas, no para descarga pública masiva de historias. gov.br — RNDS · guía integración
    Latam
    DEIS + datos abiertos — Chile
    DEIS (MINSAL): estadísticas oficiales, tableros y series (mortalidad, vacunas, nutrición). datos.gob.cl agrega conjuntos del Ministerio de Salud en formatos abiertos. Buena transparencia relativa en la región. deis.minsal.cl · datos.gob.cl — MINSAL
    Latam
    ISP Chile — repositorio publicaciones
    Estudios ISP en vigilancia, dispositivos, ambiente; complementa evidencia nacional fuera de la literatura mainstream. repositorio ISP
    Latam
    REUNIS + INS — Perú
    REUNIS: repositorio único de información en salud (MINSA). Repositorio INS: artículos, reportes y evaluaciones de tecnologías. DGE/CDC Perú para vigilancia. Datos abiertos nacionales en plataforma gob.pe/datosabiertos. REUNIS · repositorio INS · DGE
    Latam
    Datos abiertos — Uruguay (MSP)
    Catálogo nacional (AGESIC): egresos hospitalarios, PIAS, afiliación, indicadores. “A tu servicio” para comparar desempeño de prestadores; mezcla utilidad ciudadana con datos para investigación aplicada. catalogodatos — salud · MSP datos abiertos · AtuServicio.uy
    Latam
    Datos abiertos — Ecuador (MSP)
    Catálogo MSP y portal nacional de datos abiertos; matrices epidemiológicas y vacunas según publicación. Conviene comprobar periodicidad y cobertura del sistema público. salud.gob.ec/datos-abiertos · datosabiertos.gob.ec
    Latam
    CCSS + BINASSS — Costa Rica
    CCSS publica datos abiertos (consultas, hospitalización, nacimientos, defunciones, RR.HH.). BINASSS: repositorio de documentos e investigación en salud/seguridad social. Sistema institucional fuerte en la región. CCSS datos abiertos · repositorio BINASSS
    Latam
    datos.gob.bo + SNIS — Bolivia
    Portal de datos abiertos del Estado y sistemas SNIS-VE/SOAPS para vigilancia. Menor madurez digital que vecinos; OPS y BM siguen siendo respaldo para indicadores comparativos. datos.gob.bo · minsalud.gob.bo
    Latam
    MSPyBS — Paraguay (estadística)
    Datos epidemiológicos e informes del ministerio; INE complementa con hogares y acceso a servicios. Expectativa de microdatos públicos más limitada que Brasil o Uruguay. mspbs — datos epidemiológicos · INE Paraguay
    Latam
    datos.gov.co — Salud (Colombia)
    Portal nacional de datos abiertos: conjuntos por institución (filtrar “MinSalud”, INS, etc.). Complementa al RID documental del ministerio con tablas reutilizables si existen para el tema. datos.gov.co (filtrar por organización / etiqueta “salud”)
    Global y UE — ClinicalTrials.gov, Zenodo, FEDERA Salud #
    Global
    ClinicalTrials.gov (NIH)
    Registro internacional de referencia (ICTRP OMS). Sigue siendo capa obligatoria para ensayos multiregión aunque el ensayo tenga sitio en REEC o CTIS. clinicaltrials.gov
    Global
    Zenodo (CERN / OpenAIRE)
    Repositorio generalista con DOI: datasets, software e informes de proyectos (p. ej. salud en España vía comunidades). Útil para cumplir apertura de datos de financiación europea; calidad heterogénea según autor. zenodo.org · comunidades
    UE
    FEDERA Salud (investigación)
    Infraestructura de datos para investigación (p. ej. integración clínica e imágenes en proyectos seleccionados). No es un portal de descarga pública tipo “Kaggle de la sanidad”; el acceso es por proyectos y cumplimiento normativo. federasalud.eu

    Universidades, agregadores nacionales e investigación

    Más allá de ministerios y registros clínicos, la producción académica “de aula y laboratorio” vive en repositorios institucionales (tesis, preprints, datos de proyecto) y en agregadores nacionales que cosechan metadatos de muchas universidades. En España, RECOLECTA (FECYT, marco REBIUN/CRUE) es el buscador transversal habitual; el RODERIC de la Universitat de València es solo uno entre decenas de nodos — no confundir “buscar en RECOLECTA” con “todo el biomédico español está depositado allí”: el depósito es voluntario por centro y la calidad es heterogénea.

    El Parc Científic de la Universitat de València (PCUV) concentra incubación (vivero de empresas), institutos mixtos como el I2SysBio (UV–CSIC) y flujos hacia transferencia; encaja con el Máster Universitario en Bioinformática (UV). No es un archivo de PDFs: es ecosistema (laboratorios, contratos, spin-offs) que condiciona qué datos y software acaban en abierto y en qué repositorio.

    Para el CSIC existe un eje propio (DIGITAL.CSIC). Para literatura hispánica y documentos grises, Dialnet sigue siendo capa de cruce (con sesgos editoriales propios). En México, la UNAM opera el repositorio institucional y un repositorio del área de salud en paralelo a los portales gubernamentales ya listados en la tabla.

    Agregadores discontinuados y mitos frecuentes

    REDIB dejó de actualizar servicios de forma significativa desde junio de 2022: no uses sus rankings ni agregación como fuente viva; para iberoamérica actual, combina Latindex, RECOLECTA (España), LA Referencia, repositorios institucionales y SciELO/LILACS directamente.

    “Todo está en SciELO”: falso. Mucha producción buena nunca entrará en SciELO por política editorial o idioma; la tesis doctoral o el informe técnico puede estar solo en un Dspace institucional (RECOLECTA, LA Referencia y buscadores institucionales ayudan a descubrirla, no a garantizarla).

    “Latam es un solo sistema de salud”: falso. Segmentación público/privado, financiamiento y calidad del registro difieren tanto que un modelo entrenado en DATASUS no extrapola a Paraguay sin revalidación explícita.

    Facilidad de acceso y uso

    • Literatura (BVS, LILACS, SciELO): acceso web inmediato; descarga de PDF cuando el artículo es OA. La “facilidad” baja si necesitas exportación masiva (APIs limitadas o inconsistentes) o datos bibliométricos limpios sin procesar.
    • Datos.gob.es y catálogos ministeriales: navegación aceptable; el trabajo real está en limpiar CSV/JSON, alinear años y leer cada licencia (reutilización no siempre equivale a “haz lo que quieras”).
    • Microdatos (INE España, RIISP, INEGI, DATASUS/Tabwin): requieren estadística, software (R/Stata) y lectura del diseño muestral o del manual del sistema de información; los ficheros “limpios” son raros a la primera descarga.
    • Brasil (DATASUS): potencia máxima y fricción máxima: múltiples sistemas, documentación dispersa y curva Tabwin; malo para quien busca un único CSV bonito, bueno para quien puede invertir tiempo.
    • Registros de ensayos (REEC, CTIS, ClinicalTrials.gov): muy usables para diseño y reclutamiento; resultados completos siguen viviendo sobre todo en revistas y suplementos — el registro no sustituye la lectura crítica del paper.
    • Repositorios institucionales (REPISalud, CONICET, LA Referencia): metadatos variables; si falta el PDF en el repositorio, el enlace a la revista puede estar roto o tras paywall.
    • OPS Open Data: fácil para gráficos y comparaciones exploratorias; mala idea usarlo como única fuente sin contrastar con el instituto nacional de estadística del país.

    Ventajas y desventajas (síntesis)

    Enfoque Ventajas Desventajas / riesgos
    Red BVS + LILACS Cobertura regional fuerte; idiomas; documentos grises; coste cero. Duplicación; calidad desigual; indexación más lenta que bases comerciales; sesgo hacia lo publicado en la red.
    SciELO OA consolidado; buena visibilidad latinoamericana; interoperabilidad entre países. No todas las revistas tienen el mismo rigor; métricas de impacto discutidas frente a journals nórdicos o Anglo tradicionales.
    Datos públicos (ES / MX / otros) Transparencia; series largas para modelos epidemiológicos y dashboards. Granularidad limitada; rezagos; cambios de definición; poco apto para IA clínica individual.
    Registros de ensayos (REEC) Obligatoriedad legal reciente mejora trazabilidad; datos de reclutamiento y diseño. No sustituye resultados publicados ni datos individuales; sesgo de publicación sigue existiendo fuera del registro.
    Infraestructuras tipo FEDERA / ENDS Gobernanza y cumplimiento normativo; investigación reutilizable con trazabilidad. No son “open data” populista; acceso por proyectos, costes de integración y lentitud burocrática.
    DATASUS (Brasil) Volumen, profundidad temporal y sistemas acoplados al SUS; referencia continental. Complejidad técnica, calidad heterogénea, riesgo de conclusiones espurias si se ignoran sesgos de notificación.
    LA Referencia + institucionales Cubre tesis y grises que no están en PubMed; fortalece ciencia abierta regional. Cosecha desigual; huecos por instituciones que no federan metadatos.
    OPS / BM / OCDE (indicadores) Comparabilidad regional y series largas; buen punto de partida para políticas. Retrasos, revisiones metodológicas y políticas de redondeo que pueden ocultar crisis locales.
    Zenodo / repositorios de datos DOI, citabilidad, cumplimiento de planes de gestión de datos. Sin peer review del dataset; basura citab igual que oro si nadie audita.

    Aplicaciones (bombardeo): qué hacer con estas fuentes

    Lista deliberadamente densa. Cada viñeta es un producto, paper, dashboard o línea de I+D posible; la viabilidad legal/técnica varía por conjunto.

    Literatura, síntesis y ciencia abierta

    • Revisiones sistemáticas con LILACS + PubMed para no perder evidencia en español/portugués.
    • Mapas de evidencia (evidence gap maps) por país usando SciELO + registros de tesis (LA Referencia).
    • Análisis bibliométrico de redes de coautoría y temas “hot” en oncología o infectología regional.
    • Detección de duplicación editorial y autoplagio entre revistas de bajo umbral.
    • Curación de guías clínicas nacionales alojadas en repositorios ministeriales (RID, DIPRECE, etc.).
    • Corpus lingüístico médico para entrenar traductores asistidos o simplificación de consentimientos.
    • Minería de afiliaciones institucionales para política científica (quién publica qué y dónde).
    • Meta-análisis de estudios observacionales cuando los RCT son escasos en la región.
    • Seguimiento de acceso abierto mandato a mandato por país.
    • Identificación de “documentos grises” (informes OPS, tesis) ignorados por WoS.

    Vigilancia, epidemiología y política

    • Nowcasting de brotes cruzando DATASUS/SINAN con datos.gob.cl o gob.mx (con retraso explícito).
    • Modelos de carga de enfermedad (DALYs) calibrados con INS, DGE o series OPS.
    • Cartografía de desigualdad: microdatos INE + indicadores OPS por quintil urbano-rural.
    • Simulación de impacto de impuestos o etiquetado nutricional con encuestas de salud.
    • Tableros de transparencia para ciudadanía (listas de espera Uruguay, CCSS Costa Rica).
    • Auditoría de cumplimiento de vacunación con registros administrativos abiertos.
    • Estimación de subregistro de mortalidad materna comparando fuentes.
    • Alertas tempranas de reemergencia (Chagas, dengue) con series largas.
    • Evaluación ex post de reformas sanitarias (AUGE, SUS, etc.) con series pre/post.
    • Índices compuestos de resiliencia del sistema para organismos multilaterales.

    Microdatos, economía de la salud y métodos

    • Regresiones con diseño muestral complejo (INE encuestas salud) para factores de riesgo.
    • Análisis de coste-efectividad con datos de utilización hospitalaria (egresos RIISP, DATASUS).
    • Matching geoespacial de contaminación con datos de morbilidad si se cruzan capas externas.
    • Detección de anomalías en facturación o outliers de prestaciones (fraude suave).
    • Imputación múltiple cuando faltan datos — con advertencia explícita en la memoria del estudio.
    • Series temporales bayesianas para enfermedades raras con conteos bajos.
    • Shapley / explicabilidad sobre modelos tabulares para política (no solo accuracy).

    Ensayos clínicos, medicamentos y dispositivos

    • Panorama de reclutamiento por patología en REEC + CTIS + ClinicalTrials.gov.
    • Detección de ensayos “fantasma” o resultados tardíos (transparencia).
    • Priorización de innovación (qué moléculas se prueban en población hispana vs otros).
    • Vigilancia de estudios observacionales post-EMA con medicamentos.
    • Integración con literatura gris de AEMPS/EMA para señales de seguridad.

    Educación, comunicación y producto

    • Materiales OER para escuelas de salud pública a partir de informes OPS descargables.
    • Chatbots de orientación no clínica entrenados con FAQs oficiales (riesgo legal alto si se cruza la línea).
    • APIs ciudadanas de indicadores para medios de comunicación data-driven.
    • Concursos de visualización (hackatones) con datos CCSS o datos.gob.cl.
    • “Data sandwiches”: narrativa + gráfico + enlace al diccionario de variables.

    Hackeos en el buen sentido: productos cruzados por repositorio y monetización

    Ideas deliberadamente aplicables (muchas solo con metadatos públicos y APIs estándar), con modelo de ingreso explícito. Hoy = viabilidad técnica y comercial actual sin depender de acceso clínico individual ni de datos que no existen en abierto; igual exige legal, DPIA y honestidad con el cliente.

    Hack / producto Fuentes y repositorios (cruce) Monetización Hoy
    API de “legibilidad” de ensayos — unifica criterios de búsqueda (indicación, fase, reclutamiento) y devuelve alertas cuando cambia el estado en cualquier registro. REEC · CTIS · ClinicalTrials.gov (+ PubMed opcional para resultados) SaaS por sitio clínico o CRO; API por volumen de consultas. ●●●
    Radar de producción científica por terapia — cosecha OAI-PMH / buscadores agregados y clasifica por área (mesh-like ligero + LLM solo como etiquetador con auditoría). RECOLECTA · RODERIC · DIGITAL.CSIC · LA Referencia · repositorios UNAM Licencia B2B (farmacéutica, fondos, consultoras); informes trimestrales. ●●●
    RAG documental ES/PT para equipos médicos y comunicación — no diagnóstico: resúmenes de evidencia regional, fichas para MSL, material para congresos. IBECS · LILACS · SciELO · Dialnet · BVS (corpus citado con enlaces) Por asiento / marca blanca; cumplimiento de cita obligatoria en UI. ●●●
    Mapa de huecos de evidencia iberoamericana — cruza tesis + artículos abiertos para mostrar temas sobre-representados vs vacíos (por país y especialidad). LA Referencia · Redalyc · SciELO · repositorios institucionales (metadatos) Contratos B2G (ministerios, agencias); suscripción universidades. ●●●
    Compliance Horizon / Plan de gestión de datos — monitoriza depósitos Zenodo, comunidades y repositorios institucionales vinculados al proyecto. Zenodo · OpenAIRE (descubrimiento) · DIGITAL.CSIC · RECOLECTA SaaS a OTRIs y oficinas europeas; auditorías puntuales. ●●●
    Tableros de carga de enfermedad “honestos” — series largas, advertencias de rezago y definición; export a informe para medios y seguros. DATASUS / Tabnet · OPS Open Data · INE · DEIS · datos.gob.* Licencia de software + horas de consultoría; no vender los datos como si fueran microdatos clínicos. ●●●
    Detección de duplicación y “salami slicing” entre repositorio y revista — mismo trabajo depositado y publicado con metadatos distintos. Zenodo · LA Referencia · RECOLECTA · editoriales OA Herramienta para editoriales y agencias de evaluación; API por DOI. ●●●
    Broker de datasets de investigación curados — empaqueta conjuntos CONICET/ Zenodo con README, licencia y prueba estadística mínima. datosdeinvestigacion.conicet · Zenodo · repositorios con datos Margen en curación + soporte; modelo marketplace con comisión. ●●
    Intel gris competitiva (España / Latam) — quién deposita qué líneas de tesis/papers en nicho (biotech, salud digital) antes de que aparezca en WoS. RECOLECTA · Dialnet · RODERIC · repositoriosalud.unam Retainer B2B; informes para inversión y BD corporativa. ●●●
    Score de transparencia de ensayos “zombie” — registrados sin resultados ni publicación; ranking por patrocinador/sitio (reputación). REEC · CTIS · ClinicalTrials.gov Medios, ONG, fondos; modelo freemium + informes premium. ●●●
    Simulador fiscal / impuesto (tabaco, bebidas) — microdatos encuesta + elasticidades publicadas; escenarios para lobby y SP. INE · encuestas salud · OPS (contexto) · literatura en IBECS/LILACS Proyecto cerrado + mantenimiento; licencia gubernamental. ●●●
    Cohortes sintéticas “tipo país” — generación estadística a partir de márgenes públicos (no datos personales). Agregados DATASUS · INE · tablas OPS Licencia de método + validación; partnership con legal antes de vender. ●●
    Copilot asistido para fichas regulatorias — sugiere campos en REEC/CTIS desde borrador de protocolo (humano en el loop obligatorio). Esquemas de registro + PDFs públicos de guías AEMPS/EMA SaaS por sede de investigación; ahorro de horas administrativas. ●●●
    “Who funds whom” en salud pública — grafo financiación proyectos ↔ outputs en repositorio (cuando metadatos de financiador existen). RECOLECTA · Zenodo · DIGITAL.CSIC · LA Referencia Transparencia para medios y fundaciones; datos enrichment manual al inicio. ●●

    Leyenda Hoy: ●●● despliegue con stack estándar (harvest OAI, APIs de registros, tableros); ●● requiere curación humana o acuerdos; ● depende de datos que hoy no están unificados en abierto. Nada de esto sustituye asesoramiento jurídico ni DPIA donde haya riesgo de datos personales.

    Matriz: especialidad × tipo de valor (resumen)

    Celdas describen el tipo de aplicación predominante; no implica que todos los datasets la permitan. Lista ampliada de especialidades clínicas y áreas (medicina interna, anatomía patológica, ginecología, traumatología, farmacología/farmacocinética, etc.).

    Especialidad / área Evidencia / reviews Vigilancia / SP Modelado / IA Política / equity Producto / ops
    Salud pública LILACS, guías MSP OPS, DATASUS, DEIS Series agregadas, nowcast Microdatos INE / encuestas hogar Dashboards transparencia
    Medicina interna Revisiones, cohortes, guías hospitalarias (lit + gris) Mortalidad, egresos, comorbilidad agregada Scores riesgo (poblacional); sin EMR = sin predicción individual fiable Acceso a especialista, listas de espera Protocols, pathways (evidencia); trials REEC
    Infectología SciELO, PubMed SINAN, DGE, vigilancia regional Rt, brotes espacio-tiempo Cobertura vacunal por distrito Alertas, APIs salud pública
    Neurología SciELO/LILACS, registros de EVC, epilepsia (literatura) Mortalidad por causa neurológica, series vitales NLP sobre informes (solo con datos anonimizados y marco legal) Acceso a rehabilitación, cuidados larga duración Trials; RAG documental (no diagnóstico por imagen)
    Neumología Guías EPOC/asma, TB en LILACS Vigilancia respiratoria, mortalidad, calidad del aire (capas externas) Series temporales agregadas; modelos con cautela ecológica Exposición laboral, combustión doméstica Educación paciente; ensayos REEC
    Gastroenterología / hepatología Hepatitis, cirrosis, CRC — evidencia regional Mortalidad digestiva, cáncer (registros si existen) Screening poblacional solo con datos de programa público Desigualdad en cribado y tratamiento Trials; guías digestivas
    Nefrología IRCT, diálisis — literatura + gris institucional ERC: prevalencia proxy vía egresos/ENC (limitado) Modelos de incidencia en población; sin registros renales unificados en abierto Acceso a trasplante, inequidad territorial Registros de ensayo; políticas de acceso
    Endocrinología Diabetes, tiroides, obesidad — revisiones Encuestas salud, mortalidad metabólica Riesgo cardiovascular asociado (agregado) Acceso a insulina/análogos Apps estilo hábito (datos agregados)
    Oncología Registros cancer, lit Mortalidad, hospitalizaciones Survival poblacional (sesgado) Acceso a quimio por región Trials matching REEC/CTIS
    Anatomía patológica Literatura de IA en imagen digital; pocos datasets públicos de láminas Registros de cáncer (incidencia), estadísticas de mortalidad CV en patología: requiere cohortes curatoriadas; Zenodo con imágenes anonimizadas Acceso a biopsia / tiempos diagnóstico Workflow LIS (integración cerrada); no “scraping” clínico
    Hematología Coagulación, hemoglobinopatías, hemato-onco — revisiones Mortalidad hematológica, vigilancia hemovigilancia (si publicada) Series raras: N pequeño; cuidado con extrapolación Acceso a hemoderivados, quimio Trials; registros cuando existan en abierto
    Ginecología y obstetricia TESIS, guías materno-infantil, LILACS Mortalidad materna, SINASC, estadísticas vitales Modelos perinatales con datos agregados; sin EMR = sin predicción individual Parto respetado, acceso anticoncepción/aborto seguro (política) Calendario prenatal ciudadano (info, no clínico)
    Traumatología / ortopedia Artroplastia, fracturas — cohortes publicadas Egresos por trauma, mortalidad external Lesiones deportivas: datos escasos en abierto Acceso a prótesis, listas quirúrgicas Trials implantes; registros nacionales si públicos
    Urología Cáncer próstata/riñón — evidencia + ensayos Mortalidad urológica, registros cáncer Screening PSA: debate; series poblacionales Equidad en cribado y tratamiento REEC/CTIS; guías
    Dermatología Corpus imágenes limitado en abierto; literatura SciELO Mortalidad melanoma (agregada) IA imagen: datasets etiquetados raros; sesgo de piel Acceso a biológicos, fotoprotección Educación; ensayos
    ORL / cervicofacial Audición, rinología — revisiones regionales Encuestas salud (audición), estadísticas limitadas Datos abiertos escasos para otitis/cirugía mayor Acceso a audífonos, tiempos quirúrgicos Trials dispositivos; gris institucional
    Oftalmología Glaucoma, retina — literatura; pocos registros poblacionales Ceguera preventable (proxy agregado) Screening: programas públicos si documentados Acceso a cirugía de cataratas Trials; campañas de cribado
    Cardio / metabólico ENC, cohortes publicadas ENO, mortalidad CV Riesgo FRAMINGHAM-like calibrado Inequidad dietética Apps estilo coach (datos agregados)
    Salud mental Literatura regional escasa Encuestas salud, suicidio NLP sobre corpus textual Estigma, acceso rural Chat no terapéutico, info
    Pediatría / perinatal Tesis, LILACS SINASC, estadísticas vitales Predicción baja calidad sin EMR Mortalidad infantil por quintil Calendario vacunas padres
    Geriatría Caídas, fragilidad, demencia — guías y cohortes Mortalidad, dependencia (encuestas hogar) Scores frágilidad con datos limitados Residencias, cuidados larga duración Información cuidador; no sustituir valoración clínica
    Farmacología clínica y farmacocinética PK/PD, interacciones, dosificación — papers + BE/FE en regulatorio Farmacovigilancia agregada, consumo ATC (si publicado) PBPK: datos individuales no públicos; modelos con parámetros literatura Acceso a medicamentos esenciales, precios REEC, CTIS, bioequivalencia (fuentes regulatorias aparte)
    Medicina intensiva / anestesiología SEPSIS, VM — revisiones; datos ICU casi nunca en abierto Mortalidad hospitalaria agregada (proxy débil) Scores genéricos sin granularidad UCI Camas UCI, triaje en crisis Guías; trials; integración hospitalaria cerrada
    Radiología e imagen médica Literatura IA; datasets DICOM en Zenodo/repositorios puntuales Deep learning: solo con cohortes éticas y licencia Acceso a RM/TC (colas) Viewer investigación; no entrenar con datos clínicos sin consentimiento
    Alergología / inmunología clínica Anafilaxia, inmunoterapia — revisiones Mortalidad alérgica rara; notificación escasa Alertas farmacológicas (bases cruzadas) Acceso a adrenalina, inmunoglobulina Educación; ensayos biológicos
    Medicina del trabajo / salud laboral Exposiciones, EP — literatura y normativa OPS, estadísticas accidentes (país-dependiente) Modelos exposición–efecto con datos agregados Poblaciones migrantes, informalidad Informes; vigilancia inspecciones (abierto limitado)
    Informática clínica papers interoperabilidad RNDS, estándares FHIR FHIR + IA en entornos controlados ENDS, soberanía datos Integración EHR, APIs

    Matriz: investigación × política × producto (por familia de fuente)

    I = investigación académica / evaluación; P = política, norma, planificación; Prod. = producto: herramientas ciudadanas, SaaS, dashboards, APIs. Intensidad aproximada (●●● alta, ● media, ○ baja).

    Familia de recurso Investigación Política / gestión Producto / civic tech
    Literatura (LILACS, SciELO, BVS) ●●● Revisiones, meta, bibliometría ●● Guías y marcos basados en evidencia ○ Contenido; difícil monetizar sin valor añadido
    Repositorios institucionales (REPISalud, CONICET, LA Ref.) ●●● Tesis, datos asociados a proyectos ● Transparencia institucional ● Buscadores, recomendadores de lectura
    Microdatos agregados (INE, RIISP, DATASUS micro) ●●● Econometría, epidemiología ●●● Priorización y evaluación de programas ●● Apps de simulación, visualización honesta
    Indicadores regionales (OPS, OCDE vía OPS) ●● Comparaciones, series largas ●●● Argumentario internacional, ODS ●●● Rankings y tableros (riesgo de simplificación)
    Registros de ensayos (REEC, CTIS, ClinicalTrials.gov) ●●● Diseño, transparencia, meta de trials ●● Regulación y supervisión ● Matching pacientes–ensayos (con límites éticos)
    Infraestructuras cerradas (ENDS, FEDERA, RNDS) ●●● Investigación con gobernanza ●●● Planificación sanitaria ● Integración software certificado, no “scraping”
    Zenodo y datos de proyecto ●●● Reproducibilidad, DOI ● Evidencia de cumplimiento de ciencia abierta ● Datasets como activo si hay SLA de calidad

    Especialidad ↔ repositorios y portales (enlazado)

    Cada fila enlaza infraestructuras reales (acceso libre, registro o metadatos gratuitos) con anclas de esta guía para el encaje regional. Ver también el ranking global y cohortes / datos curados.

    Ámbito clínico Dónde buscar primero (repos / portales) En esta guía
    Salud pública, epidemiología, brotes WHO GHO, Zenodo (series y proyectos), PAHO Open Data, agregadores re3data Mapa 4 capas, Tabla · Latam A, Selección curada
    Infectología, vacunas, EID ClinicalTrials.gov, Europe PMC, OPS/PAHO (informes y datos regionales), depósitos Zenodo por brote/proyecto UE · CTIS, BVS / México, Criterio crítico
    Oncología, hematología oncológica GDC (TCGA…), Europe PMC + filtros, registros de ensayo CTIS / REEC, Zenodo oncología Cohortes curados, Matriz por especialidad
    Cardiometabolismo (CV, diabetes, riñón) NHLBI (recursos abiertos), metadatos UK Biobank (solicitud para datos), encuestas vía INE / países; literatura en PMC España adm., Matriz clínica
    Neurología, ictus, neurodegeneración PMC / Europe PMC, OpenNeuro (neuroimagen CC), PhysioNet (credencial según dataset), Zenodo neuro* Cohortes (MIMIC/PhysioNet), Matriz
    Neumología, EPOC, asma GHO tabaco/aire, DATASUS morbimortalidad respiratoria, ensayos en ClinicalTrials, revisiones en PMC DATASUS / OPS, Matriz
    Pediatría, perinatal, salud materno-infantil Documentación DATASUS (SINASC, SIM), WHO MCA, literatura LILACS/SciELO Latam · bases, Universidades
    Gine-obs, mama, cérvix Registros vitales (SINASC, Eurostat según país), ensayos gineco-onco en CTIS/ClinicalTrials, PMC Tabla países, Matriz
    Traumatología, ortopedia, RM muscular-esquelético Zenodo ortopedia/arthro*, metadatos cohortes en re3data; ensayos ortopédicos en registros Matriz, Cohortes
    Anatomía patológica, imagen digital GDC (imagen ligada a casos), parches en Zenodo, TCIA (acceso según política) Cohortes, Criterio (Zenodo)
    Farmacología, ensayos clínicos, PK/PD ClinicalTrials.gov, CTIS, REEC, complementos en Europe PMC CTIS / REEC, Matriz I×P×Prod
    UCI, anestesia, shock, sepsis PhysioNet (MIMIC tras credencial), Zenodo critical care, OSF proyectos Cohortes (tabla PhysioNet), Matriz
    Salud mental, adicciones (datos escasos) Encuestas oficiales (INE, CDC BRFSS…), WHO mental health datos agregados, NLP sobre PMC/LILACS con cuidado ético Ventajas y límites, Facilidad acceso
    Informática clínica, FHIR, IA en salud Zenodo FHIR / EHR datasets, OSF, papers + datos en Dryad Matriz I×P×Prod, Escenarios
    Biobancos, redes multicéntrico BBMRI-ERIC, metadatos cohortes EGA; identificación instituciones con ROR Cohortes, Ranking (ROR)

    Los enlaces externos son puntos de partida; licencias y acceso requieren lectura del repositorio de origen.

    Grafo conceptual: especialidades ↔ capas de fuente

    Esquema orientativo: no constituye una ontología normativa; facilita situar cada tipo de recurso en el análisis.

    Fuentes ES / Latam literatura · stats · trials Salud pública OPS · DATASUS Infectología SINAN · vigilancia Oncología registros · mortalidad Cardio / metabólico encuestas INE Salud mental encuestas · NLP Pediatría SINASC · vitales Farmaco / trials REEC · CTIS

    Nodo central = uso combinado de repositorios; periferia = solo ejemplos ilustrativos. El detalle clínico con enlaces a portales reales está en la matriz por especialidad y en Especialidad → repositorios.

    Escenarios avanzados y valoración de impacto

    Valor en escala subjetiva 1–5 (utilidad plausible si se resuelven ética y calidad de datos). Última columna: riesgo de sobrepromesa o inviabilidad técnica.

    Idea Área Valor Comentario
    Gemelo digital nacional del SNS con datos abiertos Informática / SP 2 Los datos abiertos por sí solos no bastan; se requiere ENDS y proyectos con gobernanza.
    LLM “experto clínico” entrenado solo con SciELO/LILACS IA / NLP 2 Riesgo de alucinación y sesgo regional; útil como asistente bibliográfico, no diagnóstico.
    Predicción individual de ingreso con DATASUS agregado ML tabular 1–2 Ecología incorrecta: sin EMR individual, el modelo es fantasía o ecological fallacy.
    Detección de ensayos “zombie” (registrados, sin resultados ni publicación) Transparencia 5 Alta utilidad social; datos ya públicos; poco glamour, mucho impacto.
    Marketplace de cohortes sintéticas “tipo” Brasil/España Datos sintéticos 3 Valor medio si hay validación estadística; riesgo de hype si no se audita.
    RAG sobre normativa MSP/MINSAL + jurisprudencia sanitaria Legal-tech 4 Útil para gestores; requiere fuentes legales actualizadas, no solo repositorios biomédicos.
    Mapa en tiempo casi real de desabasto de medicamentos con datos abiertos Logística / equity 3 Datos rara vez granulares en abierto; mezclar fuentes privadas o whistleblowing ético.
    “Puntuación de país” de preparación pandémica solo con OPS Política 2 Indicadores útiles para narrativa, peligrosos si se judicializan sin contexto local.
    Federación federada de embeddings de tesis (LA Referencia) para recomendar lectura Educación / IR 4 Buen valor pedagógico; evitar rankings que castiguen a universidades pobres en OAI-PMH.
    Simulador de reforma fiscal del tabaco con microdatos + elasticidades Economía salud 5 Sólido si los microdatos y supuestos económicos están documentados.
    Blockchain “de la verdad clínica” Hype 1 Rara vez aporta más que una base de datos auditada con firma y trazabilidad convencional.
    Copilot para completar fichas REEC/CTIS con sugerencias (human-in-the-loop) Regulación 4 Reduce fricción administrativa; obligatorio supervisión humana y trazabilidad.

    Acciones recomendadas (comité)

    1. Delimitar el problema ¿Literatura, estadística agregada, microdatos o registro regulatorio? Mezclar objetivos alarga proyectos y genera conclusiones frágiles.
    2. Búsqueda en dos capas PubMed/Medline para estándar internacional + LILACS/BVS/SciELO para cobertura regional y gris; deduplicar con gestor bibliográfico.
    3. Legal y ética antes de código Salud reutilizable ≠ datos personales: revisar LOPD/GDPR, licencias de datasets y condiciones de RIISP u otros portales.
    4. No confundir visibilidad con calidad Usar criterios explícitos de inclusión (diseño de estudio, tamaño muestral, riesgo de sesgo) independientemente del portal de origen.
    5. Triangulación de registros de ensayos Para el mismo fármaco/indicación: REEC + CTIS (si aplica UE) + ClinicalTrials.gov + publicaciones; documentar discrepancias en anexo.
    6. País primero, región después Descargar definiciones del sistema de información nacional antes de mezclar series OPS con modelos predictivos; si no, el “modelo” aprende artefactos de codificación.
    7. Versionado de datos Guardar hash, fecha de descarga y URL exacta; los ministerios recategorizan causas y años sin aviso ruidoso.
    8. Presupuestar limpieza En proyectos con DATASUS/INE/microdatos, asignar explícitamente persona-semanas a documentación y QA — suele ser ≥50 % del esfuerzo real.
    Mapa lateral