Mapa del documento — saltar a una sección
Ranking: infraestructuras y descubridores (gratuitos o capa gratuita relevante)
Criterio COMPLEXSA (ordinal, no bibliométrico): utilidad para localizar literatura, datos o metadatos reutilizables sin coste de acceso principal, cobertura internacional, estabilidad institucional y documentación en abierto. No es un “impact factor”: sirve para decidir por dónde empezar antes de profundizar en la tabla por país o en cohortes. Mapa geolocalizado y globo 3D con los mismos “tops” a escala mundial y banderas por país.
| # | Plataforma | Tipo | Por qué está arriba | Enlace |
|---|---|---|---|---|
| 1 | Europe PMC / PubMed Central | Literatura OA + preprints | Texto completo y metadatos masivos; base universal antes de LILACS/SciELO regional. | europepmc.org |
| 2 | ClinicalTrials.gov | Registro de ensayos | Gratis, API y descargas; referencia para diseño de estudios y cohortes vinculadas a trials. | clinicaltrials.gov |
| 3 | WHO · Global Health Observatory / IRIS | Indicadores + publicaciones OMS | Capa gratuita de comparabilidad internacional; útil para contexto de política sanitaria. | who.int/data/gho |
| 4 | Zenodo (CERN) | Repositorio de datos y preprints | DOI gratuito, comunidad científica; donde muchos grupos depositan datasets de artículo. | zenodo.org |
| 5 | re3data | Directorio de repositorios de datos | Descubrimiento disciplinar; filtra por país, política de acceso y licencia. | re3data.org |
| 6 | OpenDOAR | Directorio de repositorios institucionales OA | Encuentra el OAI-PMH / portal de la universidad antes que el PDF suelto. | v2.sherpa.ac.uk/opendoar |
| 7 | OpenAIRE Explore | Proyectos, publicaciones, datos | Cruce financiación EU → outputs; enlaza grupos e instituciones europeas. | explore.openaire.eu |
| 8 | CORDIS | Proyectos europeos (Horizonte, etc.) | Identifica consorcios, coordinadores y resultados esperados de I+D en salud. | cordis.europa.eu |
| 9 | Dryad | Datos asociados a publicaciones | Curación y citación; muy usado en ciencias de la vida. | datadryad.org |
| 10 | OSF (Open Science Framework) | Proyectos, preprints, materiales | Grupos documentan diseño antes del paper; útil para auditoría metodológica. | osf.io |
| 11 | Figshare | Datos y figuras con DOI | Capa gratuita con límites; mucha producción biomédica gris depositada aquí. | figshare.com |
| 12 | CORE | Agregador de OA | Búsqueda transversal sobre repositorios institucionales (incl. muchos no indexados en PubMed). | core.ac.uk |
| 13 | Dataset Search (Google) | Meta-buscador de datasets | Descubrimiento amplio; verificar siempre la fuente y licencia en el repositorio de origen. | datasetsearch.research.google.com |
| 14 | HAL (CCSD) · Francia | Repositorio nacional multirrama | Acceso abierto masivo a informes, tesis y preprints de grupos franceses. | hal.science |
| 15 | ZB MED · Alemania | Información biomédica especializada | Portal y repositorios en salud (incl. ámbito de datos y publicaciones alemanas). | zbmed.de |
Grupos e instituciones: identificadores y redes (gratis)
Para enlazar cohortes, biobancos y proyectos sin confundir siglas homónimas.
| Recurso | Para qué sirve | Enlace |
|---|---|---|
| ROR (Research Organization Registry) | ID persistente de instituciones; integración en metadatos de datos y publicaciones. | ror.org |
| GRID (histórico, migrado a ROR) | Muchos ficheros antiguos citan GRID; comprobar equivalencia en ROR. | grid.ac |
| ORCID | Autores → afiliaciones; seguimiento de producción de un grupo vía perfiles. | orcid.org |
| OpenAlex | Grafo abierto de obras, instituciones y conceptos; API gratuita para bibliometría ligera. | openalex.org |
Estados Unidos: portales como CDC data o WONDER añaden capas sanitarias públicas (con matices de granularidad). Reino Unido: UK Data Service mezcla registros gratuitos y bajo contrato según conjunto.
Tops mundiales (biomedicina, medicina y ciencia abierta): mapa y globo 3D
Selección COMPLEXSA de infraestructuras de primer orden a escala planetaria (literatura, datos, registros, directorios y agregadores). Las posiciones son aproximadas (sede, consorcio o ancla). El globo usa textura de la Tierra (proyecto three.js, WebGL); arrastra para rotar y pasa el ratón sobre los puntos para ver repositorio y tipo.
Mapa 2D + Globo 3D
Izquierda: OpenStreetMap (ODbL) vía Leaflet — zoom por país, tooltips en puntos, clic para enlace. Derecha: globo con textura satélite/atmosférica (repositorio de texturas three.js), campo de estrellas y marcadores; pasa el ratón sobre un punto para nombre y tipo; clic abre la web del repositorio.
Impresión: mapa y globo se ocultan; permanece la tabla con banderas. Sin WebGL el panel del globo puede mostrarse vacío.
Tabla de cumbres con banderas
Orden aproximadamente geográfico (continentes); no implica preferencia numérica respecto al ranking ordinal superior.
| Bandera | País / región | Infraestructura | Tipo | Enlace |
|---|---|---|---|---|
| 🇦🇺 | Australia | ARDC (Australian Research Data Commons) | Infraestructura nacional de datos | ardc.edu.au |
| 🇧🇪 | Bélgica (UE) | CORDIS | Proyectos europeos de I+D | cordis.europa.eu |
| 🇧🇷 | Brasil (BIREME / OPS) | LILACS · BVS | Literatura y evidencia regional | LILACS |
| 🇨🇭 | Suiza | WHO · Global Health Observatory | Indicadores sanitarios globales | who.int/data/gho |
| 🇨🇭 | Suiza (CERN) | Zenodo | Repositorio general (datos, software, informes) | zenodo.org |
| 🇨🇳 | China | CNKI / portales nacionales abiertos (capa pública variable) | Literatura y metadatos (ámbito regional) | cnki.net |
| 🇩🇪 | Alemania | re3data (registry) | Directorio de repositorios de datos | re3data.org |
| 🇩🇪 | Alemania | ZB MED | Información biomédica especializada | zbmed.de |
| 🇫🇷 | Francia | HAL (CCSD) | Repositorio nacional multidisciplinar | hal.science |
| 🇯🇵 | Japón | J-STAGE (JST) | Revistas y actas científicas | jstage.jst.go.jp |
| 🇰🇷 | Corea del Sur | KISTI · ScienceON / KoreaMed | Portal nacional de literatura biomédica | scienceon.kisti.re.kr |
| 🇳🇱 | Países Bajos (UE) | OpenAIRE Explore | Publicaciones, datos, proyectos EU | explore.openaire.eu |
| 🇬🇧 | Reino Unido / EMBL-EBI | Europe PMC | Literatura de acceso abierto + preprints | europepmc.org |
| 🇬🇧 | Reino Unido | BioStudies (EBI) | Estudios -omics y metadatos | ebi.ac.uk/biostudies |
| 🇬🇧 | Reino Unido | CORE | Agregador de literatura OA | core.ac.uk |
| 🇬🇧 | Reino Unido | OpenDOAR | Directorio de repositorios institucionales | OpenDOAR |
| 🇬🇧 | Reino Unido | Figshare | Datos y figuras con DOI | figshare.com |
| 🇺🇸 | Estados Unidos (NIH) | PubMed Central | Literatura biomédica OA | PMC |
| 🇺🇸 | Estados Unidos (NIH) | Gene Expression Omnibus (GEO) | Datos transcriptómicos | NCBI GEO |
| 🇺🇸 | Estados Unidos (NIH) | ClinicalTrials.gov | Registro de ensayos clínicos | clinicaltrials.gov |
| 🇺🇸 | Estados Unidos | Dryad | Datos asociados a publicaciones | datadryad.org |
| 🇺🇸 | Estados Unidos | OSF (COS) | Proyectos, materiales, preprints | osf.io |
| 🇺🇸 | Estados Unidos | Dataset Search (Google) | Meta-buscador de conjuntos de datos | datasetsearch… |
Nota: América Latina y España siguen detalladas en la tabla por país y en el ranking ordinal; aquí el foco es la capa global de referencia.
Resumen ejecutivo
La capa universitaria e I+D (RECOLECTA, RODERIC, DIGITAL.CSIC, Dialnet, repositorios LA Referencia) aporta tesis, preprints y datos de proyecto que los portales clínicos no indexan; conviene cruzarla con bases bibliográficas (IBECS, LILACS) sin asumir cobertura exhaustiva por disciplina.
La mayoría de lo que se etiqueta como “repositorio de salud” en la región mezcla tres cosas distintas: literatura científica (PDFs y metadatos), datos agregados o microdatos públicos (estadística y epidemiología), y registros regulatorios (ensayos clínicos). Conviene no confundirlas: lo que sirve para una revisión sistemática no sirve para entrenar un modelo con registros clínicos individuales, y al revés.
Para cohortes de pacientes, datos -ómicos o fenotípicos con acceso bajo comité (no “carpetas abiertas”), hay una sección aparte con repositorios y ecosistemas orientados a datos curados (EGA, dbGaP, BBMRI, OMOP/OHDSI, etc.); los portales de estadística y vigilancia de este documento raramente sustituyen ese tipo de diseño.
Ventaja real regional: visibilidad de producción iberoamericana, cobertura de revistas locales y documentos grises que PubMed ignora o indexa tarde. Límite real: calidad heterogénea, metadatos incompletos, duplicación entre bases (LILACS vs SciELO vs institucional) y escasez de datasets clínicos “listos para ML” por ley y por gobernanza.
Cada reutilización de datos debe ajustarse a la licencia del conjunto y a la normativa de protección de datos aplicable.
Profundidad: mapa en cuatro capas (no todo es “repositorio”)
Ordenar el caos ayuda a no perder meses. En la práctica conviene separar: (1) Descubrimiento bibliográfico — LILACS, SciELO, BVS, institucionales; (2) Depósito y preservación — RECOLECTA (agregador nacional), repositorios institucionales (p. ej. RODERIC, DIGITAL.CSIC), REPISalud, CONICET Digital, LA Referencia, Zenodo; (3) Estadística y vigilancia — INE, DATASUS/Tabnet, DEIS, RIISP, OPS Open Data; (4) Regulación y transparencia — REEC, CTIS/EU, registros nacionales de ensayos. Quien diseña un producto mezclando capas sin contrato de datos ni hipótesis acaba con un “dashboard” que nadie puede auditar.
Brasil no es “un país más” en esta lista: DATASUS concentra volumen y sistemas (SIM, SINASC, SINAN, CNES) con décadas de historia; la complejidad operativa (Tabwin, calidad subregional) es el precio de esa riqueza. España comparte encaje europeo: microdatos INE muy utilizables para encuestas, pero ENDS/EEDS son gobernanza federada, no carpetas ZIP públicas de pacientes.
Criterio crítico (perspectiva de comité técnico)
“Open” ≠ replicable. Muchos conjuntos vienen sin pipeline de limpieza documentado; el artículo que afirma hallazgos sin código y sin versión del dataset es opinión con CSV adjunto.
Duplicación interbases. El mismo artículo puede aparecer en SciELO, revista propia y repositorio institucional; si no deduplicas por DOI/título/año, inflas revisiones y revisiones sistemáticas.
Agregadores muertos. REDIB dejó de actualizar servicios de facto desde 2022; confiar en rankings o enlaces heredados de REDIB es pérdida de tiempo — ir a la fuente (revista o repositorio institucional).
OPS y BM/OCDE suavizan brechas entre países con imputaciones y armonización; sirven para comparar tendencias, no para adjudicar culpas sin leer el fichero técnico de cada indicador.
CTIS vs REEC vs ClinicalTrials.gov: ensayo “global” puede estar en varios registros con ligeras discrepancias en fechas y estados; el metaanálisis serio cruza fuentes y el paper.
Zenodo y similares: excelente para cumplir mandatos de datos y DOI; también albergan basura con DOI. El filtro es el afiliación, el README y si el dataset tiene diccionario de variables.
Cohortes y datos curados: dónde buscar más allá de portales “abiertos”
Si lo que necesitas son cohortes de pacientes (seguimiento longitudinal, fenotipos vinculados a -ómicos, imágenes clínicas anonimizadas o tablas analíticas listas para estudio), el catálogo anterior (estadística oficial, vigilancia, literatura) suele no bastar: esos sistemas priorizan agregados, transparencia regulatoria o publicaciones, no un diseño de cohorte con criterios de inclusión explícitos y gobernanza de acceso.
Los repositorios “de cohorte” reales combinan tres cosas: (1) datos con identidad mínima o seudonimizados bajo política; (2) metadatos y diccionarios que permiten saber qué significa cada variable; (3) un mecanismo de acceso (comité de datos, DAC, credencial institucional, o entorno seguro federado). Sin eso, “dataset de pacientes” en un ZIP público es señal de alerta legal y metodológica, no de oportunidad.
Tabla orientativa: ecosistemas útiles para cohortes y datos de investigación curados
Enlaces de referencia; el acceso efectivo depende de cada política (proyecto aprobado, país, institución). Cruza siempre con la normativa de protección de datos aplicable (RGPD, HIPAA según caso, leyes locales).
| Recurso / ecosistema | Qué aporta para cohortes | Nota de acceso |
|---|---|---|
| EGA (European Genome-Phenome Archive) | Almacenamiento federado de datos sensibles (-ómicos y fenotipos) con metadatos EGA; base para estudios que replican o meta-analizan cohortes europeas. | ega-archive.org — acceso vía comités/DAC según estudio. |
| dbGaP (NIH) | Estudios con datos genómicos y fenotípicos depositados en el ecosistema NIH; referencia mundial para cohortes con componente genético. | ncbi.nlm.nih.gov/gap — acceso controlado por proyecto. |
| GDC (Genomic Data Commons) | Portal unificado (p. ej. TCGA, TARGET) para datos oncológicos: útil cuando la cohorte está ligada a proyectos con datos ya armonizados. | portal.gdc.cancer.gov — controlado según conjunto. |
| UK Biobank | Cohorte muy grande (fenotipos, -ómicos, imágenes en subconjuntos); referencia para diseño de estudios observacionales y validación de instrumentos. | ukbiobank.ac.uk — solicitud de proyecto; no es descarga libre. |
| All of Us (NIH) | Programa de cohorte multimodal con énfasis en diversidad poblacional; útil para hipótesis que requieren representatividad. | researchallofus.org — entorno de investigación registrado. |
| BBMRI-ERIC | Infraestructura europea: directorio de biobancos, muestras y metadatos para localizar cohortes y material biológico enlazable a estudios. | bbmri-eric.eu — contacto por biobanco/estudio. |
| OHDSI / OMOP | No es un único repositorio de ficheros: es un modelo común de datos y comunidad para observacional en red; permite “cohorte lógica” federada sin centralizar siempre los datos crudos. | ohdsi.org — útil para definir cohortes comparables entre centros. |
| PhysioNet (y conjuntos asociados) | Ondas fisiológicas, ECG, MIMIC (UCI) tras formación/credencial; cohortes hospitalarias muy citadas en ML clínico. | physionet.org — credenciales CITI u otros requisitos según dataset. |
| España RECOLECTA (datos de proyecto) | Agregador nacional: cuando grupos depositan datasets de investigación con DOI, aparecen aquí; no sustituye un registro de cohorte clínica, pero es vía de descubrimiento de conjuntos curados españoles. | recollecta.fecyt.es — revisar licencia y contacto por conjunto. |
Cómo encajar esto con el resto del documento
Literatura y repositorios institucionales (LILACS, SciELO, RECOLECTA de publicaciones) sirven para ver si alguien ya publicó una cohorte y con qué N y exclusiones. Portales de estadística y vigilancia (DATASUS, INE, RIISP…) sirven para población y tendencias, raramente para tablas individuales con seguimiento clínico fino. Para construir o alimentar cohortes, la vía seria suele ser: (1) datos secundarios curados en repositorios con DAC (EGA, dbGaP, etc.); (2) biobancos/redes (BBMRI, acuerdos locales); (3) estudios propios con consentimiento y CEIm; (4) en desarrollo y pruebas, datos sintéticos o simulados (p. ej. perfiles tipo Synthea, cohortes sintéticas bien documentadas) sin confundirlos con evidencia clínica real.
Latinoamérica tiene cohortes importantes publicadas en artículos y, cada vez más, datos en repositorios institucionales o regionales; la fragmentación es mayor que en EE. UU./UE — conviene triangular con registros de ensayos, tesis en RECOLECTA/LA Referencia y contacto directo con grupos (muchas cohortes no están “en un solo clic”).
Selección curada: para qué sirve cada uno
Saltos dentro de la tabla España · adm. · UE · CTIS · España · univ. / agregadores · Regional · bases · Latam · BVS / México · Regional · repos. fed. · Latam · Cono Sur… · Global / UE FEDERA
| Recurso | Qué es / para qué | Acceso |
|---|---|---|
|
España — Administración, estadística, BVS, SciELO, REEC, INE, REPISalud, ENDS
#
|
||
|
España datos.gob.es — Salud y bienestar |
Catálogo nacional de conjuntos de datos abiertos de administraciones (no solo Sanidad). Útil para series, localización de recursos, reutilización según licencia de cada dataset. | datos.gob.es/salud-bienestar |
| España Banco de datos — Ministerio de Sanidad |
Estadísticas oficiales (Barómetro Sanitario, Encuesta de Salud de España, etc.). Investigación social y epidemiológica descriptiva; no es un almacén de historias clínicas. | sanidad.gob.es — bancoDatos |
| España Catálogo de datos abiertos MSCBS |
Datasets reutilizables del departamento (centros de atención primaria del SNS, etc.). Pensado para transparencia y análisis; revisar formato y actualización por fichero. | sede.mscbs.gob.es — datos abiertos |
| España BVS España / BNCS (ISCIII) |
Biblioteca virtual y puerta de acceso a bases, catálogos y recursos de ciencias de la salud en España, enlazada con la red BVS regional. | bvsalud.isciii.es · bvsalud.org |
| España SciELO España |
Revistas españolas de salud en modelo SciELO (texto completo abierto, metadatos estructurados). Muy útil para difusión y evaluación bibliométrica nacional; cobertura depende de las revistas admitidas. | scielo.isciii.es · búsqueda SciELO |
| España REEC (AEMPS) |
Registro público de estudios clínicos con medicamentos y estudios observacionales relevantes. Transparencia regulatoria y seguimiento de ensayos; no es base de datos de resultados agregados para metaanálisis masivos sin curación. | reec.aemps.es |
| España Revista Española de Salud Pública (OJS) |
Revista oficial en acceso abierto sobre salud pública y gestión; útil para políticas y ciencia aplicada en contexto español. | ojs.sanidad.gob.es/resp |
| España INE — Salud y microdatos |
Encuestas de salud, morbilidad hospitalaria, defunciones por causa, etc. Microdatos anonimizados (R, SAS, Stata, CSV según serie); obligatorio citar al INE. Capa estadística de referencia en España; no son registros clínicos ni biobancos. | INEbase — salud · microdatos · ESdE en datos.gob.es |
| España REPISalud (ISCIII) |
Repositorio institucional federado (ISCIII, IIS, fundaciones) para publicaciones y producción científica en salud; calidad de metadatos relativamente alta. Depósito académico, no “dataset nacional de pacientes”. | repisalud.isciii.es |
| España ENDS — Espacio Nacional de Datos de Salud |
Marco federado (comunidades autónomas) para uso secundario regulado de datos sanitarios (investigación, planificación). Posiciona a España ante el EEDS europeo; no es un portal de descarga masiva anónima tipo datos abiertos clásicos. | ends.gob.es |
|
Unión Europea — Registro de ensayos (CTIS / EMA)
#
|
||
| UE CTIS — Registro público UE (EMA) |
Consulta de ensayos clínicos con medicamentos bajo el Reglamento (UE) 536/2014 (sistema CTIS). Imprescindible si el estudio tiene alcance europeo actual; ensayos anteriores pueden seguir en EU CTR/EudraCT. | euclinicaltrials.eu · clinicaltrialsregister.eu |
|
España — Ciencia abierta: RECOLECTA, CSIC, IBECS, RODERIC, PCUV, Dialnet, REBIUN
#
|
||
| España RECOLECTA (FECYT / REBIUN) |
Agregador nacional de repositorios institucionales de acceso abierto (universidades y centros). Punto único para localizar tesis, artículos y conjuntos depositados en nodos como RODERIC, e-Archivo, DOCUTRACE, etc.; filtrar por materia y repositorio de origen. No sustituye a bases Medline: es descubrimiento institucional. | recolecta.fecyt.es · buscador de proyectos |
| España DIGITAL.CSIC |
Repositorio institucional del CSIC: artículos, tesis doctorales, datasets y patrimonio digital de institutos (biología, biomedicina, química, etc.). Complementa repositorios universitarios; políticas de depósito por centro. | digital.csic.es |
| España IBECS (BNCS / ISCIII) |
Índice bibliográfico en ciencias de la salud con enfoque en producción indexada en España; enlaces a texto completo cuando existe. Complementa Medline/Embase para visibilidad nacional; no es repositorio de ficheros masivos. | ibecs.isciii.es · BNCS |
| España RODERIC — Universitat de València |
Repositorio institucional UV (tesis, preprints, capítulos, datos según políticas). Pieza central para la producción académica valenciana en biomedicina y otras áreas; multidisciplinar — filtrar por materia y tipo de documento. | roderic.uv.es |
| España PCUV · vivero · I2SysBio (València) |
Parc Científic UV: incubadora y vivero de empresas, institutos y transferencia. El I2SysBio (UV–CSIC) integra biología de sistemas y bioinformática; el máster oficial en Bioinformática de la UV articula formación. No es archivo documental: es ecosistema (contratos, spin-offs, redes) que condiciona qué termina en abierto. | pcuv.es · i2sysbio.es · Máster Bioinformática (UV) |
| España Dialnet |
Portal de la Fundación Dialnet (Universidad de La Rioja): literatura científica hispánica, tesis y documentos grises con fuerte presencia iberoamericana. Útil como capa cruzada; criterios de inclusión y acceso al texto completo varían por documento. | dialnet.unirioja.es |
| España REBIUN (CRUE) |
Red de Bibliotecas Universitarias Españolas: marco de políticas, interoperabilidad y catálogo colectivo; enlaza con el ecosistema RECOLECTA. Referencia institucional más que “un solo buscador biomédico”. | rebiun.org |
|
Regional — BVS/BIREME, LILACS, SciELO (bases bibliográficas)
#
|
||
| Regional BVS / BIREME / OPS |
Red regional de bibliotecas virtuales en salud; eje para LILACS, recursos educativos y portales nacionales. Punto de partida casi obligatorio para búsqueda en español/portugués. | bvsalud.org · bireme.org |
| Regional LILACS |
Base cooperativa de literatura latinoamericana y del Caribe en ciencias de la salud (artículos, tesis, informes). Referencia regional; solapamiento con otras bases exige estrategia de deduplicación. | lilacs.bvsalud.org |
| Regional SciELO (red global) |
Publicación electrónica cooperativa; módulos por país. Alta visibilidad en acceso abierto; criterios de calidad varían por colección. | scielo.org |
|
Latinoamérica — BVS nacionales, México (RIISP, ENI, UNAM, datos abiertos, INEGI), Colombia (RID), OPS
#
|
||
| Latam BVS Brasil / BVS MS |
Portales nacionales de salud en Brasil (volumen bibliográfico enorme, legislación y recursos técnicos). Imprescindibles si el foco es Brasil o comparación Lusofónica. | brasil.bvs.br · bvsms.saude.gov.br |
| Latam BVS Argentina (MSAL) |
Portal argentino de la BVS con bases y directorios alineados al modelo regional. | bvs.msal.gov.ar |
| Latam RIISP (INSP, México) |
Repositorio integrado de microdatos e información en salud pública (nacimientos, egresos, etc., según disponibilidad). Pensado para investigación con manejo estadístico; acceso puede requerir registro o filtros institucionales según conjunto. | riisp.insp.mx |
| Latam ENI Salud (CONAHCYT) |
Ecosistema informático de salud: herramientas y enlaces a grandes bases; orientado a análisis y visualización más que a un único “dump” descargable. | repositorio-salud.conahcyt.mx · conacyt (hist.) |
| Latam UNAM — RI y repositorio de salud |
Repositorio institucional de la UNAM (tesis, libros, producción académica amplia) y repositorio temático de ciencias de la salud. Referencia obligada para producción mexicana que no pasa por PubMed; metadatos y tipos de documento desiguales. | repositorio.unam.mx · repositoriosalud.unam.mx |
| Latam Datos abiertos — Secretaría de Salud (México) |
Conjuntos epidemiológicos y anuarios (morbilidad, COVID-19, etc.). Útiles para series de tiempo y mapas; revisar granularidad y definiciones. | gob.mx/salud — datos abiertos |
| Latam INEGI — Salud (México) |
Estadísticas de salud en establecimientos y otras series oficiales; integración con censos y encuestas. | inegi.org.mx — salud |
| Latam RID — Ministerio de Salud (Colombia) |
Repositorio institucional de documentos técnicos, normativa e informes del sector. No sustituye a datos.gov.co para datasets tabulares abiertos. | minsalud.gov.co — RID |
| Latam Revista Panamericana de Salud Pública (OPS) |
Revista en acceso abierto con enfoque en políticas y sistemas de salud en las Américas. | journal.paho.org |
|
Regional — Repositorios federados (U. Chile), LA Referencia, Redalyc, OPS datos
#
|
||
| Regional Red de Repositorios Latinoamericanos (U. de Chile) |
Buscador transversal sobre muchos repositorios institucionales de la región. Útil para tesis e informes grises; resultados desiguales según institución. | repositorioslatinoamericanos.uchile.cl |
| Regional LA Referencia |
Red federada de repositorios institucionales (metadatos cosechados de países miembros). Buscador transversal de producción científica en abierto; calidad depende del repositorio de origen. | lareferencia.info · buscador |
| Regional Redalyc |
Red de revistas y otros contenidos de acceso abierto de América Latina y el Caribe; visibilidad regional complementaria a SciELO y repositorios institucionales. Calidad editorial heterogénea por colección. | redalyc.org |
| Regional OPS — Open Data / PLISA |
Indicadores básicos (desde mediados de los 90), tableros temáticos (ENT, envejecimiento, ODS-3, emergencias). Fuente regional harmonizada; cuidado con comparar países sin leer definiciones y fuentes nacionales subyacentes. | opendata.paho.org · observatorio OPS |
|
Latinoamérica — Cono Sur y Andes (CONICET, DATASUS, Chile, Perú, Uruguay, Ecuador, CCSS, Bolivia, Paraguay, Colombia)
#
|
||
| Latam CONICET Digital + datos de investigación |
Producción del sistema CONICET (artículos, tesis) y repositorio específico de datasets de investigación con políticas de depósito. Punto fuerte para Argentina; cobertura sesgada a carrera CONICET. | ri.conicet.gov.ar · datos de investigación |
| Latam DATASUS + datos abiertos SUS (Brasil) |
Departamento de Informática del SUS: Tabnet/Tabwin, microdatos (SIM, SINASC, SINAN, CNES, etc.). Probablemente la fuente pública más voluminosa de la región; curva de aprendizaje y problemas de calidad/completitud por estado municipal. | datasus.saude.gov.br · dados abiertos SUS · gov.br/saude |
| Latam RNDS (Brasil) |
Red nacional de interoperabilidad en salud (HL7 FHIR). Infraestructura para intercambio seguro entre sistemas; relevante para integración técnica y APIs credenciadas, no para descarga pública masiva de historias. | gov.br — RNDS · guía integración |
| Latam DEIS + datos abiertos — Chile |
DEIS (MINSAL): estadísticas oficiales, tableros y series (mortalidad, vacunas, nutrición). datos.gob.cl agrega conjuntos del Ministerio de Salud en formatos abiertos. Buena transparencia relativa en la región. | deis.minsal.cl · datos.gob.cl — MINSAL |
| Latam ISP Chile — repositorio publicaciones |
Estudios ISP en vigilancia, dispositivos, ambiente; complementa evidencia nacional fuera de la literatura mainstream. | repositorio ISP |
| Latam REUNIS + INS — Perú |
REUNIS: repositorio único de información en salud (MINSA). Repositorio INS: artículos, reportes y evaluaciones de tecnologías. DGE/CDC Perú para vigilancia. Datos abiertos nacionales en plataforma gob.pe/datosabiertos. | REUNIS · repositorio INS · DGE |
| Latam Datos abiertos — Uruguay (MSP) |
Catálogo nacional (AGESIC): egresos hospitalarios, PIAS, afiliación, indicadores. “A tu servicio” para comparar desempeño de prestadores; mezcla utilidad ciudadana con datos para investigación aplicada. | catalogodatos — salud · MSP datos abiertos · AtuServicio.uy |
| Latam Datos abiertos — Ecuador (MSP) |
Catálogo MSP y portal nacional de datos abiertos; matrices epidemiológicas y vacunas según publicación. Conviene comprobar periodicidad y cobertura del sistema público. | salud.gob.ec/datos-abiertos · datosabiertos.gob.ec |
| Latam CCSS + BINASSS — Costa Rica |
CCSS publica datos abiertos (consultas, hospitalización, nacimientos, defunciones, RR.HH.). BINASSS: repositorio de documentos e investigación en salud/seguridad social. Sistema institucional fuerte en la región. | CCSS datos abiertos · repositorio BINASSS |
| Latam datos.gob.bo + SNIS — Bolivia |
Portal de datos abiertos del Estado y sistemas SNIS-VE/SOAPS para vigilancia. Menor madurez digital que vecinos; OPS y BM siguen siendo respaldo para indicadores comparativos. | datos.gob.bo · minsalud.gob.bo |
| Latam MSPyBS — Paraguay (estadística) |
Datos epidemiológicos e informes del ministerio; INE complementa con hogares y acceso a servicios. Expectativa de microdatos públicos más limitada que Brasil o Uruguay. | mspbs — datos epidemiológicos · INE Paraguay |
| Latam datos.gov.co — Salud (Colombia) |
Portal nacional de datos abiertos: conjuntos por institución (filtrar “MinSalud”, INS, etc.). Complementa al RID documental del ministerio con tablas reutilizables si existen para el tema. | datos.gov.co (filtrar por organización / etiqueta “salud”) |
|
Global y UE — ClinicalTrials.gov, Zenodo, FEDERA Salud
#
|
||
| Global ClinicalTrials.gov (NIH) |
Registro internacional de referencia (ICTRP OMS). Sigue siendo capa obligatoria para ensayos multiregión aunque el ensayo tenga sitio en REEC o CTIS. | clinicaltrials.gov |
| Global Zenodo (CERN / OpenAIRE) |
Repositorio generalista con DOI: datasets, software e informes de proyectos (p. ej. salud en España vía comunidades). Útil para cumplir apertura de datos de financiación europea; calidad heterogénea según autor. | zenodo.org · comunidades |
| UE FEDERA Salud (investigación) |
Infraestructura de datos para investigación (p. ej. integración clínica e imágenes en proyectos seleccionados). No es un portal de descarga pública tipo “Kaggle de la sanidad”; el acceso es por proyectos y cumplimiento normativo. | federasalud.eu |
Universidades, agregadores nacionales e investigación
Más allá de ministerios y registros clínicos, la producción académica “de aula y laboratorio” vive en repositorios institucionales (tesis, preprints, datos de proyecto) y en agregadores nacionales que cosechan metadatos de muchas universidades. En España, RECOLECTA (FECYT, marco REBIUN/CRUE) es el buscador transversal habitual; el RODERIC de la Universitat de València es solo uno entre decenas de nodos — no confundir “buscar en RECOLECTA” con “todo el biomédico español está depositado allí”: el depósito es voluntario por centro y la calidad es heterogénea.
El Parc Científic de la Universitat de València (PCUV) concentra incubación (vivero de empresas), institutos mixtos como el I2SysBio (UV–CSIC) y flujos hacia transferencia; encaja con el Máster Universitario en Bioinformática (UV). No es un archivo de PDFs: es ecosistema (laboratorios, contratos, spin-offs) que condiciona qué datos y software acaban en abierto y en qué repositorio.
Para el CSIC existe un eje propio (DIGITAL.CSIC). Para literatura hispánica y documentos grises, Dialnet sigue siendo capa de cruce (con sesgos editoriales propios). En México, la UNAM opera el repositorio institucional y un repositorio del área de salud en paralelo a los portales gubernamentales ya listados en la tabla.
Agregadores discontinuados y mitos frecuentes
REDIB dejó de actualizar servicios de forma significativa desde junio de 2022: no uses sus rankings ni agregación como fuente viva; para iberoamérica actual, combina Latindex, RECOLECTA (España), LA Referencia, repositorios institucionales y SciELO/LILACS directamente.
“Todo está en SciELO”: falso. Mucha producción buena nunca entrará en SciELO por política editorial o idioma; la tesis doctoral o el informe técnico puede estar solo en un Dspace institucional (RECOLECTA, LA Referencia y buscadores institucionales ayudan a descubrirla, no a garantizarla).
“Latam es un solo sistema de salud”: falso. Segmentación público/privado, financiamiento y calidad del registro difieren tanto que un modelo entrenado en DATASUS no extrapola a Paraguay sin revalidación explícita.
Facilidad de acceso y uso
- Literatura (BVS, LILACS, SciELO): acceso web inmediato; descarga de PDF cuando el artículo es OA. La “facilidad” baja si necesitas exportación masiva (APIs limitadas o inconsistentes) o datos bibliométricos limpios sin procesar.
- Datos.gob.es y catálogos ministeriales: navegación aceptable; el trabajo real está en limpiar CSV/JSON, alinear años y leer cada licencia (reutilización no siempre equivale a “haz lo que quieras”).
- Microdatos (INE España, RIISP, INEGI, DATASUS/Tabwin): requieren estadística, software (R/Stata) y lectura del diseño muestral o del manual del sistema de información; los ficheros “limpios” son raros a la primera descarga.
- Brasil (DATASUS): potencia máxima y fricción máxima: múltiples sistemas, documentación dispersa y curva Tabwin; malo para quien busca un único CSV bonito, bueno para quien puede invertir tiempo.
- Registros de ensayos (REEC, CTIS, ClinicalTrials.gov): muy usables para diseño y reclutamiento; resultados completos siguen viviendo sobre todo en revistas y suplementos — el registro no sustituye la lectura crítica del paper.
- Repositorios institucionales (REPISalud, CONICET, LA Referencia): metadatos variables; si falta el PDF en el repositorio, el enlace a la revista puede estar roto o tras paywall.
- OPS Open Data: fácil para gráficos y comparaciones exploratorias; mala idea usarlo como única fuente sin contrastar con el instituto nacional de estadística del país.
Ventajas y desventajas (síntesis)
| Enfoque | Ventajas | Desventajas / riesgos |
|---|---|---|
| Red BVS + LILACS | Cobertura regional fuerte; idiomas; documentos grises; coste cero. | Duplicación; calidad desigual; indexación más lenta que bases comerciales; sesgo hacia lo publicado en la red. |
| SciELO | OA consolidado; buena visibilidad latinoamericana; interoperabilidad entre países. | No todas las revistas tienen el mismo rigor; métricas de impacto discutidas frente a journals nórdicos o Anglo tradicionales. |
| Datos públicos (ES / MX / otros) | Transparencia; series largas para modelos epidemiológicos y dashboards. | Granularidad limitada; rezagos; cambios de definición; poco apto para IA clínica individual. |
| Registros de ensayos (REEC) | Obligatoriedad legal reciente mejora trazabilidad; datos de reclutamiento y diseño. | No sustituye resultados publicados ni datos individuales; sesgo de publicación sigue existiendo fuera del registro. |
| Infraestructuras tipo FEDERA / ENDS | Gobernanza y cumplimiento normativo; investigación reutilizable con trazabilidad. | No son “open data” populista; acceso por proyectos, costes de integración y lentitud burocrática. |
| DATASUS (Brasil) | Volumen, profundidad temporal y sistemas acoplados al SUS; referencia continental. | Complejidad técnica, calidad heterogénea, riesgo de conclusiones espurias si se ignoran sesgos de notificación. |
| LA Referencia + institucionales | Cubre tesis y grises que no están en PubMed; fortalece ciencia abierta regional. | Cosecha desigual; huecos por instituciones que no federan metadatos. |
| OPS / BM / OCDE (indicadores) | Comparabilidad regional y series largas; buen punto de partida para políticas. | Retrasos, revisiones metodológicas y políticas de redondeo que pueden ocultar crisis locales. |
| Zenodo / repositorios de datos | DOI, citabilidad, cumplimiento de planes de gestión de datos. | Sin peer review del dataset; basura citab igual que oro si nadie audita. |
Aplicaciones (bombardeo): qué hacer con estas fuentes
Lista deliberadamente densa. Cada viñeta es un producto, paper, dashboard o línea de I+D posible; la viabilidad legal/técnica varía por conjunto.
Literatura, síntesis y ciencia abierta
- Revisiones sistemáticas con LILACS + PubMed para no perder evidencia en español/portugués.
- Mapas de evidencia (evidence gap maps) por país usando SciELO + registros de tesis (LA Referencia).
- Análisis bibliométrico de redes de coautoría y temas “hot” en oncología o infectología regional.
- Detección de duplicación editorial y autoplagio entre revistas de bajo umbral.
- Curación de guías clínicas nacionales alojadas en repositorios ministeriales (RID, DIPRECE, etc.).
- Corpus lingüístico médico para entrenar traductores asistidos o simplificación de consentimientos.
- Minería de afiliaciones institucionales para política científica (quién publica qué y dónde).
- Meta-análisis de estudios observacionales cuando los RCT son escasos en la región.
- Seguimiento de acceso abierto mandato a mandato por país.
- Identificación de “documentos grises” (informes OPS, tesis) ignorados por WoS.
Vigilancia, epidemiología y política
- Nowcasting de brotes cruzando DATASUS/SINAN con datos.gob.cl o gob.mx (con retraso explícito).
- Modelos de carga de enfermedad (DALYs) calibrados con INS, DGE o series OPS.
- Cartografía de desigualdad: microdatos INE + indicadores OPS por quintil urbano-rural.
- Simulación de impacto de impuestos o etiquetado nutricional con encuestas de salud.
- Tableros de transparencia para ciudadanía (listas de espera Uruguay, CCSS Costa Rica).
- Auditoría de cumplimiento de vacunación con registros administrativos abiertos.
- Estimación de subregistro de mortalidad materna comparando fuentes.
- Alertas tempranas de reemergencia (Chagas, dengue) con series largas.
- Evaluación ex post de reformas sanitarias (AUGE, SUS, etc.) con series pre/post.
- Índices compuestos de resiliencia del sistema para organismos multilaterales.
Microdatos, economía de la salud y métodos
- Regresiones con diseño muestral complejo (INE encuestas salud) para factores de riesgo.
- Análisis de coste-efectividad con datos de utilización hospitalaria (egresos RIISP, DATASUS).
- Matching geoespacial de contaminación con datos de morbilidad si se cruzan capas externas.
- Detección de anomalías en facturación o outliers de prestaciones (fraude suave).
- Imputación múltiple cuando faltan datos — con advertencia explícita en la memoria del estudio.
- Series temporales bayesianas para enfermedades raras con conteos bajos.
- Shapley / explicabilidad sobre modelos tabulares para política (no solo accuracy).
Ensayos clínicos, medicamentos y dispositivos
- Panorama de reclutamiento por patología en REEC + CTIS + ClinicalTrials.gov.
- Detección de ensayos “fantasma” o resultados tardíos (transparencia).
- Priorización de innovación (qué moléculas se prueban en población hispana vs otros).
- Vigilancia de estudios observacionales post-EMA con medicamentos.
- Integración con literatura gris de AEMPS/EMA para señales de seguridad.
Educación, comunicación y producto
- Materiales OER para escuelas de salud pública a partir de informes OPS descargables.
- Chatbots de orientación no clínica entrenados con FAQs oficiales (riesgo legal alto si se cruza la línea).
- APIs ciudadanas de indicadores para medios de comunicación data-driven.
- Concursos de visualización (hackatones) con datos CCSS o datos.gob.cl.
- “Data sandwiches”: narrativa + gráfico + enlace al diccionario de variables.
Hackeos en el buen sentido: productos cruzados por repositorio y monetización
Ideas deliberadamente aplicables (muchas solo con metadatos públicos y APIs estándar), con modelo de ingreso explícito. Hoy = viabilidad técnica y comercial actual sin depender de acceso clínico individual ni de datos que no existen en abierto; igual exige legal, DPIA y honestidad con el cliente.
| Hack / producto | Fuentes y repositorios (cruce) | Monetización | Hoy |
|---|---|---|---|
| API de “legibilidad” de ensayos — unifica criterios de búsqueda (indicación, fase, reclutamiento) y devuelve alertas cuando cambia el estado en cualquier registro. | REEC · CTIS · ClinicalTrials.gov (+ PubMed opcional para resultados) | SaaS por sitio clínico o CRO; API por volumen de consultas. | ●●● |
| Radar de producción científica por terapia — cosecha OAI-PMH / buscadores agregados y clasifica por área (mesh-like ligero + LLM solo como etiquetador con auditoría). | RECOLECTA · RODERIC · DIGITAL.CSIC · LA Referencia · repositorios UNAM | Licencia B2B (farmacéutica, fondos, consultoras); informes trimestrales. | ●●● |
| RAG documental ES/PT para equipos médicos y comunicación — no diagnóstico: resúmenes de evidencia regional, fichas para MSL, material para congresos. | IBECS · LILACS · SciELO · Dialnet · BVS (corpus citado con enlaces) | Por asiento / marca blanca; cumplimiento de cita obligatoria en UI. | ●●● |
| Mapa de huecos de evidencia iberoamericana — cruza tesis + artículos abiertos para mostrar temas sobre-representados vs vacíos (por país y especialidad). | LA Referencia · Redalyc · SciELO · repositorios institucionales (metadatos) | Contratos B2G (ministerios, agencias); suscripción universidades. | ●●● |
| Compliance Horizon / Plan de gestión de datos — monitoriza depósitos Zenodo, comunidades y repositorios institucionales vinculados al proyecto. | Zenodo · OpenAIRE (descubrimiento) · DIGITAL.CSIC · RECOLECTA | SaaS a OTRIs y oficinas europeas; auditorías puntuales. | ●●● |
| Tableros de carga de enfermedad “honestos” — series largas, advertencias de rezago y definición; export a informe para medios y seguros. | DATASUS / Tabnet · OPS Open Data · INE · DEIS · datos.gob.* | Licencia de software + horas de consultoría; no vender los datos como si fueran microdatos clínicos. | ●●● |
| Detección de duplicación y “salami slicing” entre repositorio y revista — mismo trabajo depositado y publicado con metadatos distintos. | Zenodo · LA Referencia · RECOLECTA · editoriales OA | Herramienta para editoriales y agencias de evaluación; API por DOI. | ●●● |
| Broker de datasets de investigación curados — empaqueta conjuntos CONICET/ Zenodo con README, licencia y prueba estadística mínima. | datosdeinvestigacion.conicet · Zenodo · repositorios con datos | Margen en curación + soporte; modelo marketplace con comisión. | ●● |
| Intel gris competitiva (España / Latam) — quién deposita qué líneas de tesis/papers en nicho (biotech, salud digital) antes de que aparezca en WoS. | RECOLECTA · Dialnet · RODERIC · repositoriosalud.unam | Retainer B2B; informes para inversión y BD corporativa. | ●●● |
| Score de transparencia de ensayos “zombie” — registrados sin resultados ni publicación; ranking por patrocinador/sitio (reputación). | REEC · CTIS · ClinicalTrials.gov | Medios, ONG, fondos; modelo freemium + informes premium. | ●●● |
| Simulador fiscal / impuesto (tabaco, bebidas) — microdatos encuesta + elasticidades publicadas; escenarios para lobby y SP. | INE · encuestas salud · OPS (contexto) · literatura en IBECS/LILACS | Proyecto cerrado + mantenimiento; licencia gubernamental. | ●●● |
| Cohortes sintéticas “tipo país” — generación estadística a partir de márgenes públicos (no datos personales). | Agregados DATASUS · INE · tablas OPS | Licencia de método + validación; partnership con legal antes de vender. | ●● |
| Copilot asistido para fichas regulatorias — sugiere campos en REEC/CTIS desde borrador de protocolo (humano en el loop obligatorio). | Esquemas de registro + PDFs públicos de guías AEMPS/EMA | SaaS por sede de investigación; ahorro de horas administrativas. | ●●● |
| “Who funds whom” en salud pública — grafo financiación proyectos ↔ outputs en repositorio (cuando metadatos de financiador existen). | RECOLECTA · Zenodo · DIGITAL.CSIC · LA Referencia | Transparencia para medios y fundaciones; datos enrichment manual al inicio. | ●● |
Leyenda Hoy: ●●● despliegue con stack estándar (harvest OAI, APIs de registros, tableros); ●● requiere curación humana o acuerdos; ● depende de datos que hoy no están unificados en abierto. Nada de esto sustituye asesoramiento jurídico ni DPIA donde haya riesgo de datos personales.
Matriz: especialidad × tipo de valor (resumen)
Celdas describen el tipo de aplicación predominante; no implica que todos los datasets la permitan. Lista ampliada de especialidades clínicas y áreas (medicina interna, anatomía patológica, ginecología, traumatología, farmacología/farmacocinética, etc.).
| Especialidad / área | Evidencia / reviews | Vigilancia / SP | Modelado / IA | Política / equity | Producto / ops |
|---|---|---|---|---|---|
| Salud pública | LILACS, guías MSP | OPS, DATASUS, DEIS | Series agregadas, nowcast | Microdatos INE / encuestas hogar | Dashboards transparencia |
| Medicina interna | Revisiones, cohortes, guías hospitalarias (lit + gris) | Mortalidad, egresos, comorbilidad agregada | Scores riesgo (poblacional); sin EMR = sin predicción individual fiable | Acceso a especialista, listas de espera | Protocols, pathways (evidencia); trials REEC |
| Infectología | SciELO, PubMed | SINAN, DGE, vigilancia regional | Rt, brotes espacio-tiempo | Cobertura vacunal por distrito | Alertas, APIs salud pública |
| Neurología | SciELO/LILACS, registros de EVC, epilepsia (literatura) | Mortalidad por causa neurológica, series vitales | NLP sobre informes (solo con datos anonimizados y marco legal) | Acceso a rehabilitación, cuidados larga duración | Trials; RAG documental (no diagnóstico por imagen) |
| Neumología | Guías EPOC/asma, TB en LILACS | Vigilancia respiratoria, mortalidad, calidad del aire (capas externas) | Series temporales agregadas; modelos con cautela ecológica | Exposición laboral, combustión doméstica | Educación paciente; ensayos REEC |
| Gastroenterología / hepatología | Hepatitis, cirrosis, CRC — evidencia regional | Mortalidad digestiva, cáncer (registros si existen) | Screening poblacional solo con datos de programa público | Desigualdad en cribado y tratamiento | Trials; guías digestivas |
| Nefrología | IRCT, diálisis — literatura + gris institucional | ERC: prevalencia proxy vía egresos/ENC (limitado) | Modelos de incidencia en población; sin registros renales unificados en abierto | Acceso a trasplante, inequidad territorial | Registros de ensayo; políticas de acceso |
| Endocrinología | Diabetes, tiroides, obesidad — revisiones | Encuestas salud, mortalidad metabólica | Riesgo cardiovascular asociado (agregado) | Acceso a insulina/análogos | Apps estilo hábito (datos agregados) |
| Oncología | Registros cancer, lit | Mortalidad, hospitalizaciones | Survival poblacional (sesgado) | Acceso a quimio por región | Trials matching REEC/CTIS |
| Anatomía patológica | Literatura de IA en imagen digital; pocos datasets públicos de láminas | Registros de cáncer (incidencia), estadísticas de mortalidad | CV en patología: requiere cohortes curatoriadas; Zenodo con imágenes anonimizadas | Acceso a biopsia / tiempos diagnóstico | Workflow LIS (integración cerrada); no “scraping” clínico |
| Hematología | Coagulación, hemoglobinopatías, hemato-onco — revisiones | Mortalidad hematológica, vigilancia hemovigilancia (si publicada) | Series raras: N pequeño; cuidado con extrapolación | Acceso a hemoderivados, quimio | Trials; registros cuando existan en abierto |
| Ginecología y obstetricia | TESIS, guías materno-infantil, LILACS | Mortalidad materna, SINASC, estadísticas vitales | Modelos perinatales con datos agregados; sin EMR = sin predicción individual | Parto respetado, acceso anticoncepción/aborto seguro (política) | Calendario prenatal ciudadano (info, no clínico) |
| Traumatología / ortopedia | Artroplastia, fracturas — cohortes publicadas | Egresos por trauma, mortalidad external | Lesiones deportivas: datos escasos en abierto | Acceso a prótesis, listas quirúrgicas | Trials implantes; registros nacionales si públicos |
| Urología | Cáncer próstata/riñón — evidencia + ensayos | Mortalidad urológica, registros cáncer | Screening PSA: debate; series poblacionales | Equidad en cribado y tratamiento | REEC/CTIS; guías |
| Dermatología | Corpus imágenes limitado en abierto; literatura SciELO | Mortalidad melanoma (agregada) | IA imagen: datasets etiquetados raros; sesgo de piel | Acceso a biológicos, fotoprotección | Educación; ensayos |
| ORL / cervicofacial | Audición, rinología — revisiones regionales | Encuestas salud (audición), estadísticas limitadas | Datos abiertos escasos para otitis/cirugía mayor | Acceso a audífonos, tiempos quirúrgicos | Trials dispositivos; gris institucional |
| Oftalmología | Glaucoma, retina — literatura; pocos registros poblacionales | Ceguera preventable (proxy agregado) | Screening: programas públicos si documentados | Acceso a cirugía de cataratas | Trials; campañas de cribado |
| Cardio / metabólico | ENC, cohortes publicadas | ENO, mortalidad CV | Riesgo FRAMINGHAM-like calibrado | Inequidad dietética | Apps estilo coach (datos agregados) |
| Salud mental | Literatura regional escasa | Encuestas salud, suicidio | NLP sobre corpus textual | Estigma, acceso rural | Chat no terapéutico, info |
| Pediatría / perinatal | Tesis, LILACS | SINASC, estadísticas vitales | Predicción baja calidad sin EMR | Mortalidad infantil por quintil | Calendario vacunas padres |
| Geriatría | Caídas, fragilidad, demencia — guías y cohortes | Mortalidad, dependencia (encuestas hogar) | Scores frágilidad con datos limitados | Residencias, cuidados larga duración | Información cuidador; no sustituir valoración clínica |
| Farmacología clínica y farmacocinética | PK/PD, interacciones, dosificación — papers + BE/FE en regulatorio | Farmacovigilancia agregada, consumo ATC (si publicado) | PBPK: datos individuales no públicos; modelos con parámetros literatura | Acceso a medicamentos esenciales, precios | REEC, CTIS, bioequivalencia (fuentes regulatorias aparte) |
| Medicina intensiva / anestesiología | SEPSIS, VM — revisiones; datos ICU casi nunca en abierto | Mortalidad hospitalaria agregada (proxy débil) | Scores genéricos sin granularidad UCI | Camas UCI, triaje en crisis | Guías; trials; integración hospitalaria cerrada |
| Radiología e imagen médica | Literatura IA; datasets DICOM en Zenodo/repositorios puntuales | — | Deep learning: solo con cohortes éticas y licencia | Acceso a RM/TC (colas) | Viewer investigación; no entrenar con datos clínicos sin consentimiento |
| Alergología / inmunología clínica | Anafilaxia, inmunoterapia — revisiones | Mortalidad alérgica rara; notificación escasa | Alertas farmacológicas (bases cruzadas) | Acceso a adrenalina, inmunoglobulina | Educación; ensayos biológicos |
| Medicina del trabajo / salud laboral | Exposiciones, EP — literatura y normativa | OPS, estadísticas accidentes (país-dependiente) | Modelos exposición–efecto con datos agregados | Poblaciones migrantes, informalidad | Informes; vigilancia inspecciones (abierto limitado) |
| Informática clínica | papers interoperabilidad | RNDS, estándares FHIR | FHIR + IA en entornos controlados | ENDS, soberanía datos | Integración EHR, APIs |
Matriz: investigación × política × producto (por familia de fuente)
I = investigación académica / evaluación; P = política, norma, planificación; Prod. = producto: herramientas ciudadanas, SaaS, dashboards, APIs. Intensidad aproximada (●●● alta, ● media, ○ baja).
| Familia de recurso | Investigación | Política / gestión | Producto / civic tech |
|---|---|---|---|
| Literatura (LILACS, SciELO, BVS) | ●●● Revisiones, meta, bibliometría | ●● Guías y marcos basados en evidencia | ○ Contenido; difícil monetizar sin valor añadido |
| Repositorios institucionales (REPISalud, CONICET, LA Ref.) | ●●● Tesis, datos asociados a proyectos | ● Transparencia institucional | ● Buscadores, recomendadores de lectura |
| Microdatos agregados (INE, RIISP, DATASUS micro) | ●●● Econometría, epidemiología | ●●● Priorización y evaluación de programas | ●● Apps de simulación, visualización honesta |
| Indicadores regionales (OPS, OCDE vía OPS) | ●● Comparaciones, series largas | ●●● Argumentario internacional, ODS | ●●● Rankings y tableros (riesgo de simplificación) |
| Registros de ensayos (REEC, CTIS, ClinicalTrials.gov) | ●●● Diseño, transparencia, meta de trials | ●● Regulación y supervisión | ● Matching pacientes–ensayos (con límites éticos) |
| Infraestructuras cerradas (ENDS, FEDERA, RNDS) | ●●● Investigación con gobernanza | ●●● Planificación sanitaria | ● Integración software certificado, no “scraping” |
| Zenodo y datos de proyecto | ●●● Reproducibilidad, DOI | ● Evidencia de cumplimiento de ciencia abierta | ● Datasets como activo si hay SLA de calidad |
Especialidad ↔ repositorios y portales (enlazado)
Cada fila enlaza infraestructuras reales (acceso libre, registro o metadatos gratuitos) con anclas de esta guía para el encaje regional. Ver también el ranking global y cohortes / datos curados.
| Ámbito clínico | Dónde buscar primero (repos / portales) | En esta guía |
|---|---|---|
| Salud pública, epidemiología, brotes | WHO GHO, Zenodo (series y proyectos), PAHO Open Data, agregadores re3data | Mapa 4 capas, Tabla · Latam A, Selección curada |
| Infectología, vacunas, EID | ClinicalTrials.gov, Europe PMC, OPS/PAHO (informes y datos regionales), depósitos Zenodo por brote/proyecto | UE · CTIS, BVS / México, Criterio crítico |
| Oncología, hematología oncológica | GDC (TCGA…), Europe PMC + filtros, registros de ensayo CTIS / REEC, Zenodo oncología | Cohortes curados, Matriz por especialidad |
| Cardiometabolismo (CV, diabetes, riñón) | NHLBI (recursos abiertos), metadatos UK Biobank (solicitud para datos), encuestas vía INE / países; literatura en PMC | España adm., Matriz clínica |
| Neurología, ictus, neurodegeneración | PMC / Europe PMC, OpenNeuro (neuroimagen CC), PhysioNet (credencial según dataset), Zenodo neuro* | Cohortes (MIMIC/PhysioNet), Matriz |
| Neumología, EPOC, asma | GHO tabaco/aire, DATASUS morbimortalidad respiratoria, ensayos en ClinicalTrials, revisiones en PMC | DATASUS / OPS, Matriz |
| Pediatría, perinatal, salud materno-infantil | Documentación DATASUS (SINASC, SIM), WHO MCA, literatura LILACS/SciELO | Latam · bases, Universidades |
| Gine-obs, mama, cérvix | Registros vitales (SINASC, Eurostat según país), ensayos gineco-onco en CTIS/ClinicalTrials, PMC | Tabla países, Matriz |
| Traumatología, ortopedia, RM muscular-esquelético | Zenodo ortopedia/arthro*, metadatos cohortes en re3data; ensayos ortopédicos en registros | Matriz, Cohortes |
| Anatomía patológica, imagen digital | GDC (imagen ligada a casos), parches en Zenodo, TCIA (acceso según política) | Cohortes, Criterio (Zenodo) |
| Farmacología, ensayos clínicos, PK/PD | ClinicalTrials.gov, CTIS, REEC, complementos en Europe PMC | CTIS / REEC, Matriz I×P×Prod |
| UCI, anestesia, shock, sepsis | PhysioNet (MIMIC tras credencial), Zenodo critical care, OSF proyectos | Cohortes (tabla PhysioNet), Matriz |
| Salud mental, adicciones (datos escasos) | Encuestas oficiales (INE, CDC BRFSS…), WHO mental health datos agregados, NLP sobre PMC/LILACS con cuidado ético | Ventajas y límites, Facilidad acceso |
| Informática clínica, FHIR, IA en salud | Zenodo FHIR / EHR datasets, OSF, papers + datos en Dryad | Matriz I×P×Prod, Escenarios |
| Biobancos, redes multicéntrico | BBMRI-ERIC, metadatos cohortes EGA; identificación instituciones con ROR | Cohortes, Ranking (ROR) |
Los enlaces externos son puntos de partida; licencias y acceso requieren lectura del repositorio de origen.
Grafo conceptual: especialidades ↔ capas de fuente
Esquema orientativo: no constituye una ontología normativa; facilita situar cada tipo de recurso en el análisis.
Nodo central = uso combinado de repositorios; periferia = solo ejemplos ilustrativos. El detalle clínico con enlaces a portales reales está en la matriz por especialidad y en Especialidad → repositorios.
Escenarios avanzados y valoración de impacto
Valor en escala subjetiva 1–5 (utilidad plausible si se resuelven ética y calidad de datos). Última columna: riesgo de sobrepromesa o inviabilidad técnica.
| Idea | Área | Valor | Comentario |
|---|---|---|---|
| Gemelo digital nacional del SNS con datos abiertos | Informática / SP | 2 | Los datos abiertos por sí solos no bastan; se requiere ENDS y proyectos con gobernanza. |
| LLM “experto clínico” entrenado solo con SciELO/LILACS | IA / NLP | 2 | Riesgo de alucinación y sesgo regional; útil como asistente bibliográfico, no diagnóstico. |
| Predicción individual de ingreso con DATASUS agregado | ML tabular | 1–2 | Ecología incorrecta: sin EMR individual, el modelo es fantasía o ecological fallacy. |
| Detección de ensayos “zombie” (registrados, sin resultados ni publicación) | Transparencia | 5 | Alta utilidad social; datos ya públicos; poco glamour, mucho impacto. |
| Marketplace de cohortes sintéticas “tipo” Brasil/España | Datos sintéticos | 3 | Valor medio si hay validación estadística; riesgo de hype si no se audita. |
| RAG sobre normativa MSP/MINSAL + jurisprudencia sanitaria | Legal-tech | 4 | Útil para gestores; requiere fuentes legales actualizadas, no solo repositorios biomédicos. |
| Mapa en tiempo casi real de desabasto de medicamentos con datos abiertos | Logística / equity | 3 | Datos rara vez granulares en abierto; mezclar fuentes privadas o whistleblowing ético. |
| “Puntuación de país” de preparación pandémica solo con OPS | Política | 2 | Indicadores útiles para narrativa, peligrosos si se judicializan sin contexto local. |
| Federación federada de embeddings de tesis (LA Referencia) para recomendar lectura | Educación / IR | 4 | Buen valor pedagógico; evitar rankings que castiguen a universidades pobres en OAI-PMH. |
| Simulador de reforma fiscal del tabaco con microdatos + elasticidades | Economía salud | 5 | Sólido si los microdatos y supuestos económicos están documentados. |
| Blockchain “de la verdad clínica” | Hype | 1 | Rara vez aporta más que una base de datos auditada con firma y trazabilidad convencional. |
| Copilot para completar fichas REEC/CTIS con sugerencias (human-in-the-loop) | Regulación | 4 | Reduce fricción administrativa; obligatorio supervisión humana y trazabilidad. |