Una validación inadecuada de un biomarcador puede tener consecuencias importantes en el diagnóstico, tratamiento y seguimiento de muchos pacientes, por lo que debe ponerse especial interés en realizar estos análisis de forma correcta para que los biomarcadores sean aplicables en los pacientes y pueda generarse evidencia sobre su utilidad clínica. Se presenta un trabajo metodológico sobre el concepto de biomarcadores, así como las dificultades asociadas al abordaje metodológico para su desarrollo, validación e implementación en la práctica clínica.
An inadequate biomarker validation can affect many patients’ diagnosis, treatment, and follow-up. Therefore, special interest should be placed on performing these analyses correctly so that biomarkers can be applicable to patients and evidence of their clinical usefulness can be generated. A methodological work on the concept of biomarkers is presented, as well as the difficulties associated with the methodological approach to their development, validation, and implementation in clinical practice.
La medicina personalizada, o de precisión, se define como el «abordaje emergente para la prevención, diagnóstico y tratamiento de la enfermedad que tiene en cuenta la variabilidad individual, ambiental y el estilo de vida de cada persona»1. Este nuevo abordaje es posible gracias al desarrollo, entre otras, de las técnicas de biología molecular, en concreto al auge de las técnicas ómicas (genómica, proteómica, metabolómica). Estas técnicas se caracterizan por producir una cantidad masiva de datos, lo que ha permitido conocer mejor los determinantes genéticos y biológicos de la enfermedad y dar un gran impulso al descubrimiento de biomarcadores.
Los biomarcadores son «características objetivamente mensurables que son indicadores de procesos biológicos normales o patológicos y de respuesta al tratamiento»2. Es decir, son parámetros medibles o cuantificables que, en general, pertenecen a tres grupos moleculares distintos: proteínas, metabolitos y ácidos nucleicos o genes. Hay también biomarcadores de imagen, físicos y mecánicos, incluso psicológicos o conductuales, entre otros, pero para entender mejor el concepto, vamos a ceñirnos a los biológicos en este trabajo, pudiéndose extrapolar toda la información a los otros tipos.
Al reflejar los procesos biológicos, los biomarcadores pueden ser muy útiles para la toma de decisiones relacionadas con el diagnóstico, el tratamiento, la actividad de la enfermedad y su pronóstico, por lo que a veces se categorizan en cuanto a sus aplicaciones clínicas (fig. 1):
- -
biomarcadores de susceptibilidad o predisposición: indican la probabilidad de desarrollar la enfermedad,
- -
biomarcadores de diagnóstico: permiten confirmar el diagnóstico de una enfermedad concreta,
- -
biomarcadores pronósticos: informan sobre la evolución de la enfermedad (recidiva o recurrencia),
- -
biomarcadores predictivos de respuesta terapéutica o de seguridad.
Por supuesto, los biomarcadores se pueden utilizar también en investigación como criterios de valoración indirectos o medidas subrogadas de un desenlace3. Pero que sean útiles en investigación no implica que lo sean en la práctica clínica.
Aunque un mismo biomarcador pueda ser empleado para varias de estas aplicaciones, es importante obtener evidencia de su utilidad para cada una4. Es más, aunque puede parecer que existe un solapamiento entre las definiciones de los tipos de biomarcadores en cuanto a su aplicación, existen características distintivas para cada uso particular.
La validación de un biomarcador se refiere a la demostración, mediante métodos estadísticos robustos, de la asociación entre un biomarcador y un desenlace clínico. Esta asociación es independiente del tratamiento (biomarcadores diagnósticos o pronósticos), de la predicción del efecto de un tratamiento sobre un criterio clínico de valoración indirecta (predictivos), o de la posibilidad de reemplazar un criterio clínico para valorar los efectos de un tratamiento (medidas subrogadas)5. Un biomarcador validado puede facilitar el tratamiento dirigido, mejorar el diagnóstico clínico y servir como factor pronóstico o predictivo de un determinado desenlace. Por consiguiente, los estudios de validación, tanto analíticos como clínicos, son fundamentales. Una validación inadecuada de un biomarcador puede tener consecuencias importantes en el diagnóstico, tratamiento y seguimiento de muchos pacientes, por lo que debe ponerse especial interés en realizar estos análisis de forma correcta para que los biomarcadores sean aplicables en los pacientes y pueda generarse evidencia sobre su utilidad clínica.
Proceso de implementación de biomarcadores en la práctica clínicaLa adopción de un biomarcador en la práctica clínica es un proceso complejo y requiere múltiples pasos para garantizar la seguridad y fiabilidad de los resultados3,4. En general, este proceso consta de las siguientes fases (fig. 2): 1) descubrimiento, 2) desarrollo, 3) validación y 4) demostración de la utilidad clínica
DescubrimientoLa primera fase consiste en la identificación de los biomarcadores y en su definición como expresión génica, nivel de proteína y tipo de tejido o fluido en el que se realizará la medición. En esta fase se debe elegir qué tipo de biomarcador se está buscando: diagnóstico, pronóstico o predictivo, e identificar el tipo de muestra biológica en donde tiene sentido medirlo. En este paso se utilizan herramientas de genómica, transcriptómica, proteómica y metabolómica para apoyar que el biomarcador y el tipo de muestra elegidos representan el proceso fisiológico que se pretende medir.
Para saber si esta fase se ha cumplido con éxito es importante que haya consenso en que el biomarcador y el tipo de muestra elegidos representan el proceso fisiológico que se pretende medir.
DesarrolloEl objetivo de esta fase es definir el procedimiento experimental para medir la molécula objeto de interés y optimizar el método analítico para obtener resultados fiables. Son estudios de puesta a punto que a veces llevan mucho tiempo. En ocasiones, se minusvalora la importancia de esta fase, por lo costoso de la técnica, y se pasa a la siguiente etapa directamente.
ValidaciónEl valor de los biomarcadores en el diagnóstico, evaluación y pronóstico de los pacientes depende de la demostración previa de la validez de su asociación con una enfermedad específica o una manifestación concreta de esa enfermedad. La validación es el proceso que permite establecer que el rendimiento de una prueba es aceptable para la finalidad prevista. La validación interna analiza el rendimiento del test en la muestra de desarrollo, mientras que la externa lo hace en una muestra independiente. Además, en el caso de biomarcadores es preciso diferenciar dos aspectos de validación: la validación analítica y la clínica6.
La validación analítica es la exactitud con la que el biomarcador identifica el resultado de interés (gen o proteína específicos) y el proceso biológico en estudio. El objetivo es definir las características técnicas del biomarcador y no su utilidad. Es decir, establecer la exactitud, precisión, sensibilidad, reproducibilidad y estabilidad del biomarcador que garantizan una medición coherente con los valores verdaderos desconocidos (tabla 1)6,7.
Mediciones de la validación analítica
Medición | Definición |
---|---|
Exactitud | Proximidad del valor medido al valor real (concentración) |
Precisión | Proximidad entre concentraciones individuales de mediciones repetidas |
Sensibilidad | Concentración más baja que puede medirse con exactitud y precisión |
Reproducibilidad | Precisión de la medida en diferentes condiciones (días, observadores) |
Estabilidad | Degradación del biomarcador desde su extracción a su análisis |
Este tipo de validación puede verse afectada por diferentes factores7, y debe incluir también la determinación del rango de detección y la reproducibilidad. La Administración de Alimentos y Medicamentos de los EE. UU. (FDA) y la Agencia Europea de Medicamentos (EMA) han publicado algunas guías metodológicas sobre estos procesos8,9.
La validación clínica pretende demostrar la asociación entre el biomarcador y el resultado de interés, así como su utilidad. Es decir, si el biomarcador identifica, de forma precisa y fiable, un trastorno definido clínica o biológicamente y si es capaz de discriminar entre grupos con características clínicas o biológicas diferentes. Se basa en la validación externa y puede realizarse con distintos diseños en función del tipo de biomarcador, objetivos, tipo de muestra, tamaño etc.6,10
Los principales parámetros de validez clínica son la sensibilidad (proporción de casos con test positivo) y la especificidad (proporción de «no casos» con resultado negativo). Otros parámetros importantes son la reproducibilidad o capacidad de un biomarcador de ofrecer los mismos resultados en condiciones similares y los valores predictivos o medida del comportamiento de una prueba en distintos contextos10. El biomarcador debe demostrar un rendimiento preciso y fiable en comparación con un patrón de referencia. Para ello, se utilizan curvas receiver operating characteristics (ROC) y su área bajo la curva (AUC) o capacidad de discriminación entre casos y no casos, que debe acercarse lo más posible a 1.6
Utilidad clínicaLos biomarcadores deben ser adecuadamente validados antes de ser empleados en la clínica. La evaluación de la utilidad clínica valora la capacidad del biomarcador para ofrecer información útil sobre el diagnóstico, tratamiento o prevención de una enfermedad11. Pretende confirmar si los resultados del biomarcador modifican el manejo del paciente; es decir, si son útiles para orientar las decisiones clínicas y obtener mejores resultados en comparación con los que se obtendrían si no se aplicaran los biomarcadores. Para evaluar la posibilidad de usar el biomarcador en la práctica clínica, se deben identificar escenarios en los que el biomarcador mejore los resultados del paciente. El mejor contexto para ver esto es incluir el biomarcador para estratificar los resultados de una prueba diagnóstica o de un ensayo clínico de un fármaco6.
A pesar del gran desarrollo de la biología molecular y de la abundancia de biomarcadores candidatos, la realidad es que los requisitos aplicados para su uso son escasos. En general, se exige una demostración de la sensibilidad analítica y de la precisión en un número limitado de muestras. Sin embargo, la demostración de su rendimiento diagnóstico en un estudio de validación clínica adecuado no es una exigencia actual y algunos autores reconocen que muchos biomarcadores se implementan de forma demasiado precoz y sin una evaluación previa adecuada. La falta de estudios rigurosos de validación puede deberse a múltiples razones como las siguientes: desconocimiento, por parte de investigadores y clínicos, de la metodología adecuada; desarrollo metodológico heterogéneo sin aplicación en los marcos normativos existentes; normativa centrada en la validación analítica; falta de análisis de cuestiones preanalíticas, y variación biológica. Por último, los estudios de validación clínica son muy escasos probablemente debido a los requisitos metodológicos específicos que conlleva el diseño y análisis de este tipo de estudios y a la dificultad de encontrar patrones oro adecuados7,12.
Marco teórico para la validación de biomarcadoresA pesar de que, por el momento, no existe un marco regulatorio común para la evaluación de biomarcadores, se han realizado algunas propuestas metodológicas para facilitar su desarrollo e implementación7,12. Es importante tener en cuenta que la implementación de un nuevo biomarcador es un proceso cíclico que comienza con el reconocimiento de una necesidad no cubierta, seguido de un amplio proceso de evaluación y aprobación.
En la tabla 2 se presentan los aspectos a considerar en las distintas fases a modo de aproximación metodológica para el desarrollo e implementación de un biomarcador12.
Aproximación metodológica para el desarrollo e implementación de biomarcador
Fase | Aspectos por considerar |
---|---|
Necesidad clínica | Identificar una necesidad no cubiertaPoblación diana, práctica habitualSoluciones actualesResultados esperadosBarreras |
Validación analítica | Sensibilidad y especificidadRango de determinaciónLinealidadFiabilidad y precisiónEstabilidad, interferenciasConsistencia |
Factores preanalíticos | Recogida de muestrasProcesamientoTransporte y almacenamiento |
Variación biológica y factores clínicos | Variabilidad circadiana y diariaEdad, sexo y pesoEmbarazoFármacos, cirugía mayor y otras condiciones |
Interpretabilidad | Distribución entre individuos sanosDistribución en la población dianaDefinición de normalidad-riesgo |
Rendimiento o utilidad diagnóstica y pronóstico | Población y selección de pacientesDeterminación de la prueba índice y patrón de referenciaRecogida y análisis de los datosCálculo de los parámetros de validez |
Factores posanalíticos | Plazos de entregaPresentación de resultadosControl de calidad |
Resultados clínicos y en salud | Morbilidad y mortalidadPROM, calidad de vidaMayor precisión en la evaluación de riesgosMayor rapidez en el diagnósticoSimplificación de los procesosCostes |
PROM: Patient Reported Outcome Measures.
Fuente: Kolev et al.12
La validación de biomarcadores presenta desafíos metodológicos importantes. Por el momento no existen normas definidas sobre la evaluación y adopción de biomarcadores y criterios de valoración indirectos (surrogate endpoints) en ausencia de datos robustos de validación. Uno de los grandes desafíos de la validación es la ausencia de muestras biológicas de alta calidad y de medidas estandarizadas de respuesta en los ensayos clínicos.
Además, las técnicas ómicas permiten la medición simultánea de múltiples variables (genes, polimorfismo de un solo nucleótido [SNP]), por lo que el biomarcador puede estar constituido, no por un único gen, sino, por ejemplo, por un microarray de 70 genes. Esto multiplica la dificultad de validación de los biomarcadores, ya que la metodología estadística habitual está pensada para una única variable (una hipótesis para cada biomarcador) y no para múltiples variables (una hipótesis para un conjunto de X genes).
Por consiguiente, la validación de biomarcadores presenta algunas características diferenciales que deben tenerse en cuenta a la hora de realizar el análisis estadístico13,14 y que se presentan a continuación (tabla 3).
Dificultades en la validación de biomarcadores y posibles abordajes
Problema | Posible origen | Abordaje metodológico |
---|---|---|
Observacionescorrelacionadas | Múltiples observaciones por sujetoMúltiples lesiones por sujeto | Modelos lineales mixtos (estructura de correlación) |
Multiplicidad | Múltiples biomarcadores o desenlaces | Métodos que controlen la tasa de falsos positivos |
Múltiples desenlaces | Interés en más de un desenlace | Medidas compuestasPriorización de desenlaces |
Sesgo de selección | Datos retrospectivos o estudios observacionales | Modelos multivariantesMuestras pareadasÍndice de propensión |
Fuente: Ensor13
En los estudios de biomarcadores es habitual disponer de observaciones múltiples de un mismo parámetro; por ejemplo, la medición de marcadores tumorales de distintas muestras anatomopatológicas de un mismo paciente o la medición repetida de un mismo marcador a lo largo del tiempo (estudios de seguimiento). En estos casos, las observaciones (mediciones de un biomarcador) no son independientes, sino que están correlacionadas.
El análisis de las observaciones correlacionadas mediante los métodos estadísticos tradicionales (concebidos para observaciones independientes) aumenta el riesgo de error de tipo I y, por tanto, la probabilidad de obtener asociaciones espurias o falsos positivos. Por consiguiente, es necesario utilizar métodos que tengan en cuenta la correlación intrasujeto (estructura de varianza-covarianza), como los modelos lineales mixtos. Las comparaciones basadas, por ejemplo, en modelos de ecuaciones de estimación generalizada (GEE) ajustan la dependencia de las observaciones permitiendo obtener valores p e intervalos de confianza más realistas.
MultiplicidadLos estudios de validación de biomarcador tienen distintas fuentes de multiplicidad:
- •
Múltiples marcadores: combinación de genes, SNP.
- •
Múltiples formas de medir un biomarcador.
- •
Múltiples puntos de corte (biomarcador continuo).
La presencia de multiplicidad demanda la utilización de procedimientos estadísticos para controlar la tasa de falsos positivos.
En los análisis estadísticos empleamos el nivel de significación (valor p) para decidir si los resultados observados se deben al azar. El contraste de hipótesis calcula cuál es la probabilidad de observar una asociación entre dos variables, y se rechaza la hipótesis de no asociación si el valor de probabilidad es inferior a uno prefijado (habitualmente 0,05).
La hipótesis nula de la validación es que el biomarcador en cuestión no tiene efecto sobre el pronóstico de la enfermedad, la respuesta terapéutica o el proceso biológico. La utilización de más de un contraste de hipótesis incrementa la probabilidad de encontrar un resultado estadísticamente significativo. Es decir, cuantos más contrastes realicemos, más probabilidades tendremos de encontrar algún tipo de asociación (mayor probabilidad de falsos positivos). Es lo que se conoce en estadística como «comparaciones múltiples».
Las comparaciones múltiples aumentan la probabilidad de asociaciones espurias (falsos positivos), por lo que debe ajustarse la tasa de error de tipo I. Dos conceptos importantes en este tipo de análisis son la tasa de error familiar (Family Wise Error Rate [FWER]) y la tasa de descubrimiento falso (False Discovery rate [FDR]). La FWER se define como la probabilidad de que ocurra al menos un falso positivo, mientras que la FDR es la proporción esperada de errores de tipo I o probabilidad de que una hipótesis nula rechazada sea cierta.
Existen diferentes métodos de ajuste de la tasa de error de tipo I. La elección de uno u otro depende de distintos factores, como la naturaleza exploratoria o confirmatoria del análisis, o el número de contrastes previstos. Se han desarrollado árboles de decisión para elegir el método adecuado15 e incluso calculadoras en línea para comparaciones múltiples16.
Los métodos de ajuste convencionales controlan la tasa de falsos positivos o FWER y se basan en el rechazo de la hipótesis nula con valores p más bajos. Uno de los más utilizados es el de Bonferroni que consiste en dividir el nivel de significación habitual (α) entre el número de comparaciones realizadas (n) rechazando las hipótesis nulas cuyos valores p sean inferiores al cociente α/n en lugar de α. La reducción del nivel de significación disminuye la probabilidad de falsos positivos, pero también la potencia estadística para detectar diferencias reales, lo que limita su aplicabilidad15,17.
Los métodos de ajuste del FDR se han convertido en una alternativa habitual a la corrección de Bonferroni, especialmente en estudios de genómica. El objetivo del control del FDR es conseguir que, entre las pruebas declaradas significativas, la proporción de hipótesis nulas verdaderas sea inferior a un umbral especificado. El procedimiento de Benjamin-Hochberg controla el FDR mediante la utilización del q-value, el análogo FDR del valor p. El q-value se define como la proporción esperada de falsos positivos entre todos los test iguales o más extremos que el observado. Un valor p del 5% significa que el 5% de todas las pruebas serán falsos positivos; un valor q del 5% significa que el 5% de los resultados significativos serán falsos positivos15,17.
Estos métodos se basan en diferentes supuestos y tienen distintos niveles de complejidad y poder, pero todos apuntan a equilibrar la compensación entre los errores de tipo I y tipo II.
Múltiples medidas de resultadoLa utilización de distintas medidas de resultado también es una fuente de multiplicidad.
En la literatura no es infrecuente encontrar estudios en los que se emplean simultáneamente diferentes medidas de resultado sin corregir por multiplicidad. Por ejemplo, en un mismo estudio pueden usarse como medidas de resultado la supervivencia global, la supervivencia libre de progresión, la tasa de remisión y la tasa de enfermedad estable. Este problema de multiplicidad es aún mayor cuando la definición de los intervalos «tiempo a evento» varía en función de la fecha elegida como inicio de la exposición (fecha de diagnóstico, de inicio de tratamiento, de cirugía, etc.).
En estos casos, es difícil alcanzar un consenso sobre la validez de un biomarcador o sobre qué decisión tomar cuando los hallazgos de diferentes medidas de resultado son contradictorios. Se han propuesto diferentes abordajes como:
- •
Utilizar una medida de resultado como «fundamental», ajustar el análisis por comparaciones múltiples, y considerar el resto de los desenlaces como biológicamente relacionados.
- •
Combinar diferentes medidas de resultado en un único desenlace a evaluar.
- •
Priorizar los desenlaces y realizar el análisis del primero. Si los resultados son significativos, dar por finalizado el análisis, si no lo son pasar al segundo desenlace y así, sucesivamente.
Es fundamental no hacer más contrastes de hipótesis de los precisos. Se debe elegir un desenlace y aceptar los resultados obtenidos con el fin de conseguir la reproducibilidad y coherencia de los datos.
Sesgos de selecciónEn epidemiología molecular es habitual utilizar diseños retrospectivos por razones de viabilidad, ya que los datos retrospectivos suelen ser más fácilmente accesibles y facilitan la realización de análisis «tiempo a evento». Los diseños retrospectivos presentan limitaciones que deben ser tenidas en cuenta.
Por otra parte, los diferentes estratos de los biomarcadores (p. ej., normal frente a sobreexpresión), pueden no ser homogéneos respecto a otros posibles predictores de los desenlaces en estudio. El hecho de que los predictores de eficacia clínica no estén equilibrados entre los distintos niveles de un biomarcador no es un sesgo de selección sensu strictu, pero sí puede confundir las asociaciones. La consecuencia es un problema de inferencia y una limitación de la capacidad de los investigadores para establecer el valor pronóstico y predictivo de un biomarcador.
Por consiguiente, la validación de estos biomarcadores debe abordar estos problemas mediante el uso de métodos estadísticos que permitan controlar la confusión como:
- •
Modelos multivariantes para controlar los distintos factores de confusión.
- •
Muestras pareadas por los factores que pueden afectar a los resultados.
- •
Índice de propensión para simular las condiciones de un ensayo clínico controlado, el patrón oro para estimar un efecto.
Además de los desafíos metodológicos comentados, es importante tener en cuenta que también puede haber diferencias en el diseño de los estudios de validación en función del tipo de biomarcador objetivo de análisis.
En el caso de los biomarcadores pronósticos, el objetivo es demostrar una asociación entre el biomarcador, o su cambio a lo largo del tiempo, y la aparición de un resultado clínico independiente del tratamiento. Inicialmente, los estudios retrospectivos pueden aportar suficientes datos para este análisis. Sin embargo, la validación debe realizarse de forma multicéntrica o bien con técnicas de remuestreo si solo se dispone de un único centro. Una vez confirmada la validación multicéntrica, la prueba definitiva de la utilidad clínica de un biomarcador debe efectuarse en ensayos clínicos prospectivos y aleatorizados. Los biomarcadores pronósticos son relativamente fáciles de identificar, pero rara vez se hace validación multicéntrica5.
Los biomarcadores predictivos son aquellos en los que el valor basal o los cambios a lo largo del tiempo predicen la eficacia o toxicidad de un tratamiento. El análisis estadístico de estos biomarcadores requiere de ensayos clínicos controlados y aleatorizados, preferentemente con un diseño de interacción, para averiguar si el estatus del biomarcador modifica la asociación entre el tratamiento y el efecto observado.
Una alternativa es utilizar los llamados diseños de «selección» que solo incluyen pacientes con biomarcador positivo y que sirven para confirmar la utilidad del biomarcador para identificar las poblaciones en las que un tratamiento puede ser eficaz. Sin embargo, en estos diseños no puede establecerse realmente que el biomarcador sea predictivo, ya que no se dispone de información sobre la ausencia de eficacia en pacientes con biomarcador negativo.
Dada la dificultad para realizar estudios randomizados para validar biomarcadores predictivos, lo que muchas veces se utiliza es una validación retrospectiva mediante la evaluación de ensayos clínicos previos para valorar si existe un efecto diferencial del tratamiento en función de la presencia de un biomarcador. Por tanto, la validación de un biomarcador predictivo es costosa y necesita de ensayos aleatorios y metaanálisis5.
ConclusiónEl gran desarrollo de biomarcadores facilita la toma de decisiones relacionadas con el diagnóstico, el tratamiento y el pronóstico de la enfermedad y allana el camino hacia una medicina personalizada, o de precisión. No obstante, el proceso de desarrollo e implementación de biomarcadores es complejo y requiere múltiples pasos para garantizar la seguridad y fiabilidad de los resultados. Además, los estudios de rendimiento diagnóstico deben ser un requisito importante para la implementación de un biomarcador. Estos estudios presentan características diferenciales y requisitos metodológicos peculiares que deben tenerse en cuenta a la hora de efectuar, de forma adecuada, la validación de biomarcadores y poder garantizar su utilidad en la práctica clínica.
FinanciaciónEste trabajo no ha recibido financiación.
Conflicto de interesesLas autoras declaran no tener conflictos de intereses.