Analizar la sensibilidad al cambio del cuestionario Fibromyalgia Health Assessment Questionnaire (FHAQ) en un grupo de pacientes con fibromialgia (FM).
MétodosEstudio observacional, prospectivo longitudinal, incluido en el Proyecto ICAF (Índice combinado de afectación en pacientes con fibromialgia), realizado en 15 centros españoles. Se estudió de forma consecutiva a 232 pacientes con FM con una edad media de 47 años, el 98,3% mujeres, que se evaluaron en una visita basal y 3 meses después de que se les instaurara un tratamiento según práctica médica habitual. El análisis estadístico incluyó: comparación de medias, respuesta media estandarizada (RME), medida basal estándar (DE), coeficiente de correlación intraclase (R), error estándar de medida (EEM), diferencia mínima detectable (DMD) y proporción de cambio real.
ResultadosLa diferencia de puntuación media del FHAQ en la visita basal y a los 3 meses fue de 0,098 (IC del 95%, 0,034-0,16) con una p<0,003. Sin embargo, la RME fue de 0,21 (cambio pequeño); DE=0,57, R=0,81, EEM=0,25, DMD=0,69. La proporción de cambio real fue del 17% (39 pacientes). No obstante, el sentido del cambio fue positivo en 28 casos (menor puntuación a los 3 meses) y negativo en los otros 11 (mayor puntuación a los 3 meses).
ConclusionesLa puntuación a los 3 meses fue significativamente mejor que la basal, pero con los resultados de este estudio no se puede considerar que el FHAQ sea suficientemente sensible al cambio como para recomendar su uso en estudios longitudinales. El hecho, conocido, de que muchos pacientes pueden empeorar con el tratamiento empleado ha ido en detrimento de la valoración psicométrica del FHAQ.
To analyze the sensitivity to change of the Fibromyalgia Health Assessment Questionnaire (FHAQ) in a group of patients with fibromyalgia (FM).
MethodsObservational, prospective and longitudinal study related to the project ICAF was taken part in 15 Spanish centers. 232 patients were included and diagnosed of FM: 98.3% were women, the mean age was 47years old, they were analyzed at a basal visit and 3months visit, afterwards an appropriated treatment was prescribed. The statistical analysis was performed including: mean comparison, mean standardized response (RME), basal standard media (DE), intraclass correlation coefficient (R), standard error of the mean (EEM), minimal detectable difference (DMD) and percentage change in real.
ResultsThe difference in mean comparison of the FHAQ in the baseline visit and the 3monts visit was of 0,098 (IC 95%: 0,034-0,16), with a P<.003. Nevertheless the RME was 0.21, a slightly change, the DE=0.57, R=0.81, EEM=0.25, and the DMD=0.69. The percentage change in real was 17% (39 patients). But the sense of the change was positive in 28cases (less punctuation in the 3monts visit) and negative in other 11cases (higher punctuation in the 3monts visit).
ConclusionsThe punctuation in the 3months visit was significant better than the basal, but the results of this study do not let it to consider that the FHAQ have enough change susceptibility to recommend it in longitudinal studies. The well knowing fact, some patients can become worse with the treatment prescribed would be to the detriment of the FHAQ psychometric value.
La valoración de la capacidad funcional en la fibromialgia (FM), como en otras patologías crónicas en las que la movilidad se encuentra limitada por el dolor y otros síntomas, resulta clave para estimar la gravedad de la enfermedad y su pronóstico. Además, es muy importante para los pacientes, ya que les afecta tanto en el plano personal, como en el social y el laboral1. Y de la misma manera para la sociedad, ya que tiene implicación en los costes indirectos de la enfermedad, al ser causa frecuente de bajas laborales o bajo rendimiento en el trabajo en este tipo de pacientes2.
Sin embargo, pese a su incuestionable importancia en el manejo de la FM, no existen apenas cuestionarios para medir la capacidad funcional específicamente en la FM. Con frecuencia, se ha utilizado para este fin la escala de función física del Fibromyalgia Impact Questionnaire (FF-FIQ)3, pese a que su validez para medir discapacidad es deficiente. También se han usado otros cuestionarios generales, como el cuestionario 36-Short Form Health Survey (SF-36), no exento de limitaciones igualmente4. En otras ocasiones se ha utilizado el Health Assessment Questionnaire (HAQ)5, cuestionario que, si bien mide de forma específica la capacidad funcional, en realidad está diseñado para pacientes con artritis reumatoide, por lo que sus ítems no son siempre aplicables a los pacientes con FM.
Sobre la base de lo anteriormente expuesto, en el año 2000 se propuso la utilización del Fibromyalgia Health Assessment Questionnaire (FHAQ)4 para intentar medir de forma más adecuada la capacidad funcional en la FM. El FHAQ es un cuestionario de 8 ítems derivado del HAQ, cuya versión en castellano ha mostrado una validez de constructo superior al FF-FIQ y similar a la del HAQ, con la ventaja de ser más breve, más sencillo de responder y más fácilmente cuantificable6.
Además de mostrar su validez para medir un constructo (en este caso la capacidad funcional), una escala de estas características debe probar su capacidad para detectar cambios en la situación a lo largo del tiempo, requisito necesario si se pretende utilizarla de forma habitual en la práctica clínica. Es decir, el cuestionario debe ser sensible a los previsibles cambios en la discapacidad a lo largo del tiempo, variando su puntuación de forma coherente con el estado del paciente7. No existe a pesar de ello ningún trabajo en la literatura que estudie la sensibilidad al cambio del FHAQ. Por ello, el objetivo de este estudio es analizar la sensibilidad al cambio del cuestionario FHAQ, para saber si puede ser una herramienta útil para detectar cambios en la actividad de la FM a lo largo del tiempo en función del estado del paciente.
El estudio ICAF (Índice combinado de afectación en pacientes con fibromialgia)8, aunque no fue diseñado específicamente para estudiar la sensibilidad al cambio del FHAQ, permite realizar un análisis en este sentido. De este modo, puede explorarse el comportamiento de la escala respecto de los cambios en la salud de los pacientes para completar su validación y aconsejar o desaconsejar su uso de forma general.
MétodosDiseñoSe realizó un estudio observacional, prospectivo y longitudinal, en el que se reclutó a pacientes consecutivos procedentes de consultas externas de reumatología de 15 hospitales en España (proyecto ICAF, fase II); la recogida de datos tuvo lugar entre octubre de 2008 y junio de 2009. Todos los pacientes firmaron un consentimiento informado y el protocolo del estudio fue aprobado por los comités éticos de investigación clínica de los hospitales de los investigadores principales.
Pacientes y adquisición de variablesSe incluyó, de forma consecutiva, a pacientes mayores de 18 años y menores de 65 años, diagnosticados de FM según criterios ACR 1990, a los que según práctica clínica habitual se les hubiese introducido uno de los siguientes fármacos: antidepresivo tricíclico, otro antidepresivo o pregabalina, solos o en combinación. Cualquiera de estos fármacos debía ser introducido de acuerdo con la práctica clínica habitual, es decir, el reumatólogo, en función de los síntomas y las características del paciente, prescribía el tratamiento que en su opinión resultaba adecuado, sin perjuicio de que adicionalmente los pacientes mantuvieran tratamientos con analgésicos, tranquilizantes, ejercicio, terapia psicológica u otros. Una vez establecido el tratamiento, si era alguno de los indicados en el protocolo, el paciente era seleccionado para el estudio. Se estima que el tratamiento con antidepresivos y/o pregabalina supondrá un cambio perceptible en la sintomatología del paciente, ya que son los fármacos que reducen la intensidad de los síntomas y, por consiguiente, con un previsible impacto en su capacidad funcional. Se consideraron criterios de exclusión la presencia de patología concomitante que produjera incapacidad funcional (enfermedades reumáticas inflamatorias, problemas cardiovasculares, obesidad mórbida) y presentar problemas psiquiátricos severos que no estuvieran previamente controlados por tratamiento médico. También se excluyó a aquellos pacientes que estuvieran involucrados en procedimientos legales (litigios, incapacitación, minusvalías).
Se recogieron variables sociodemográficas y clínicas que incluyen el sexo, la edad, la fecha de inicio de la enfermedad o la situación laboral, siguiendo un cuestionario estandarizado. Los participantes en el estudio completaron también una serie de cuestionarios autoadministrados, entre los que se incluía el FHAQ, que se puntúa calculando la media de sus 8 ítems. El cuestionario fue completado en 3 ocasiones: por primera vez al incluir a la paciente en el estudio (visita 1), una semana más tarde, en el momento en el que se instauraba el tratamiento se volvía a completar el cuestionario para evaluar la fiabilidad test-retest (visita 2) y, por último, se volvía a aplicar la prueba a los 3 meses de haber sido iniciado el tratamiento prescrito (visita 3).
Se define cambio de salud como cualquier cambio de la situación clínica del paciente, lo que obliga bien a la pauta de nuevos fármacos, modificación de los previos prescritos o bien la realización de nuevos procedimientos diagnósticos, por el desarrollo de comorbilidades, o la necesidad de remitir al paciente a otro especialista para el manejo de su patología.
Análisis estadísticoEn primer lugar, se hizo un análisis descriptivo de los datos sociodemográficos de la muestra, cuyos resultados se muestran en forma de medias con sus correspondientes desviaciones estándar (DE) y porcentajes.
Se calculó la puntuación media del FHAQ basal y a los 3 meses para estimar el cambio estadístico entre ambas puntuaciones.
Para valorar la sensibilidad al cambio, se evaluaron 3 posibilidades de análisis diferentes, en función del diseño del estudio9. Como no se dispone de un estándar externo con el que medir la capacidad funcional, se utilizó el análisis para muestras homogéneas con cambio previsto homogéneo. Los estadísticos utilizados fueron coeficientes a nivel de grupo basados en el tamaño del efecto, entre ellos la respuesta media estandarizada (RME: cambio medio/desviación estándar del cambio). Según la literatura, los valores de RME de 0,20, 0,50 y 0,80 representan una sensibilidad al cambio pequeña, moderada e importante, respectivamente10.
En opinión de algunos autores9, los cambios significativos a nivel de grupo no son útiles para evaluar el cambio individual y por ello subrayan la importancia de estudiar la sensibilidad de la medida a nivel del paciente concreto. Con esta finalidad se han propuesto diversos índices, como la diferencia mínima detectable (DMD=1,96×√2×EEM), que también se estimó. La DMD representa el cambio mínimo de puntuación, que probablemente refleja un cambio real superior al error de medida. Para su cálculo se emplearon la desviación estándar basal (DE), el coeficiente de correlación intraclase (R) y el error estándar de medida (EEM=DE×[(1–R)1/2]).
Un método complementario es la proporción de cambio fiable o que supera la DMD. Este índice representa el porcentaje de pacientes que muestran un cambio real, superior al esperable por error.
ResultadosEstudio descriptivoSe reclutó a un total de 232 pacientes, de los que el 98,3% eran mujeres. La edad media ± DE a la primera visita fue de 47±8 años. El tiempo de evolución del dolor en el momento del estudio era de 9±8 años y el de evolución de la FM de 4±4 años. En cuanto a la situación laboral, la mayoría de los pacientes eran trabajadores activos (56%) y amas de casa (22%), un 14% estaba jubilado, fundamentalmente por la enfermedad, y un 6,5% de los pacientes estaba en el paro. Las variables sociodemográficas y las características basales de la muestra se recogen en la tabla 1.
Características sociodemográficas y clínicas de los pacientes
Variable | n | % |
Hombre | 4 | 1,7 |
Mujer | 228 | 98,3 |
Trabajador activo | 130 | 56,3 |
Jubilado por enfermedad | 31 | 13,4 |
Jubilado por edad y prejubilados | 2 | 0,9 |
Ama de casa | 51 | 22,1 |
Parado | 15 | 6,5 |
Otra situación laboral | 2 | 0,9 |
Otras | n | Media (años) | DE |
Edad en la primera visita | 232 | 47 | 8 |
Edad de comienzo del dolor generalizado | 224 | 37 | 10 |
Edad del diagnóstico de la FM | 227 | 43 | 8 |
Tiempo de evolución del dolor | 224 | 9 | 8 |
Tiempo de evolución de la FM | 227 | 4 | 4 |
DE: desviación estándar; FM: fibromialgia; n: número total; %: porcentaje.
La diferencia de puntuación media del FHAQ en la visita basal y a los 3 meses fue de 0,098 (IC del 95%, 0,034-0,16) con una p<0,003. La RME fue de 0,098/0,47=0,21 (cambio pequeño).
La desviación de la medida basal estándar fue DE=0,57 y el coeficiente de correlación intraclase R=0,81. Esto supone un EEM= 0,25. Y todo ello implica que la diferencia mínima detectable (DMD) es de 0,69.
Con estos datos, la proporción de cambio real es del 17% (39 pacientes de los 232 que componen la muestra). No obstante, el sentido del cambio fue positivo en 28 casos (menor puntuación a los 3 meses) y negativo en los otros 11 (mayor puntuación a los 3 meses).
DiscusiónEn este estudio hemos analizado la sensibilidad al cambio del FHAQ, es decir, hemos analizado el comportamiento de la escala respecto de los cambios en la salud esperables en los pacientes con FM tras tratamiento médico habitual.
La puntuación del FHAQ mejora significativamente a los 3 meses cuando se utiliza una comparación de medias; sin embargo, el valor tan bajo obtenido en relación a la RME en este estudio indica que el FHAQ muestra una mínima sensibilidad al cambio en la muestra analizada. Es decir, que existe la posibilidad de que el instrumento puede no ser capaz de detectar con gran fiabilidad un cambio de tipo estadístico significativo a nivel de grupo.
En cuanto a la proporción de cambio real (clínico y no solo estadístico), menos de un quinto de la muestra mostró una diferencia superior a la esperada por error, y además la respuesta no fue homogénea, ya que unos presentaban mejoría y otros empeoraban.
Todos estos resultados deben interpretarse con cautela, ya que los análisis utilizados para el estudio parten de la asunción de que los pacientes son homogéneos, y el cambio previsto también lo es. En nuestros resultados los pacientes son razonablemente homogéneos respecto de algunas de sus características demográficas y basales, pero presentan una variabilidad muy importante en cuanto a la respuesta al tratamiento médico habitual, ya que solo un cierto porcentaje de pacientes responde al tratamiento. Ese porcentaje fue estimado en un 25% de los tratados con antidepresivos19. Esta variabilidad va en detrimento de los índices utilizados, que por ese motivo pueden haber resultado anormalmente disminuidos.
Los criterios de selección del estudio ICAF solo garantizan que en todos los pacientes la intervención ha sido homogénea, en el sentido de que en todos los casos se ha introducido, por primera vez, alguno de los tratamientos farmacológicos considerados eficaces. Sin embargo, al enmarcarse la intervención en una práctica clínica habitual, se permite también la utilización de otras terapias no farmacológicas. Diversos estudios han mostrado la utilidad de estas terapias en la mejora de la capacidad funcional, especialmente el tratamiento cognitivo conductual11, los programas de ejercicio físico12, o la combinación de ambos13. Aunque no hubo ningún paciente en tratamiento psicológico, sí los hubo que realizaban ejercicio y esto pudo influir también en que el cambio esperable no fuera homogéneo, ya que los pacientes que estuvieran recibiendo entrenamiento para realizar ejercicio de forma habitual y adecuada tendrían un cambio esperable en su capacidad funcional mayor que aquellos que solo han recibido tratamiento farmacológico14. Por tanto, es probable que no se cumpla la asunción necesaria para calcular la potencia estadística. Además, esto explicaría que la dirección del cambio observado fuera distinta, siendo positiva unas veces y negativa otras, ya que la mejoría observada en algunos pacientes podría deberse a los efectos positivos de otras terapias (p. ej., estar haciendo un programa de ejercicio), mientras que el cambio negativo podría también estar motivado por lo contrario (dejar de realizar ese ejercicio o conflictos personales aparecidos o agravados durante ese periodo).
Por otra parte, se podría pensar que el intervalo transcurrido desde la intervención (solo 3 meses) es insuficiente para observar cambios significativos y que los resultados serían diferentes si se ampliara este intervalo. Sin embargo, este razonamiento no aplica en este caso concreto, ya que, precisamente, los fármacos ensayados han mostrado eficacia a corto plazo, normalmente de 3 a 6 meses, y no a largo plazo15,16.
Nuestra hipótesis explicativa es que, efectivamente, se detecta un cambio significativo desde el punto de vista de comparación de medias, pero no desde el punto de vista de la diferencia mínima detectable, la desviación de la medida basal estándar y del coeficiente de correlación intraclase, probablemente no por una falta de sensibilidad del instrumento, sino porque los fármacos utilizados para el tratamiento de la FM producen una mejoría inconsistente de los síntomas, que no se acaba de traducir en una mejoría relevante en la capacidad funcional, como ya se ha publicado en un estudio en el que al utilizar el HAQ en pacientes con FM se obtuvieron puntuaciones estables en el tiempo con una lenta tendencia al empeoramiento a lo largo de los años17. Los dos metaanálisis clásicos sobre antidepresivos en FM18,19 no hacen tampoco mención a mejoría en las medidas de capacidad funcional, sino a la mejoría sintomática en dolor, fatiga o calidad sueño. En cambio, otros estudios más recientes, con nuevos fármacos como duloxetina20, milnacipram21,22 o pregabalina23, sí detectan mejoría funcional, pero esta es evaluada, en casi todos los casos, con la escala de función física del SF36.
En conclusión, no existe evidencia suficiente que demuestre que el FHAQ es sensible al cambio, pero tampoco para descartar esta hipótesis, por lo que se recomienda revaluar el cuestionario en un estudio confeccionado específicamente para este fin, en el que se garantice, por una parte, la homogeneidad de la muestra en todos sus parámetros basales, y en el que la mejoría en la capacidad funcional se mida con un estándar independiente, para descartar del análisis los pacientes que no han mejorado o que han empeorado a pesar de seguir el tratamiento. El FHAQ sigue siendo un instrumento eficaz para medir la capacidad funcional de los pacientes en estudios transversales, pero con los datos de este estudio no se puede confirmar su utilidad como medida de resultados en intervenciones longitudinales.
Conflicto de interesesEl estudio ICAF ha sido financiado por el laboratorio farmacéutico Pfizer y por el Fondo de Investigación Sanitaria (FIS) PI 07/0202.
Los autores M. Gobbo, J. Esteve-Vives, J. Rivera, MA Vallejo y R. López declaran no tener ningún conflicto de intereses.
A M. Jesús García de Yébenes y a Estíbaliz Loza, de la Unidad de Investigación de la Sociedad Española de Reumatología, por su apoyo técnico y colaboración.
A los participantes del Grupo ICAF: C. Alegre (Hospital Vall de Hebron, Barcelona), R. Belenguer (Hospital 9 de Octubre, Valencia), M. Belmonte (Hospital General de Castellón, Castellón), J. Beltrán (Hospital General de Castellón, Castellón), J. Blanch (Hospital IMAS, Barcelona), J. Carbonel (Hospital IMAS, Barcelona), A. Collado (Hospital Clínic, Barcelona), P. Fernández-Dapica (Hospital 12 de Octubre, Madrid), F.M. Hernández (Hospital Dr. Negrín, Gran Canaria), A. García-Monforte (Hospital Gregorio Marañón, Madrid), T. González-Hernández (IPR, Madrid), J. González-Polo (Hospital La Paz, Madrid), C. Hidalgo (Centro Reumatológico, Salamanca), J. Mundo (Hospital Clínic, Barcelona), P. Muñoz-Carreño (Hospital General, Guadalajara), I. Vallejo (Hospital Clínic, Barcelona) y J. Vidal (Hospital General, Guadalajara).
En el Anexo 1 se incluye los componentes del grupo.