Comparar la validez de constructo de tres cuestionarios de capacidad funcional en pacientes con fibromialgia.
Pacientes y métodosEstudio multicéntrico transversal: 301 pacientes procedentes de consultas externas de reumatología de 15 centros en España completaron los cuestionarios Health Assessment Questionnaire (HAQ), Fibromyalgia Health Assessment Questionnaire (FHAQ) y la escala de función física del Fibromyalgia Impact Questionnaire (FF-FIQ), y se compararon sus puntuaciones en grupos extremos de capacidad funcional definida por las medidas externas: test de 6 minutos marcha, test de fatiga de Borg, test de flexibilidad lumbar y evaluación global de la movilidad del paciente. Se calcularon las correspondientes diferencias estandarizadas. Finalmente, se determinaron coeficientes de correlación entre las puntuaciones de los tres cuestionarios.
ResultadosLos tres cuestionarios mostraron una aceptable validez de constructo, pero los resultados del FF-FIQ fueron inferiores. La correlación entre HAQ y FHAQ fue muy elevada (0,92) y, solamente moderada entre estos dos y el FF-FIQ (0,59).
ConclusionesHAQ y FHAQ miden más adecuadamente la verdadera capacidad funcional de los pacientes que el FF-FIQ. El FHAQ, por su brevedad (solo 8 ítems) podría sustituir al HAQ en algunas ocasiones.
To compare the construct validity of three functional capacity questionnaires in patients with fibromyalgia.
Patients and methodsTransversal multicentric study of 301 patients from fifteen rheumatology outpatient clinics in Spain. Scores of Health Assessment Questionnaire (HAQ), Fibromyalgia Health Assessment Questionnaire (FHAQ) and the physical function scale of the Fibromyalgia Impact Questionnaire (PF-FIQ) were compared with extreme groups of patients defined by four external indirect measures: 6Min Walk Test, a modified Borg Fatigue Scale, Lumbar Spine Flexion Test and Patient Global Passive Mobility Assessment. Standardized differences were determined and correlation coefficients were calculated between the three questionnaires scores.
ResultsAll three questionnaires showed good construct validity, but the results obtained with the PF-FIQ were poorer. Correlations between HAQ and FHAQ were very high (0.92), but correlations between these two questionnaires and PF-FIQ were only moderate (0.59).
ConclusionsHAQ and FHAQ are more valid measures of functional capacity than the PF-FIQ. HAQ could be substituted by FHAQ in some settings because of its shorter format (only 8 items).
La fibromialgia (FM) se caracteriza no solo por dolor generalizado crónico, sino también por una gran variedad de síntomas que deterioran la salud física y psicológica de los pacientes. Uno de los aspectos más preocupantes de este deterioro es la pérdida de capacidad funcional por sus consecuencias potenciales de pérdida de autonomía de los pacientes así como por su repercusión laboral con sus correspondientes costes económicos1.
Por todo ello coincidimos con otros autores en que la evaluación de la FM debe ser multidimensional2,3, incluyendo una valoración de la capacidad funcional, generalmente mediante cuestionarios autoaplicados. Los más utilizados en nuestro medio son el Health Assessment Questionnaire (HAQ)4 y la escala de función física incluida en el Fibromyalgia Impact Questionnaire (FF-FIQ)5. Además, un grupo de investigadores ha propuesto el Fibromyalgia Health Assessment Questionnaire (FHAQ)6, un cuestionario de tan solo 8 ítems (Anexo 2) derivado del HAQ.
Tras una revisión de la literatura, no hemos encontrado estudios comparativos de las propiedades psicométricas de estos tres cuestionarios de capacidad funcional, ni tampoco nuevos estudios que confirmen la validez del FHAQ.
Validez de criterio es una propiedad psicométrica fundamental de cualquier instrumento de medida que disponga de un patrón oro (gold standard) con el que compararlo; por ejemplo si se tratara de validar un cuestionario para diagnóstico del trastorno de ansiedad generalizada, podría usarse como patrón el diagnóstico de un psiquiatra7. En el caso de la capacidad funcional, lo mismo que en el caso del dolor o la calidad de vida, no se dispone de ninguna prueba que pueda considerarse de esta manera. En estos casos cobra especial relevancia la «validez de constructo», cuyo estudio implica definir a priori el constructo a evaluar, en este caso capacidad funcional, en función de su relación con otras variables7.
Así pues, el objetivo de este trabajo es realizar un estudio comparativo de la validez de constructo de los tres cuestionarios arriba mencionados, mediante su comparación con un panel de medidas externas indirectas que, previamente, consideramos relacionadas con la capacidad funcional. En última instancia, se trata de dilucidar cuál de los tres cuestionarios mide mejor la verdadera capacidad funcional de los pacientes.
Pacientes y métodosSe trata de un estudio transversal, con participación de pacientes procedentes de consultas externas de reumatología de 15 centros en España (proyecto ICAF). Se incluyeron de manera consecutiva mujeres y hombres mayores de 18 años con diagnóstico de FM según los criterios del ACR8, entre enero y abril de 2007. Se consideraron criterios de exclusión las enfermedades incapacitantes cardio-pulmonares o de otro tipo, obesidad mórbida, enfermedades reumáticas inflamatorias y enfermedades psiquiátricas descompensadas. También se excluyeron aquellos pacientes en demandas de informes de incapacidad, litigios o cualquier tipo de compensación económica. El protocolo del estudio fue aprobado por los comités éticos de investigación clínica de los hospitales de los autores principales.
Los pacientes completaron una batería de cuestionarios que incluía la versión española del FIQ9,10 y del HAQ11. La escala de función física de la versión española del FIQ está compuesta por 10 ítems y se puntúa como en su versión original5. El HAQ está compuesto por 20 ítems y 8 cuestiones correctoras. Las restantes cuestiones correctoras, referidas a utensilios utilizados en pacientes con artritis reumatoide, fueron eliminadas por no tener utilidad en pacientes con FM. El sistema de puntuación utilizado fue el recomendado por su autor12. El FHAQ está compuesto por 8 ítems (Anexo 2), todos ellos tomados del HAQ, y se puntúa calculando la media de sus correspondientes ítems6.
El examen físico incluyó las siguientes medidas externas que se consideraron relacionadas indirectamente con la capacidad funcional: a) test de 6min marcha (T6MM), medido en metros; b) escala de fatiga de Borg modificada (Borg), de 11 puntos que se aplicó justo después del T6MM, en donde «0=sin esfuerzo» (sin fatiga durante la realización del test de la marcha) y «10=esfuerzo máximo»; c) test de flexibilidad lumbar (TFL), en centímetros; y una evaluación global de la movilidad pasiva del paciente (EGMP), que explora la movilidad de hombros, caderas y los tres segmentos del raquis y se puntúa en una escala de 11 puntos en donde «0=movilidad normal» y «10=limitación en las cinco regiones exploradas». Una descripción más detallada de estas medidas puede encontrarse en otros trabajos10,13,14.
Análisis estadístico«El constructo» definido a priori para este estudio fue que los pacientes con mayor grado de incapacidad son aquellos que caminan menos metros en el T6MM, refieren más fatiga en el test de Borg, tienen una movilidad lumbar más reducida y presentan más áreas con limitación a la movilidad pasiva en la EGMP. Así pues, se establecieron subgrupos de pacientes con puntuaciones extremas en cada una de las cuatro medidas externas: 1) «Subgrupos de peor capacidad funcional», compuesto por los pacientes en percentil ≤25 en el T6MM y/o el TFL y/o percentil ≥75 en el Borg y/o la EGMP; y 2) «Subgrupos de mejor capacidad funcional», compuesto por los pacientes en percentil ≥75 en el T6MM y/o el TFL y/o percentil ≤25 en el test de Borg y/o la EGMP. Se estudió si las puntuaciones de cada uno de los tres cuestionarios eran significativamente diferentes en cada uno de los subgrupos de mejor o peor capacidad funcional mediante la prueba t de Student. Para comparar la magnitud de las diferencias entre dichas puntuaciones se calcularon las diferencias estandarizadas correspondientes a cada uno de los cuestionarios (diferencia estandarizada=[′p<0 = 25–p≥75′]/desviación estándar).
Adicionalmente se calcularon los coeficientes de correlación de Pearson entre las puntuaciones de los tres cuestionarios y entre los cuestionarios y cada una de las cuatro medidas externas.
ResultadosSe incluyeron 301 pacientes con FM (10 varones y 291 mujeres), con una edad media de 48,7±8,5 años. Las puntuaciones de los cuestionarios y las medidas externas se muestran en la tabla 1.
Estadísticos de los cuestionarios y medidas externas indirectas de capacidad funcional
n | Media | Desviación estándar | Rango | |
Cuestionarios | ||||
FF-FIQ | 301 | 4,85 | 2,21 | 0–9,99 |
HAQ total | 300 | 1,43 | 0,58 | 0–2,750 |
FHAQ | 300 | 1,19 | 0,59 | 0–2,500 |
Medidas Externas | ||||
T6MM (metros) | 301 | 362,26 | 119,46 | 80–932 |
BORG | 301 | 4,66 | 2,16 | 0–10 |
TFL (centímetros) | 300 | 14,27 | 7,78 | 0–63 |
EGMP | 301 | 4,23 | 2,49 | 0–10 |
BORG: escala de fatiga de Borg modificada; EGMP: evaluación global de la movilidad pasiva de los pacientes; FF-FIQ: escala de función física del Fibromyalgia Impact Questionnaire; FHAQ: Fibromyalgia Health Assessment Questionnaire; HAQ: Health Assessment Questionnaire; TFL: test de flexibilidad lumbar; T6MM: test de 6 minutos marcha.
Las puntuaciones de los tres cuestionarios fueron significativamente diferentes entre los subgrupos de peor y mejor capacidad funcional (tabla 2). La magnitud de la diferencia fue similar entre HAQ y FHAQ y la de ambos fue superior a la del FF-FIQ cuando se estudiaron el T6MM, el Borg y la EGMP (tabla 2). En el TFL, la magnitud de la diferencia entre las puntuaciones de los tres cuestionarios fue similar. El estudio de correlaciones entre las puntuaciones de los cuestionarios con las cuatro medidas externas mostró resultados similares confirmando la inferioridad del FF-FIQ (tabla 3).
Diferencias estandarizadas de las puntuaciones de los cuestionarios entre los grupos extremos de capacidad funcional (mejor capacidad funcional vs. peor capacidad funcional)
HAQ | FHAQ | FF-FIQ | |
(media±DE) | (media±DE) | (media±DE) | |
T6MM | |||
Percentil ≤25 | 1,71±0,48 | 1,46±0,53 | 5,21±2,17 |
Percentil ≥75 | 1,21±0,54 | 0,94±0,51 | 4,30±1,93 |
Valor p de la diferencia | <0,001 | <0,001 | 0,007 |
Diferencia estandarizada¿ | 0,86 | 0,87 | 0,41 |
BORG | |||
Percentil ≤25 | 1,13±0,61 | 0,91±0,56 | 4,00±2,17 |
Percentil ≥75 | 1,72±0,43 | 1,44±0,54 | 5,54±1,99 |
Valor p de la diferencia | <0,001 | <0,001 | <0,001 |
Diferencia estandarizada¿ | 1,01 | 0,91 | 0,69 |
TFL | |||
Percentil ≤25 | 1,60±0,54 | 1,42±0,55 | 5,56±1,86 |
Percentil ≥75 | 1,27±0,57 | 1,03±0,55 | 4,28±2,25 |
Valor p de la diferencia | <0,001 | <0,001 | <0,001 |
Diferencia estandarizada¿ | 0,56 | 0,65 | 0,58 |
EGMP | |||
Percentil ≤25 | 1,19±0,59 | 0,94±0,56 | 4,13±2,39 |
Percentil ≥75 | 1,72±0,45 | 1,50±0,52 | 5,60±1,93 |
Valor p de la diferencia | <0,001 | <0,001 | <0,001 |
Diferencia estandarizada¿ | 0,91 | 0,95 | 0,66 |
BORG: escala de fatiga de Borg modificada; DE: desviación estándar; EGMP: evaluación global de la movilidad pasiva de los pacientes; FF-FIQ: escala de función física del Fibromyalgia Impact Questionnaire; FHAQ: Fibromyalgia Health Assessment Questionnaire; HAQ: Health Assessment Questionnaire; TFL: test de flexibilidad lumbar; T6MM: test de 6 minutos marcha.
Correlaciones entre las puntuaciones de los cuestionarios autoaplicados y las medidas externas indirectas de capacidad funcional
HAQ | FHAQ | FF-FIQ | |
T6MM | |||
Coef. correlación de Pearson | −0,299 | −0,314 | −0,147 |
Significación (p) | <0,001 | <0,001 | =0,010 |
BORG | |||
Coef. correlación de Pearson | 0,426 | 0,444 | 0,287 |
Significación (p) | <0,001 | <0,001 | <0,001 |
TFL | |||
Coef. correlación de Pearson | −0,236 | −0,223 | −0,237 |
Significación (p) | <0,001 | <0,001 | <0,001 |
EGMP | |||
Coef. correlación de Pearson | 0,360 | 0,338 | 0,213 |
Significación (p) | <0,001 | <0,001 | <0,001 |
BORG: escala de fatiga de Borg modificada; EGMP: evaluación global de la movilidad pasiva de los pacientes; FF-FIQ: escala de función física del Fibromyalgia Impact Questionnaire; FHAQ: Fibromyalgia Health Assessment Questionnaire; HAQ: Health Assessment Questionnaire; TFL: test de flexibilidad lumbar; T6MM: test de 6 minutos marcha.
Los coeficientes de correlación entre los tres cuestionarios fueron los siguientes: HAQ vs FHAQ, 0,92; HAQ vs FF-FIQ, 0,59; FHAQ vs FF-FIQ, 0,59. Todas correlaciones fueron significativas (p<0,001).
DiscusiónEn el campo de la FM se ha dado más importancia a la evaluación del dolor, la fatiga y las alteraciones psicológicas que a la evaluación de la capacidad funcional que queda generalmente englobada dentro de conceptos más amplios como «calidad de vida» o «estado de salud»2,3. Sin embargo, la capacidad funcional tiene por sí misma una gran importancia ya que constituye, según nuestra experiencia, la principal preocupación de los pacientes que se hallan limitados en la realización de aquellas actividades de la vida diaria que consideran fundamentales. La frustración que ello provoca se ve agravada por la incomprensión del entorno motivada por la dificultad de objetivar ese deterioro funcional, a diferencia de otras enfermedades como la artritis reumatoide o la artrosis en las cuales, el deterioro funcional, parece más justificado por la existencia de alteraciones orgánicas demostrables. Sí se pueden demostrar alteraciones orgánicas.
Otra de las consecuencias del deterioro funcional es la pérdida de jornadas laborales con sus repercusiones económicas asociadas. Los pacientes con FM tienen una tasa de discapacidad laboral cuatro veces mayor que la del resto de los trabajadores15. En este sentido, la capacidad funcional autopercibida, evaluada mediante el cuestionario HAQ, ha demostrado ser un factor estadístico independiente de coste económico en un modelo de regresión múltiple en pacientes con fibromialgia1.
Desde un punto de vista psicométrico, los cuestionarios HAQ, FHAQ y FF-FIQ mostraron una aceptable validez de constructo como medidas de capacidad funcional, por ser capaces de discriminar entre pacientes con puntuaciones extremas en cada una de las cuatro medidas externas del panel propuesto. La comparación de la magnitud de la diferencia en tales comparaciones mostró resultados similares entre HAQ y FHAQ que, a su vez, fueron superiores a los del FF-FIQ en tres de las cuatro medidas utilizadas.
La correlación entre HAQ y FHAQ fue excelente, en cambio, la correlación de ambos con el FF-FIQ fue solo moderada. Todo ello indica que la información sobre capacidad funcional aportada por el FF-FIQ es cualitativamente diferente de la aportada por los otros dos cuestionarios y de menor validez según los resultados presentados. Las razones de esta inferioridad podrían encontrarse en el sistema de puntuación de la citada escala de función física del FIQ (siempre, la mayoría de las veces, en ocasiones, nunca) ya que, según experiencia de los autores, los pacientes con frecuencia confunden «nunca por incapaz de hacerlo» con «nunca, por no tener costumbre de hacerlo» (especialmente en el ítem referido a usar transporte público)10. El sistema de puntuación de HAQ y FHAQ (sin dificultad, con alguna dificultad, con mucha dificultad, incapaz de hacerlo) no ofrece esta posibilidad de error y parece más adecuado (anexo 1).
Una revisión de la literatura muestra que las correlaciones entre la FF-FIQ y el T6MM, por un lado16 y entre HAQ, por otro, y los tests de la marcha y de flexibilidad lumbar17 son comparables a los que presentamos en este estudio. A parte de su estudio inicial6, el FHAQ únicamente ha sido utilizado por un grupo de investigadores18, sin embargo no se presentaron comparaciones entre sus puntuaciones y otras medidas externas. Además, en ningún caso se ha estudiado la validez comparada entre HAQ y FF-FIQ.
Como limitaciones de este estudio puede señalarse el no haberse incluido la subescala de función física del SF-36, menos utilizada en nuestro medio y que mostró diversos problemas en un estudio previo6. También el hecho de incluir medidas no lo suficientemente validadas, como la EGMP o la versión modificada de la escala de Borg. Sin embargo, el comportamiento de estas escalas en el presente trabajo fue muy similar al del T6MM, ampliamente conocido y validado13,16,17.
Como conclusión, consideramos que HAQ y FHAQ presentan una validez de constructo superior, es decir, miden más adecuadamente la verdadera capacidad funcional de los pacientes que la FF-FIQ. El FHAQ, por su brevedad (solo 8 ítems) podría sustituir al HAQ en ocasiones en las que se pretenda una evaluación multidimensional de pacientes empleando un reducido número de ítems.
AgradecimientosA la Unidad de Investigación de la Fundación Española de Reumatología y, especialmente, a Milena Gobbo por su apoyo técnico y colaboración.
FinanciaciónEste estudio ha sido financiado por el Fondo de Investigación Sanitaria (FIS) PI 07/0202.
Este estudio ha sido financiado por el laboratorio farmacéutico Pfizer.
Grupo ICAF: Alegre C (Hospital Vall de Hebrón, Barcelona), Alperi M (Hospital General de Asturias, Oviedo), Ballina FJ (Hospital General de Asturias, Oviedo), Belenguer R (Hospital 9 de Octubre, Valencia), Belmonte M (Hospital General de Castellón, Castellón), Beltrán J (Hospital General de Castellón, Castellón), Blanch J (Hospital IMAS, Barcelona), Collado A (Hospital Clínic, Barcelona), Fernández Dapica P (Hospital Universitario 12 de Octubre, Madrid), Francisco Hernández FM (Hospital Dr. Negrín, Gran Canaria), García Monforte A (Hospital GU Gregorio Marañón, Madrid), González Hernández T (IPR, Madrid), González Polo J (Hospital U. La Paz, Madrid), Hidalgo C (Centro Reumatológico, Salamanca), Mundo J (Hospital Clinic, Barcelona), Muñoz Carreño P (Hospital General, Guadalajara), Queiró R (Hospital General de Asturias, Oviedo), Riestra N (Hospital General de Asturias, Oviedo), Salido M (Clínica CLINISAS, Madrid), Vallejo I (Hospital Clinic, Barcelona), Vidal J (Hospital General, Guadalajara).
Versión española del Fibromyalgia Health Assessment Questionnaire (FHAB)¿.