Springe auf Hauptinhalt Springe auf Hauptmenü Springe auf SiteSearch
Zur Evaluation seiner Messeigenschaften

Der deutsche Work Role Functioning Questionnaire

M. Michaelis1,2

M.A. Rieger1

E. Rothermund3

(eingegangen am 01.11.2022, angenommen am 17.11.2022)

The German Work Role Functioning Questionnaire – on the evaluation of its measurement properties

Objectives: Measures to maintain the employability of workers should also take their functional ability into account. The Work Role Functioning Questionnaire (WRFQ), which is available in several languages, is suitable for such an assessment. A validated version in German had been missing until now. The 27-item questionnaire was culturally adapted from the Dutch version of WRFQ 2.0 and used with a heterogeneous sample of employees with the aim of psychometrically validating the overall scale and the four subscales.

Methods: After adaptation, members of a commercial online access panel with a wide variety of occupations were recruited (T0: n = 653). Two follow-ups were conducted to assess further psychometric properties (T1: n = 66, T2: n = 95). We examined the 1) structural, 2) convergent and 3) discriminant validity using exploratory factor analysis, 4) floor and ceiling effects, as well as 5) the internal consistency, 6) reproducibility, and 7) responsiveness.

Results: Measurement properties were found to be good, with the exception of responsiveness and structural validity. In the exploratory factor analysis, satisfactory replicability was found for three of the four subscales (mental and social demands, physical demands and flexibility demands, but not scheduling and output demands).

Conclusions: The WRFQ is aimed at the fit between demands and the individual and thus at the ability to participate. With the development and validation of a German-language version, the scale can be used in practice, e.g. in interventions aimed at secondary prevention to maintain the ability to work, tertiary prevention to support a successful return to work, or the identification of employees with declining functional ability. The limitations of the study (limited representativeness of online access panels and poor replicability of the fourth subscale) require further research.

Keywords: work capacity evaluation – Work Role Functioning Questionnaire – survey – psychometric measurement properties

ASU Arbeitsmed Sozialmed Umweltmed 2022; 57: 

doi:10.17147/asu-1-240599

Der deutsche Work Role Functioning Questionnaire – zur Evaluation seiner Messeigenschaften

Zielstellungen: Bei Maßnahmen zum Erhalt der Beschäftigungsfähigkeit von Erwerbstätigen sollte auch ihre Funktionsfähigkeit berücksichtigt werden. Zu ihrer Erfassung eignet sich der mehrsprachig vorliegende Work Role Functioning Questionnaire (WRFQ). Eine deutschsprachig validierte Version fehlte bislang. Der 27-Item-Fragebogen wurde aus der niederländischen Version WRFQ 2.0 interkulturell adaptiert und bei einer heterogenen Stichprobe abhängig Beschäftigter mit dem Ziel einer psychometrischen Validierung der Gesamtskala und der vier Subskalen eingesetzt.

Methoden: Nach der Adaptation wurden Angehörige eines kommerziellen Online Access Panels mit unterschiedlichsten Berufen rekrutiert (T0: n = 653). Zur Beurteilung weiterer psychometrischer Eigenschaften erfolgten zwei Follow-ups (T1: n = 66, T2: n = 95). Es wurden die 1) strukturelle, 2) konvergente und 3) diskriminante Validität mittels explorativer Faktorenanalyse, 4) Boden- und Deckeneffekte sowie 5) die interne Konsistenz, 6) Reproduzierbarkeit und 7) Reaktionsfähigkeit überprüft.

Ergebnisse: Die Messeigenschaften erwiesen sich mit Ausnahme der Reaktionsfähigkeit und der strukturellen Validität als gut. Die explorative Faktorenanalyse zeigte eine zufriedenstellende Replizierbarkeit bei drei der vier Subskalen (Mentale & soziale Anforderungen, Körperliche Anforderungen und Flexibilitätsanforderungen, nicht aber Arbeitsplanung & Arbeitsanforderungen).

Schlussfolgerungen: Der WRFQ zielt auf die Passung zwischen Anforderungen und Individuum und damit auf die Teilhabefähigkeit. Mit dem der Entwicklung und Validierung einer deutschsprachigen Version kann die Skala in der Praxis z. B. bei Interventionen eingesetzt werden, die sekundärpräventiv auf den Erhalt der Arbeitsfähigkeit zielen, die tertiärpräventiv eine erfolgreiche Rückkehr in den Arbeitsprozess unterstützen oder zur Identifikation von Beschäftigten mit sinkender Funktionsfähigkeit. Die Limitationen der Studie (eingeschränkte Repräsentativität von Online Access Panels und schlechte Replizierbarkeit der vierten Subskala) bedürfen weiterer Forschung.

Schlüsselwörter: Instrument zur Bewertung der Arbeitsfähigkeit – Work Role Functioning Questionnaire – Befragungsstudie – psychometrische Mess­eigen­schaften

Einleitung

Bei Maßnahmen zum Erhalt von Gesundheit und Beschäftigungs­fähigkeit von Erwerbstätigen sollten nicht nur Belastungen und Beanspruchungen am Arbeitsplatz, sondern auch die Funktionsfähigkeit der oder des Einzelnen berücksichtigt werden.

Der Work Role Functioning Questionnaire (WRFQ) misst als generisches Instrument die Auswirkungen des funktionalen Gesundheitszustands auf die Fähigkeit, Arbeitsanforderungen zu erfüllen. Es bewertet die Zeit, in der eine Arbeitnehmerin oder ein Arbeitnehmer aufgrund körperlicher oder emotionaler Einschränkungen Schwierigkeiten hat, den Arbeitsanforderungen gerecht zu werden, in Prozentanteilen (Amick et al. 2000). Die amerikanische Originalversion des WRFQ mit 27 Items und fünf Subskalen wurde vielfach kulturübergreifend angepasst (Durand et al. 2004; Gallasch et al. 2007; Abma et al. 2012, 2013; Ramada et al. 2013; Johansen et al. 2018) und validiert. In den Niederlanden wurde eine neue Version WRFQ 2.0 mit fünf arbeitsmarktspezifisch aktuellen Items entwickelt. Die Version umfasst vier Skalen:

  • Arbeitsplanung & Arbeitsanforderungen
  • Mentale & soziale Anforderungen
  • Körperliche Anforderungen und
  • Flexibilitätsanforderungen (Abma et al. 2012, 2013; Johansen et al. 2018).
  • Um das Instrument für den deutschsprachigen Raum verfügbar zu machen, wurden seine Messeigenschaften nach einer interkulturellen Anpassung vom Niederländischen ins Deutsche (Töws 2020) in einer Beschäftigtenstichprobe erprobt. Hier soll zusammenfassend über Messeigenschaften und Einsatzmöglichkeiten berichtet werden. Eine ausführliche Publikation erschien in BMC Public Health 2022 (Michaelis et al. 2022).

    Methoden

    Instrument und Datenanalysen

    Im Fragebogen wird eine Selbstbeurteilung eingeholt zum zeitlichen Anteil von Schwierigkeiten, den Arbeitsanforderungen aufgrund körperlicher oder psychischer Gesundheitsprobleme in den letzten vier Wochen gerecht zu werden. Die 27 Items (fünfstufige Likert-Skala von 0 = immer schwierig bis 4 = überhaupt nicht schwierig) haben jeweils auch die Antwortmöglichkeit „trifft auf meine Arbeit nicht zu“. Die dadurch entstehenden fehlenden Werte wurden für die nachfolgenden Analysen durch den Hot-Deck-Algorithmus im Programm „r“ imputiert. Für die Skalenkonstruktion wurden die Antworten in Prozentwerte zwischen 0 % (immer schwierig) und 100 % (nie schwierig) umgerechnet.

    Stichproben

    Im Jahr 2018 wurden Mitglieder aus unterschiedlichen beruflichen Kontexten eines kommerziellen Online Access Panels (www.respondi.com) mit kleinen finanziellen Anreizen gewonnen (T0: 1,50 €, Follow-ups: 1 €). Für die Basiserhebung (T0) wurden 600 berufstätige Befragte und in zwei Folgeerhebungen zur Beurteilung weiterer psychometrischer Eigenschaften eine Woche (T1) und drei Monate (T2) später 50 beziehungsweise 100 Personen angestrebt. Zu Stichprobendetails siehe Michaelis et al. (2022).

    Validierung psychometrischer Eigenschaften

    Die Analyse der Messeigenschaften des deutschen WRFQ 2.0 umfasste die strukturelle, konvergente und diskriminante Validität, Boden- und Deckeneffekte, die interne Konsistenz, die Reproduzierbarkeit und die Reaktionsfähigkeit analog zu den Methoden der niederländischen Arbeitsgruppe (Abma et al. 2013).

    Strukturelle Validität: Die Beurteilung, wie gut die Struktur des Fragebogens mit dem theoretischen Konstrukt korrespondiert, erfolgte mittels explorativer Faktorenanalyse (Hauptkomponentenanalyse, Eigenwertkriterium, Varimax-Rotation, Berücksichtigung von Ladungen > 0,4).

    Konvergente und diskriminante Validität: Für die Frage, ob der WRFQ a) hohe Korrelationen (Spearman‘s rho-Koeffizient) mit ähnlichen Instrumenten aufweist beziehungsweise b) niedrige Korrelationen mit solchen, die eine andere Fragestellung messen, wurden

  • die Endicott Work Productivity Scale (EWPS; [Endicott u. Nee 1997]), das Item Allgemeine Arbeitsfähigkeit aus dem Work Ability Index (Ilmarinen 2007) und das Item Allgemeiner Gesundheitszustand aus dem 12-item Short Form Survey of General Health (SF-12 [Wirtz et al. 2018]) sowie
  • die Subskalen Entscheidungsspielraum und Arbeitsanforderungen aus dem Job Content Questionnaire (JCQ [Karasek et al. 1998]) herangezogen.
  • Die Korrelationen wurden entweder als gering (rho < 0,25), moderat (rho < 0,35) oder groß (rho ≥ 0,35 eingestuft (Gignac et al. 2016).

    Boden- und Deckeneffekte: Diese gelten als vorhanden, wenn mehr als 15 % der Antworten bei den niedrigsten beziehungsweise höchsten erreichbaren Werten der Skala liegen (Terwee et al. 2007).

    Interne Konsistenz: Die Reliabilität der Skala und ihrer Subskalen wurde anhand von Cronbachs alpha, des Intraklassen-Korrelationskoeffizienten (ICC), der Inter-Item-Korrelation sowie der Item-zu-Total-Korrelation analysiert. Bei Cronbachs alpha und ICC gelten Werte über 0,7 als gut, bei den letzten beiden Koeffizienten Werte zwischen 0,2 und 0,8 beziehungsweise zwischen 0,3 und 0,9 (Nunnally u. Bernstein 1994; de Vet et al. 2011).

    Reproduzierbarkeit: Die Wiederholbarkeit wurde mit dem ICC bewertet und gilt bei Werten zwischen 0,7 und 0,9 als akzeptabel.
    Außerdem wurde der Standardmessfehler (SEM) als Maß für die Genauigkeit individueller Testergebnisse (SDdiff/√2) zur Interpretation der „wahren“ Werte in der Grundgesamtheit berechnet (Nunnally u. Bernstein 1994).

    Reaktionsfähigkeit: Die Sensitivität des Instruments zur Messung von Veränderungen zwischen T0 und T2 wurde unter anderem durch den Vergleich der mittleren Veränderungen des WRFQ und der Allgemeinen Arbeitsfähigkeit (globales WAI-Item) bewertet. Die mittlere Veränderung erfolgt durch die Berechnung der mittleren Differenzen zwischen T0 und T2 und die jeweiligen Standardabweichungen (SD) und eine Standardisierung („standardized response mean“; SRM: Verhältnis zwischen dem mittleren Änderungswert und seiner SD). Die SRM-Effektgrößen wurden in < 0,2 (geringfügig), ≥ 0,2 bis < 0,5 (klein), ≥ 0,5 bis < 0,8 (mittelmäßig) und ≥ 0,8 (groß) kategorisiert (Middel u. van Sonderen 2002).

    Ergebnisse

    Rücklaufquote und Stichprobenmerkmale

    Die T0-Stichprobe von 653 Beschäftigten wurde mit einem Oversampling von 86 % erreicht (14 % Rücklauf von n = 4694). An den T1- und T2-Follow-ups beteiligten sich n = 66 beziehungsweise n = 95. 34 % der T0-Befragten waren in der verarbeitenden Industrie und im Handwerk beschäftigt, 30 % im Dienstleistungsbereich (z. B. Gastgewerbe, Transport, medizinische Berufe) und 37 % in vor allem Schreibtischberufen. Fast die Hälfte war weiblich (47,3 %); das Durchschnittsalter betrug 43 Jahre (Standardabweichung SD = 12). 24 % hatten einen Schichtarbeitsplatz; 60 % arbeiteten in kleinen oder mittleren Unternehmen. 59 % berichteten über einen guten/ ausgezeichneten Gesundheitszustand; die generelle Arbeitsfähigkeit wurde im Durchschnitt mit 8,6 bewertet (SD 1,8; Spanne 0–10).

    Strukturelle Validität

    Die explorative Faktorenanalyse ergab eine auf vier Subskalen basierende Faktorenstruktur, jedoch mit anderer Itemverteilung als in der niederländischen Version. Die dort beschriebenen Subskalen Mentale & soziale Anforderungen sowie Flexibilitätsanforderungen wurden in den deutschen Daten als eine Subskala identifiziert (Faktor 1). Die niederländische Subskala Arbeitsplanung & Leistungsanforderungen hingegen wurde in den deutschen Daten in zwei Subskalen aufgeteilt (Faktoren 2 und 4). Die Subskala Körperliche Anforderungen konnte gut repliziert werden (Faktor 3; siehe Online-Zusatzmaterial 1).

    Konvergente und diskriminante Validität

    Die Korrelation der WRFQ-Gesamtskala mit den überprüften Konstrukten Endicott Work Productivity Scale (EWPS) und Work Ability Index war wie gewünscht hoch (rho = 0,38–0,49), die Korrelation
    mit dem SF12-Globalitem Allgemeine Gesundheit moderat (rho = 0,33).

    Auch konnte die diskriminante Validität im Vergleich mit den JCR-Subskalen Entscheidungsspielraum und Psychische Arbeitsanforderungen durch geringe Korrelationen bestätigt werden (rho = 0,07 beziehungsweise –0,16). Alle Ergebnisse waren hochsignifikant (p ≤ 0,001).

    Boden-/Deckeneffekte, interne Konsistenz und Reproduzierbarkeit

    Boden- oder Deckeneffekte wurden nicht festgestellt. Der höchste Anteil, der den Skalenwert 100 % erreichte, war 13 % bei der Subskala Flexibilitätsanforderungen.

    Die interne Konsistenz war angemessen (Cronbachs alpha der WRFQ-Gesamtskala = 0,94 und der Subskalen 0,79–0,89). Auch der ICC war gleich oder über dem Schwellenwert von 0,7. Darüber hinaus bestätigten die Werte für die Inter-Item- (0,2–0,8) und Item-zu-Total-Korrelationen (0,3–0,9) die interne Konsistenz des Instruments.

    Die Reproduzierbarkeit der Gesamtskala und der Subskala Arbeitsplanung & Arbeitsanforderungen zu T1 war mit ICC > 0,7 gut, bei drei anderen weiteren Subskalen lag der ICC zwischen 0,44 und 0,67.

    Reaktionsfähigkeit

    Die Veränderung des WRFQ-Gesamtmittelwerts zwischen T0 und T2 betrug –18,0 (SD 13,4; Mittelwert T0 = 72,6, SD = 15,5 und T2 = 54,6, SD = 13,0). Die größte Veränderung erfuhr die Subskala Arbeitsplanung und Arbeitsanforderungen, gefolgt von Körperliche Anforderungen und Mentale und soziale Anforderungen mit geringeren Rückgängen. Die Werte deuten auf eine stark verminderte Arbeitsfähigkeit hin (SRM = 1,34).

    Die aktuelle Arbeitsfähigkeit (WAI) auf der anderen Seite verschlechterte sich zwischen T0 und T2 von 8,7 auf 8,0 mit einer geringen mittleren Veränderung von –0,63 (SD 1,7; SRM = 0,37).

    Diskussion

    Wir evaluierten die Messeigenschaften der weiterentwickelten niederländischen Version des Work Role Functioning Questionnaire in einer deutschen Erwerbsbevölkerung nach der interkulturellen Adaptation. Zusammenfassend hat die WRFQ-Gesamtskala eine gute strukturelle Validität, wenngleich die Subskalen im Vergleich zur niederländischen Version nur bedingt replizierbar waren; auch die anderen psychometrischen Messeigenschaften bis auf die Reak­tionsfähigkeit erfüllten die Anforderungen. Das Ergebnis der Letzteren deckt sich mit früheren Ergebnissen einer niederländischen und einer spanischen Studie in der Erwerbsbevölkerung (Abma et al. 2013; Ramada et al. 2013). Die relativ große mittlere Veränderung des WRFQ-Scores zwischen T0 und T2 könnte auf eine signifikante Selbstselektion in der T2-Stichprobe hinweisen. Die geringen WAI-Unterschiede zwischen T0 und T2 unterstützen die Annahme.

    Stärken und Limitationen der Studie

    Stärken sind die Validierung eines generischen Instruments zur Bewertung der gesundheitsbezogenen Arbeitsfähigkeit von Berufstätigen im Hinblick auf wichtige Arbeitsanforderungen und die Prüfung der Reaktionsfähigkeit des Instruments, die bisher noch nicht oft getestet wurde und eine Ergänzung der Literatur darstellt.

    Limitationen bestehen in der begrenzten Repräsentativität der Mitglieder eines Online-Zugangspanels für die Erwerbsbevölkerung: Nicht alle Berufe und beruflichen Positionen konnten in unserer Stichprobe abgebildet werden. Online-Access-Panels sind generell durch die typischerweise geringe Anzahl von Personen in Führungspositionen begrenzt. Daher sind weitere Studien in diesen Teilgruppen von Vorteil. Eine kritische Diskussion von Online Access Panels findet sich in Burgess et al. (2018). Eine weitere Einschränkung ist das begrenzte Wissen über den Gesundheitszustand der Stichprobe.

    Schlussfolgerungen

    Der deutsche WRFQ ist ein kurzes, psychometrisch valides Instrument mit 27 Items. Es kann für die Bewertung und Überwachung der Arbeitsfähigkeit von Beschäftigten unterschiedlichen Alters, mit unterschiedlichem Gesundheitszustand und in verschiedenen Berufen eingesetzt werden. Die WRFQ-Gesamtskala kann als Instrument zur Messung von Maßnahmenergebnissen verwendet werden, die auf die Aufrechterhaltung der Arbeitsfähigkeit, aber auch auf Beschäftigungsfähigkeit nach der krankheitsbedingten Rückkehr an den Arbeitsplatz abzielen (siehe Online-Zusatzmaterial 2). Für die Analyse der Subskalen sind weitere Studien erforderlich.

    Finanzierung. Die Studie erhielt keine öffentliche, kommerzielle oder gemeinnützige Förderung. Die Arbeit des Instituts für Arbeits- und Sozialmedizin und Versorgungsforschung Tübingen wird durch einen nicht zweckgebundenen Zuschuss des Arbeitgeberverbands der Metall- und Elektroindustrie Baden-Württemberg (Südwestmetall) unterstützt.

    Interessenkonflikt: Die Autorinnen geben an, dass keine Interessenkonflikte vorliegen.

    Literatur

    Abma FI; Amick BC 3rd; Brouwer S; van der Klink JJL; Bültmann U: The cross-cultural adaptation of the work role functioning questionnaire to Dutch. Work 2012; 43: 203–210. doi 10.3233/WOR-2012-1362.

    Abma FI; van der Klink JJL; Bültmann U: The work role functioning questionnaire 2.0 (Dutch version): Examination of its reliability, validity and responsiveness in the general working population. J Occup Rehabil 2013; 23: 135–147. doi 10.1007/s10926-012-9379-8.

    Amick BC 3rd; Lerner D; Rogers WH; Rooney T; Katz JN: A review of health-related work outcome measures and their uses, and recommended measures. Spine 2000; 25: 3152–3160. doi 10.1097/00007632-200012150-00010.

    Burgess S; Junne F; Rothermund E; Gündel H; Zipfel S; Rieger MA; Michaelis M: Umfragen mit Hilfe eines Online Access Panels – methodische Erkenntnisse aus einer Beschäftigtenbefragung zur Prävention psychischer Erkrankungen. Arbeitsmed Sozialmed Umweltmed 2018; 53: 537–540.

    De Vet HCW; Terwee CB; Mokkink LB; Knol DL: Measurement in medicine: a practical guide. Cambridge: Cambridge University Press, 2011. doi: 10.1017/CBO9780511996214.

    Durand MJ; Vachon B; Hong QN; Imbeau D; Amick BC 3rd; Loisel P: The cross-cultural adaptation of the Work Role Functioning Questionnaire in Canadian French. Int J Rehabil Res 2004; 27: 261–268. doi 10.1097/00004356-200412000-00002.

    Endicott J; Nee J: Endicott work productivity scale (EWPS): A new measure to assess treatment effects. Psychopharmacol Bull 1997; 33: 13–16.

    Gallasch CH; Alexandre NM; Amick BC III: Cross-cultural adaptation, reliability, and validity of the work role functioning questionnaire to Brazilian Portuguese. J Occup Rehabil 2007; 17: 701–711. doi 10.1007/s10926-007-9103-2.

    Gignac GE; Szodorai ET: Effect size guidelines for individual differences researchers. Pers Indiv Differ 2016; 102: 74–78. doi: 10.1016/j.paid.2016.06.069.

    Ilmarinen J: The Work Ability Index (WAI). Occup Med 2007; 57: 160. doi: 10.1093/occmed/kqm008.

    Johansen T; Lund T; Jensen C; Momsen AH; Eftedal M; Øyeflaten I; Braathen TN; Stapelfeldt CM; Amick B; Labriola M: Cross-cultural adaptation of the Work Role Functioning Questionnaire 2.0 to Norwegian and Danish. Work 2018; 59: 471–478. doi 10.3233/WOR-182705.

    Karasek R; Brisson C; Kawakami N; Houtman I; Bongers P; Amick B: The Job
    Content Questionnaire (JCQ): an instrument for internationally comparative
    assessments of psychosocial job characteristics. J Occup Health Psychol 1998; 3: 322–355. doi 10.1037//1076-8998.3.4.322.

    Michaelis M; Rieger MA; Burgess; S, Töws V; Abma FI; Bültmann U; Amick BC; Rothermund E: Evaluation of measurement properties of the German Work Role Functioning Questionnaire. BMC Public Health 2022; 22: 1750. doi 10.1186/s12889-022-13893-4.

    Middel B; van Sonderen E: Statistical significant change versus relevant or important change in (quasi) experimental design: some conceptual and methodological problems in estimating magnitude of intervention-related change in health services research. Int J Integ Care 2002; 2: e15. doi: 10.5334/ijic.65.

    Nunnally JC; Bernstein IH: Psychometric theory. New York: McGraw-Hill Higher INC, 1994.

    Ramada JM;, Serra C; Amick BC 3rd; Castaño JR; Delclos GL: Cross-cultural adaptation of the Work Role Functioning Questionnaire to Spanish spoken in Spain.
    J Occup Rehabil 2013; 23: 566–575. doi 10.1007/s10926-013-9420-6.

    Terwee CB; Bot SD; de Boer MR; van der Windt DA; Knol DL; Dekker J; Bouter LM; de Vet HC. Quality criteria were proposed for measurement properties of health status questionnaires. J Clin Epidemiol 2007; 60: 34–42. doi: 10.1016/j.jclinepi.2006.03.012.

    Töws V: Transkulturelle Adaption des Work Role Functioning Questionnaire 2.0 für den deutschsprachigen Raum. Doktorarbeit, Universität Ulm, Medizinische Fakultät, 2020. doi. 10.18725/OPARU-42658.

    Wirtz MA; Morfeld M; Glaesmer H, Brähler E: Normierung des SF-12 Version 2.0 zur Messung der gesundheitsbezogenen Lebensqualität in einer deutschen bevölkerungsrepräsentativen Stichprobe]. Diagnostica 2018; 64: 215–226. doi 10.1026/0012-1924/a000205.

    Kontakt

    Dr. Martina Michaelis

    Institut für Arbeitsmedizin, Sozialmedizin und Versorgungsforschung, Universitätsklinikum Tübingen
    Wilhelmstraße 27
    72074 Tübingen
    martina.michaelis@med.uni-tuebingen.de

    Das PDF dient ausschließlich dem persönlichen Gebrauch! - Weitergehende Rechte bitte anfragen unter: nutzungsrechte@asu-arbeitsmedizin.com.