Stimmiges Testkonzept entwickeln
Die wichtigsten sportwissenschaftlichen Parameter zur Auswahl aussagefähiger Testverfahren
Unterschiedlichste Testverfahren sind mittlerweile fester Bestandteil des Alltags in Fitnessstudios. Sowohl im Rahmen von Erstgesprächen zur Erhebung des Status, als auch in der weiteren Verlaufskontrolle kommen sie zum Einsatz. Welche diagnostischen Ansätze gibt es, wie bewertet man sie und wie sieht ein stimmiges Konzept mit aussagekräftigen Tests eigentlich aus?
Testverfahren werden in der Sportwissenschaft nach verschiedenen Kriterien bewertet. Die wichtigsten Beurteilungsmaßstäbe sind Validität, Reliabilität und Objektivität. Diese sind zwar für einen Fitnessbetrieb, der nicht unbedingt an wissenschaftliche Maßstäbe gekoppelt und eher praxisorientiert ist, nicht zwingend, aber vor allem bei wiederholten Testverfahren und einem größeren Team mit vielen Testern sollte man sich entsprechend auf ein einheitliches Vorgehen und aussagekräftige Methoden verständigen. Deshalb sollen diese Begriffe im Folgenden ein wenig genauer betrachtet werden.
Validität
Ein Test ist valide, wenn er eine entsprechende Gültigkeit besitzt. Das bedeutet,dass ein Test auch tatsächlich das misst, was er zu messen vorgibt. Sicherlich ist jedem bewusst, dass man mit einem 1-RPM-Test – einem Test zur Bestimmung der Maximalkraft durch das einfache Wiederholungsmaximum – nicht wirklich zuverlässige Rückschlüsse auf die Ausdauerleistungsfähigkeit oder Beweglichkeit eines Sportlers ziehen kann, da ja eine ganz andere Komponente, nämlich eine Kraftausprägung, gemessen wird. Bei Laktatleistungstests oder Kraftausdauertests (z. B. 10-RPM) ist das schon etwas anderes. Sicherlich ist nicht immer der Sportler mit den besten Werten in diesen Tests der Ausdauerndste, aber es gibt eine starke Korrelation.
In der Wissenschaft werden solche Korrelationen oft genutzt, um Testverfahren, die im Labor unter hohem Messaufwand durchgeführt werden, mit einfachen Feldtests, die in der Anwendung wesentlich praktikabler sind, zu vergleichen (vgl. Grafik 2). So kann man z. B. durch die Bestimmung des 5-RPM oder des 10-RPM relativ gut auf die Maximalkraft schließen, ohne diese wirklich gemessen zu haben. Grundsätzlich gilt, dass genau definiert sein muss, was gemessen werden soll. Es stellt sich die Frage, an welchen Parametern eine gute Kraft- oder Ausdauerleistung überhaupt festgemacht werden kann, um dann ein Testverfahren zu wählen, das eben genau diese misst.
Reliabilität
Als zweites Gütekriterium beschreibt die Reliabilität die Zuverlässigkeit eines Tests, ob also auch bei mehreren Versuchen immer ein entsprechend aussagekräftiges und vergleichbares Ergebnis herauskommt. Dabei geht es um die Standardisierung von Testverfahren. Studien zeigen, dass bei klassischen Ausdauertestverfahren wie dem Cooper- Test – Messkriterium ist die zurückgelegte Strecke in zwölf Minuten – bei unerfahrenen Probanden nach dem ersten Test ein starker Lerneffekt eintritt. Dadurch fällt ein zweiter Test aufgrund der Vorerfahrung und der damit verbundenen besseren Krafteinteilung signifikant besser aus als der Referenztest am Tag zuvor.
Ein anderes Beispiel wäre die Griffbreite und/oder die Fußposition beim Bankdrücken oder bei anderen Krafttests. Häufig spielen bei Beweglichkeitstests die Tageszeit und die Temperaturbedingungen sowie ein potenziell nicht standardisiertes Aufwärmen eine entscheidende Rolle, sodass Testergebnisse eines Prä- und eines Posttests nicht miteinander verglichen werden können. Diese Beispiele zeigen, wie trotz vermeintlich guter Voraussetzungen ggf. einfach die falschen Tests ausgewählt und/oder durch unzureichende Standardisierung nicht belastbare Ergebnisse ermittelt werden, die dann Grundlage für die Trainingsplanung sind und eventuell zu falschen Schlussfolgerungen in der Trainingsbetreuung führen. Werden valide und aussagefähige Testverfahren ausgewählt, verbessert das auch die Qualität des Trainings.
Objektivität
Ein weiteres Gütekriterium ist die Objektivität. Ein Testergebnis muss im Optimalfall unabhängig von den jeweiligen Testern immer zu dem gleichen Ergebnis kommen, also gleich bewertet werden. So können Fitnessstudios eine definierte Testbatterie von verschiedenen Mitarbeitern durchführen lassen und die Werte sowohl intra- als auch interindividuell miteinander vergleichen, um entsprechende Rückschlüsse zu ziehen. Studien zeigen beispielsweise, dass eine extrinsische Motivation (Anfeuern) durch den Tester zu signifikant besseren Ergebnissen bei Krafttests führen kann. Unter diesem Gesichtspunkt werden bei wissenschaftlichen Studien die Probanden bei Ausbelastungen im Regelfall angefeuert, um die extrinsische Motivation zu standardisieren.
Ein anderes Beispiel sind qualitative und quantitative Aktivierungs- und Bewegungsbeurteilungen, wie sie bei vielen Muskelfunktionstests oder dem Functional Movement Screen (FMS) vorgenommen werden. Hier zeigen Studien, dass sich die Bewertung erfahrener Tester mit klaren Bewertungsprotokollen und -vorgaben signifikant weniger voneinander unterscheiden als die Bewertungen unerfahrener Tester, denen nur grobe Richtlinien vorgegeben wurden.
Was bedeuten diese Kriterien für die Praxis?
Mit den Parametern Validität, reliabilität und objektivität wurden zwar die drei hauptkriterien für die qualität von tests erfüllt, dennoch zeigt sich, dass testen nicht ganz so einfach ist und auch vergleichswerte von kraft-, schnelligkeits-, beweglichkeits- und ausdauertests immer nur unter einer ausreichenden informationslage beurteilt werden können.man muss also klären, wie genau diese vergleichswerte mit welchen probanden erhoben wurden, um dann erst die daten zu beurteilen. selbst in guten studien fehlen oft hinweise über details wie z. b. extrinsische motivation.
Studiobetreiber müssen sich also überlegen, welche Testdaten erhoben werden sollen und ob die Tests für ihr Studio Sinn machen. Zum einen ist es sicherlich wertvoll, einem Kunden über einen längeren Zeitraum seine Verbesserungen in verschiedenen Bereichen auch aufzeigen zu können; wir nennen das einen intraindividuellen Vergleich. Unter gegebenen Umständen kann es aber auch Sinn machen, den Kunden z. B. geschlechts- und altersspezifisch mit einer relevanten Gruppe zu vergleichen und die entsprechenden Daten (anonymisiert) als Mittelwerte und Standardabweichungen als Referenzwerte zu nehmen. Dieser interindividuelle Vergleich, also der Vergleich mit einer ausDurchgewählten Gruppe, kann dazu dienen, den Kunden entsprechend seines Status quo einzustufen und potenzielle Veränderungen abzuschätzen
Testverfahren nach Zielgruppe auswählen
Standardisierte praktikable Testverfahren auszuwählen ist immer eine Gratwanderung zwischen Praktikabilität, Ökonomie und wissenschaftlichem Anspruch. Letztlich kann einem niemand die Entscheidung abnehmen, welche Tests mit welchem zeitlichen und materiellen Aufwand im Rahmen einer Kundenbetreuung durchführt werden. Allerdings gibt es einige Tipps für die Auswahl von Testverfahren. Clubbetreiber sollten folgende Fragen klären: Welchen Mehrwert soll der Test bringen? Welches gesundheitliche Risiko geht damit einher (Ausbelastungen, 1-RPM etc.)? Welche Konsequenzen ergeben sich daraus für die Trainingspraxis? Steht der Aufwand in Relation zum Nutzen? Mit welcher Zielgruppe sollte welcher Test durchgeführt werden? Dabei ist bei der Zusammenstellung des Testkonzepts die Zielgruppe zu beachten und ob Bewegungsanalysen, Ausdauertests, Kraftund Schnelligkeitstest oder noch weitere Tests durchgeführt werden.
Bewegungsanalysen
Sowohl unter therapeutisch-präventiven als auch unter leistungsorientierten Gesichtspunkten machen Tests zur Erhebung der Bewegungsqualität Sinn. Dazu können verschiedene Tests wie der Einbeinstand, ein einfacher klinischer Test zur Überprüfung der Standsicherheit, genauso wie Kniebeugen oder auch isolierte Beweglichkeitstests verschiedener Gelenke dienen. Unter ökonomischen Gesichtspunkten gilt dabei die Regel „from integration to isolation“, was so viel bedeutet wie, dass man sich eine komplexe Bewegung wie die Kniebeuge ansieht und wenn es dort Auffälligkeiten in der Bewegungsausführung gibt, man weiter ins Detail schaut. Beweglichkeitstests sollten bei defizitären Ergebnissen im Regelfall in verschiedenen Positionen und unter Berücksichtigung der aktiven und passiven Beweglichkeit durchgeführt werden.
Ausdauertests
Klassische Ausdauertests wie der Cooper- oder der Conconi-Test haben Stärken wie Schwächen. Für den Studiobetrieb gibt es verschiedene praktikable Ansätze zum Testen der Ausdauerleistungsfähigkeit. Da im Rahmen eines regelmäßigen Sporttreibens eine kardiologische Kontrolle anzuraten ist, kann in diesem Zusammenhang neben dem Belastungs- EKG beispielsweise auch gleich ein Ausdauertest durchgeführt werden. Dies könnte ein Laktattest oder ein Spirometrietest sein. Voraussetzung ist, dass der Trainer die Ergebnisprotokolle entsprechend bewerten kann (Schwellenmodelle, respiratorischer Kompensationspunkt, ventilatorische Schwellen etc.). Alternativ könnten auch sogenannte PWC-Tests im Rahmen von Fahrradergometer-Belastungen durchgeführt werden oder entsprechende Testprotokolle mit portablen Spirometrie- oder Laktatmessgeräten. Bei den Letzteren bedarf es allerdings einer gewissen Erfahrung des Testers bei der Durchführung und der Interpretation der Testergebnisse. Als einfache Varianten könnte man eine repräsentative zwanzig- bis dreißigminütige Belastung auf dem Ergometer (z. B. watt- oder geschwindigkeitsbasiert) herzfrequenzbegleitet durchführen, um über mehrere Messungen die Verbesserung der kardiologischen Messgrößen im intraindividuellen Vergleich zu sehen. Der Vorteil der letztgenannten Methoden ist neben einer verhältnismäßig einfachen Durchführung, dass sie nicht zwingend eine Ausbelastung des Sportlers benötigen.
Kraft- und Schnelligkeitstest
Kraft und Schnelligkeit werden hier zusammengefasst behandelt, da sie in vielen Fällen stark korrelieren. Klassische Schnelligkeitstests wie Sprinttests sind in einem Studio-Set-up eher unrealistisch und für eine Großzahl der Kunden auch nicht praktikabel. Gerade im Sport kann es aber Sinn machen, die Bewegungsschnelligkeit und/oder die Reaktionsschnelligkeit zu messen. Dies kann entweder isoliert durch Sprungtests oder kurze Antritte mit Lichtschrankensystem erfolgen oder kombiniert im Rahmen von diversen licht- oder audiobasierten Systemen, die Reaktions- und Bewegungsschnelligkeitsanalyse verbinden. Ein komplexes Testsystem, das mehrere Komponenten misst, ist sicherlich attraktiv. Es hat aber den Nachteil, dass bei einem schlechten Testergebnis nicht zwingend klar ist, an welcher Teilkomponente es nun liegt und mit welcher Intervention man den größten Nutzen für das Training des Kunden erzielt. In Anlehnung an die Schnelligkeitstests können diese auch durch Krafttests ergänzt und aufgrund der hohen Korrelation auch teilweise ersetzt werden. Dabei ist die Bestimmung des einmaligen Kraftmaximums (1-RPM), wie es in Studien häufig als Basis beschrieben wird, in der Praxis meist nicht praktikabel und sehr verletzungsanfällig. Alternativen dazu bieten Test mit dem 5- oder 10-RPM, aber auch Testverfahren, die über einen Beschleunigungssensor ein Abfallen der Ausführungsgeschwindigkeit sichtbar machen. Alternativ kann man ohne Ausbelastung auch mit der subjektiven Einschätzung der sogenannten „Reps in Reserve“ (Wiederholungen, die noch möglich gewesen wären) arbeiten.
Dr. Lutz Herdener
Dr. Lutz Herdener
ist Sportwissenschaftler im Bereich der Trainingssteuerung und Periodisierung und in Lehre und Ausbildung tätig. Sein Schwerpunkt liegt im Transfer wissenschaftlicher Erkenntnisse in eine praxisbezogene Anwendung.
Foto: Jacob Lund – stock.adobe.com