18.05.2023, 22:54
Eigentlich wollte ich mit meinem Beitrag lediglich einige grundsätzliche Denkanstöße bzw. Anforderungen an eine Neuentwicklung von Wertungstabellen kundtun und keine erneute Diskussion über die Leistunsbewertung nach gera im Vergleich zu den jetzigen Wertungen (Mehrkampfwertung und IAAF-Tabelle) entfachen. Dies allein deshalb nicht, weil ich die riesige Entwicklungsarbeit von gera respektiere. Da die Diskussion von ihm selbst aber immer wieder auf diesen Vergleich zurückgeführt wird und dabei durchaus vorhandene Schwachstellen in den anderen Bewertungen und die Vorteile der eigenen Punktetabelle herausgestellt wird, komme ich aber nicht umhin auch auf einige gravierende Schwachstellen der NBL-Methode hinweisen.
Ein neues Wertungssystem sollte sich an einer möglichst breiten Datenerhebung von Leistungen orientieren.
Daran fehlt es bereits an der Ausgangsbasis für die Höchstpunktzahlen in eklatanter Weise, da hier einfach nur die Weltrekorde (also eine einzige Leistung) als Höchstwert für die Bepunktung genommen wurde. Das hat man bei den ersten Wertungstabellen, die es gab, auch schon einmal gemacht. Aus guten Gründen ist man davon aber schnell abgerückt. Eine solche Datenbasis ist als statistische Größe viel zu klein. Mein Vorschlag wäre da die Ewige Weltbestenliste mit mindestens 1000 Leistungen/Disziplin als Grundlage zu nehmen und diesen Ergebnissen als oberem Lesitungsbereich eine gleiche Punktzahl zuzuordnen.
Auch die weiteren in II/1.D7 beschriebenen Erhebungsdaten sind zu klein, recht willkürlich gewählt bzw. ungeeignet.
Die Durchschnittsleistungen der 10 weltbesten Mehrkämpfer für die Jahre 1999 + 2005 ist ebenfalls eine viel zu kleine Datenbasis und widerspricht auch der eigenen Zielsetzung eine gerechte Bewertung für alle Anwendungszwecke zu schaffen.
Die Durchschnittsleistungen der DLV-Bestenlisten bis Platz 50 der Jahre 2001/2005/2006/2007 ist ebenfalls noch sehr klein und als Vergleichsgröße für ein System, dass ja international Geltung haben soll, völlig ungeeignet. Dies auch deshalb, wenn man weiß, dass die internationale Leistungsentwicklung, wenn auch in unterschiedlicher Ausprägung in den einzelnen Disziplinen, nach wie vor ansteigend ist. Im DLV ist das Gegenteil der Fall. Hier ist das Leistungsniveau seit mehreren Jahrzehnten stetig abfallend.
Warum die Frauenweltrekorde als Bezugsgröße für die Männertabellen gelten sollen, leuchtet ebenfalls nicht ein.
Auch die regionalen Bestenlisten des Bezirks Potsdam aus den Jahren 1955 und 1963 als Bezugsgröße zu wählen ist sehr willkürlich. In jedem anderen Bezirk und zu jedem anderen Zeitpunkt käme man da zu anderen Werten.
Als grundsätzliche Zielsetzung der Wertungstabelle ist die Leistungsäquivalenz zwischen den Disziplinen durch gleiche Punktzahlen für vergleichbare Leistungen definiert - und zwar in allen Leistungsbereichen.
Aus den auf der Homepage ersichtlichen Vergleichsdarstellungen ist ersichtlich, dass dies erkennbar nicht der Fall ist. Im oberen Bereich sind die Unterschiede zwischen den einzelnen Wertungssystemen vergleichsweise gering. Die Ungleichheit nimmt aber noch unten vor allem bei der NBL-Methode immer mehr zu.
Das führt letztlich dazu, dass die minimale Punktzahl bei der NBL-Methode bereits bei 100 Punkten endet. Der Grund: Die "Leistungen" sind an dieser Stelle zumindest bei einigen Disziplinen bereits so klein, dass sich daraus keine realisitischen kleineren Werte mehr errechnen lassen.
Die Marken für 100 Punkte ergeben bei den 100 m (21,96 Sek.). 400 m (1:50,43 Min.) und 110 m-Hürden (31,71 Sek.) wenigstens noch Leistungen, die im älteren Seniorenbereich vielleicht noch eine Bepunktung rechtfertigen, aber die Werte für die Sprünge (0,41 m Hochsprung, 1,24 m Weitsprung, 0,63 m Stabhochsprung) sind allenfalls noch mathematisch errechnete Werte, die mit realisitischen Leistungen so gar nichts mehr zu tun haben. Ähnliches gilt für die Wurfdisziplinen. 2,05 m im Kugelstoßen, 4,55 m im Diskuswurf und 5,70 m im Speerwurf) verdienen nun wirklich keine 100 Punkte mehr und sind auch zu den Leistungen in den Laufdisziplinen nicht gleichwertig.
Die Anmerkung von Freaky, dass eine Halbierung der Punktzahl nicht zwangsläufig mit einer vollen Halbierung der Leistung verbunden sein muss, ist durchaus richtig und dürfte zumindest zu realistischeren Ergebnissen führen.
Noch einmal:
Mir geht es nicht darum, die NBL-Bewertung gering zu schätzen. Es ist aber auch nicht sachgerecht nur die Schwächen der anderen Bewertungen herauszustellen und das eigene System als Lösung aller Probleme anzusehen. Insbesondere die eingangs geschilderten Mängel bei der Datenerhebung führen zwangsläufig zu Ergebnissen, die den eigenen Anforderungen an ein Bewertungssystem nicht gerecht werden.
Insofern mögen sich an einigen Stellen durchaus realistischere Leistungsvergleiche bei der NBL-Bewertung ergeben - in anderen Bereichen ist das aber auch erkennbar gerade nicht der Fall.
Insgesamt bildet für mich die 1000-er-Punktewertung der IAAF derzeit daher noch die beste Basis zu Leistungsvergleichen zwischen den Disziplinen ab, auch wenn man auch dort vielleicht an der einen oder anderen Stelle diskutable Ergebnisse finden kann.
Ein neues Wertungssystem sollte sich an einer möglichst breiten Datenerhebung von Leistungen orientieren.
Daran fehlt es bereits an der Ausgangsbasis für die Höchstpunktzahlen in eklatanter Weise, da hier einfach nur die Weltrekorde (also eine einzige Leistung) als Höchstwert für die Bepunktung genommen wurde. Das hat man bei den ersten Wertungstabellen, die es gab, auch schon einmal gemacht. Aus guten Gründen ist man davon aber schnell abgerückt. Eine solche Datenbasis ist als statistische Größe viel zu klein. Mein Vorschlag wäre da die Ewige Weltbestenliste mit mindestens 1000 Leistungen/Disziplin als Grundlage zu nehmen und diesen Ergebnissen als oberem Lesitungsbereich eine gleiche Punktzahl zuzuordnen.
Auch die weiteren in II/1.D7 beschriebenen Erhebungsdaten sind zu klein, recht willkürlich gewählt bzw. ungeeignet.
Die Durchschnittsleistungen der 10 weltbesten Mehrkämpfer für die Jahre 1999 + 2005 ist ebenfalls eine viel zu kleine Datenbasis und widerspricht auch der eigenen Zielsetzung eine gerechte Bewertung für alle Anwendungszwecke zu schaffen.
Die Durchschnittsleistungen der DLV-Bestenlisten bis Platz 50 der Jahre 2001/2005/2006/2007 ist ebenfalls noch sehr klein und als Vergleichsgröße für ein System, dass ja international Geltung haben soll, völlig ungeeignet. Dies auch deshalb, wenn man weiß, dass die internationale Leistungsentwicklung, wenn auch in unterschiedlicher Ausprägung in den einzelnen Disziplinen, nach wie vor ansteigend ist. Im DLV ist das Gegenteil der Fall. Hier ist das Leistungsniveau seit mehreren Jahrzehnten stetig abfallend.
Warum die Frauenweltrekorde als Bezugsgröße für die Männertabellen gelten sollen, leuchtet ebenfalls nicht ein.
Auch die regionalen Bestenlisten des Bezirks Potsdam aus den Jahren 1955 und 1963 als Bezugsgröße zu wählen ist sehr willkürlich. In jedem anderen Bezirk und zu jedem anderen Zeitpunkt käme man da zu anderen Werten.
Als grundsätzliche Zielsetzung der Wertungstabelle ist die Leistungsäquivalenz zwischen den Disziplinen durch gleiche Punktzahlen für vergleichbare Leistungen definiert - und zwar in allen Leistungsbereichen.
Aus den auf der Homepage ersichtlichen Vergleichsdarstellungen ist ersichtlich, dass dies erkennbar nicht der Fall ist. Im oberen Bereich sind die Unterschiede zwischen den einzelnen Wertungssystemen vergleichsweise gering. Die Ungleichheit nimmt aber noch unten vor allem bei der NBL-Methode immer mehr zu.
Das führt letztlich dazu, dass die minimale Punktzahl bei der NBL-Methode bereits bei 100 Punkten endet. Der Grund: Die "Leistungen" sind an dieser Stelle zumindest bei einigen Disziplinen bereits so klein, dass sich daraus keine realisitischen kleineren Werte mehr errechnen lassen.
Die Marken für 100 Punkte ergeben bei den 100 m (21,96 Sek.). 400 m (1:50,43 Min.) und 110 m-Hürden (31,71 Sek.) wenigstens noch Leistungen, die im älteren Seniorenbereich vielleicht noch eine Bepunktung rechtfertigen, aber die Werte für die Sprünge (0,41 m Hochsprung, 1,24 m Weitsprung, 0,63 m Stabhochsprung) sind allenfalls noch mathematisch errechnete Werte, die mit realisitischen Leistungen so gar nichts mehr zu tun haben. Ähnliches gilt für die Wurfdisziplinen. 2,05 m im Kugelstoßen, 4,55 m im Diskuswurf und 5,70 m im Speerwurf) verdienen nun wirklich keine 100 Punkte mehr und sind auch zu den Leistungen in den Laufdisziplinen nicht gleichwertig.
Die Anmerkung von Freaky, dass eine Halbierung der Punktzahl nicht zwangsläufig mit einer vollen Halbierung der Leistung verbunden sein muss, ist durchaus richtig und dürfte zumindest zu realistischeren Ergebnissen führen.
Noch einmal:
Mir geht es nicht darum, die NBL-Bewertung gering zu schätzen. Es ist aber auch nicht sachgerecht nur die Schwächen der anderen Bewertungen herauszustellen und das eigene System als Lösung aller Probleme anzusehen. Insbesondere die eingangs geschilderten Mängel bei der Datenerhebung führen zwangsläufig zu Ergebnissen, die den eigenen Anforderungen an ein Bewertungssystem nicht gerecht werden.
Insofern mögen sich an einigen Stellen durchaus realistischere Leistungsvergleiche bei der NBL-Bewertung ergeben - in anderen Bereichen ist das aber auch erkennbar gerade nicht der Fall.
Insgesamt bildet für mich die 1000-er-Punktewertung der IAAF derzeit daher noch die beste Basis zu Leistungsvergleichen zwischen den Disziplinen ab, auch wenn man auch dort vielleicht an der einen oder anderen Stelle diskutable Ergebnisse finden kann.