• Hallo Gast, wir suchen den Renner der Woche 🚴 - vielleicht hast du ein passendes Rennrad in deiner Garage? Alle Infos

2 Rennräder - 1 Berg - gleiche Leistung - komplett unterschiedliche Zeiten

Ich würde anraten, den Test mit jedem Bike ca. 5-10 mal zu wiederholen und dann die Zeiten und Wattzahlen gegenüberzustellen. Dann sieht man einerseits die Varianz durch äußere Einflüsse schon etwas und kann sich sicher sein, dass die Unterschiede nicht dadurch gekommen sind.
Kann man machen, das hat zumindest einen Trainingseffekt. Sonst bringt es nicht viel, weil erstens die Zahl viel zu klein ist um statistisch relevante Aussagen treffen zu können und weil zweitens nach wie vor die Powermeter komplett unterschiedliche Daten liefern können.
 
Du ziehst Dich jetzt auf ein (angebliches) Expertentum zurück und erklärst, dass Nicht-Experten das halt leider nicht verstehen können. Ziemlich genau so hat das der GF der sagenumwobenen CyFly-Kurbel auch gemacht - echte Daten wurden natürlich nie rausgerückt. Ich bin selber Experte (auf einem ganz anderen Gebiet); nach meiner Erfahrung habe ich selbst eine Sache nur dann verstanden, wenn ich sie einem anderen (halbwegs intelligenten) Menschen erklären kann. Mich würde beispielsweise nur schon mal interessieren, mit welchem Testaufbau man nachweisen möchte, wieviele Minuten pro Stunde eine Kettenstrebe am Berg (und nur dort!) schneller sein soll.

Jetzt aber sorry.... ich arbeite seit gut 25 Jahren genau in diesem Bereich. Muss ich dir jetzt alles zerstückelt erklären? Oder ist es laut dir besser wenn Leute die von einem Thema eine Ahnung haben, besser still sein sollen und hier nicht posten??
Ich wollte nur dem Themenersteller einen weiteren Gesichtspunkt zu seiner Fragestellung aufweisen.
 
Hier wird so unglaublich viel durcheinander geworfen.
Es gibt genügend Wege der Energie aus dem System aufgrund eines weichen Tretlagers.
Schlimmstfall: Es ist antizyklisch zum Tritt und die Abwärme entsteht in deiner Muskulatur.
Außerdem sind [10-20]W Leistung bei vielen Fahrern sehr relevant, aber spielen beim Thema Erhitzen aber quasi keine Rolle, solange man es nicht auf einen winzigen Punkt konzentriert, wie etwa bei einem Lötkolben.
Es ist simpel, den gewonnen Zeitunterschied aufgrund der leichteren Transportmasse ist nicht trivial zu bestimmen, da hierfür alle Verlustleistung bekannt sein müsste, kann aber extrem einfach nach oben abgeschätzt werden, indem man keinerlei Verluste annimmt. Selbst bei dieser Abschätzung, die nachweislich über dem Realverlust liegen muss, kommen erheblich geringere Werte heraus.
Das Messsystem misst überhaupt nicht die relevante Größe, die Durchschnittsleistung ist schlicht die falsche Größe. Eigentlich können wir mit dieser Erkenntnis die Diskussion schon beenden. Hinzu kommen 3% Messfehler der Momentaufnahme (!) bei diesem Powermeter, die Fehlerfortpflanzung bei der Mittelung ist erheblich. Da kommen rund 10% Messfehler für 2 Sigma heraus. Damit ist der Vergleich der dafür zu ähnlichen Werte auch hinfällig.
Dann kommen Verluste im System, im Antrieb, der Kette, nicht lineare Verluste wie Windwiderstand, unterschiedliche Leistungsverteilung innerhalb des Tritts, Wind, Wetter, leichte Abweichungen im Weg, Hydration des Fahrers und allerlei andere Faktoren ins Spiel.
Das ist einfach kein Experiment mit Aussagekraft, also was soll diese Diskussion?
Wiederholung um 10 Mal bringt da auch nichts, da vergleicht man dann mit geringer Sicherheit die Gesamtsysteme, aber nicht den Unterschied den das Gewicht des Rades macht.
 
Zuletzt bearbeitet:
Jetzt aber sorry.... ich arbeite seit gut 25 Jahren genau in diesem Bereich. Muss ich dir jetzt alles zerstückelt erklären? Oder ist es laut dir besser wenn Leute die von einem Thema eine Ahnung haben, besser still sein sollen und hier nicht posten??
Ich wollte nur dem Themenersteller einen weiteren Gesichtspunkt zu seiner Fragestellung aufweisen
Nicht nötig, alles klar. Danke.
 
Wie soll im Rahmen Leistung verpuffen? Das müsste ja über Abwärme in relevanter Größe geschehen.

Der unbändige Vorwärtsdrang™ ist ein zäher Mythos. Wenn sich das Tretlager in eine Richtung verwindet, dann bekommt man diesen „Verlust“ wie bei einer Feder quasi verlustfrei an einem anderen Moment der Kurbeldrehung wieder zurück in den Antrieb.
Haste auch nicht aufgepasst... beim Möve-Schwurbelantrieb hat es unser Lieblings-CEO doch genau erklärt! :)
 
weil erstens die Zahl viel zu klein ist um statistisch relevante Aussagen treffen zu können
Je nach Varianz ist deine Aussage schlicht falsch. Gegenbeispiel?

n1<-rnorm(10, mean=1)
n1
[1] 2.49677061 1.23639358 -0.12385588 0.59569686 0.51091094 0.05113214
[7] 0.86737496 1.99288071 0.37753961 2.30137472
n2<-rnorm(10, mean=0)
n2
[1] 1.29879351 0.87976683 0.55430198 0.55376012 -1.75270907 -0.25560625
[7] -0.95587684 -0.47914474 1.96528786 -0.01974696
t.test(n1,n2,alternative="greater")

Welch Two Sample t-test

data: n1 and n2
t = 1.8618, df = 17.566, p-value = 0.03972
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
0.0573863 Inf
sample estimates:
mean of x mean of y
1.0306218 0.1788826

Grüße gehen raus an diejenigen, die einfach mal lautstark ohne Begründung gegeneseln.

Wiederholung um 10 Mal bringt da auch nichts, da vergleicht man dann mit geringer Sicherheit die Gesamtsysteme, aber nicht den Unterschied den das Gewicht des Rades macht.
Siehst du und ich dachte genau darum ging es ;), denn im Eingangsbeitrag wurde sehr allgemein gefragt nach:
Hat dafür jemand eine (sinnvolle) Erklärung?

Eine Erklärung wäre statistische Varianz. Um diese auszuschließen müsste man das ganze mehrfach wiederholen. Daher mein Vorschlag, den ich weiterhin gut finde, auch wenn jetzt schon 2 das anders sehen, einmal mit falsche Begründung (n zu klein) und einmal weil wohl der Eingangspost nicht gelesen oder anders verstanden wurde.
 
Welch-T und Student-T (wer sagt hier eigentlich, dass die Verteilung asymmetrisch ist, so klar ist mir das zumindest nicht) stolpern bei den kleinen Messvorgaengen trotzdem aus den Annahmen und werden damit mehr als fragwuerdig (wenn auch leider viel zu haeufig so angewandt). Zumal wir hier bunt statistische und systematische Fehler durcheinander werfen. Wenn das Powermeter zum Beispiel statisch abweicht, bringt das wirklich null, um mal einen systematischen Fehler beispielhaft mit anzumerken. Ueber komplexe Systeme so zu bewerten hat mehr anekdotischen Charakter und wirkt halt toll, bis sich jemand damit auskennt.
Ich finde es auch aeusserst fragwuerdig hier im Radforum R-Code als "Eklaerung" zu liefern. Hat eher was von "Schaut mal, ich kenne mich damit aus, mir egal was ihr damit anfangen koennt".
 
Ich finde es auch aeusserst fragwuerdig hier im Radforum R-Code als "Eklaerung" zu liefern.
War auch nicht mein erster Gedanke. Aber einfach gegenzueseln ohne Argumente fand ich auch falsch, da sonst niemand nachvollziehen kann, warum ich gegenesel.

Was wäre denn dein Vorschlag, wie ich hier besser argumentieren könnte? Oder einfach ignorieren? Dann denken nachher noch tatsächlich Leute, dass eine kleine Stichprobe niemals statistisch ausreichen kann... Schwierig.
 
War auch nicht mein erster Gedanke. Aber einfach gegenzueseln ohne Argumente fand ich auch falsch, da sonst niemand nachvollziehen kann, warum ich gegenesel.

Was wäre denn dein Vorschlag, wie ich hier besser argumentieren könnte? Oder einfach ignorieren? Dann denken nachher noch tatsächlich Leute, dass eine kleine Stichprobe niemals statistisch ausreichen kann... Schwierig.
Die Stichprobe ist im hier zur Debatte stehenden Fall einfach zu klein, selbst wenn man die Problematik der unterschiedlichen Messgeräte rausrechnen könnte. Es gibt viel zu viele Faktoren, die wir nicht beziffern können und die einen Einfluss haben. Eine Generalisierung zur notwendigen Mindestgröße einer Stichprobe, die statistische Signifikanz beanspruchen kann, habe ich gar nicht vorgenommen.
 
Überprüfe doch deine Leistungsmesser: Hilfeseite von Power2Max

Support --> Wie kann ich überprüfen, ob mein Leistungsmesser wirklich genau misst?

Test nach Anleitung durchführen und mit der Berechnung auf der verlinkten Seite abgleichen. Am Besten bei dir um die Ecke was suchen, vorher (und hinterher) das Systemgewicht wiegen (Fehlerquelle Personenwaage???), Bekleidung gleich tragen (also Trikot bis oben hin zu), gleiche Sitzposition, möglichst gleichmäßig, mehrere Durchgänge.
 
Ob die Zahl der Versuche ausreichen, sieht man schon an der Schwankungsbreite. Aber es geht eben nur um die Zufallsfehler, die man damit in den Griff bekommt.
Das eigentliche Problem sind die systematischen Fehler, die halt bei beliebig vielen Versuchen immer gleich falsch sind. (etwa falsche Eichung).

Gruß messi

Mal ein Beispiel: Ich vergleiche auf meiner Hausstrecke die Streckenlänge per Radumfang/Tacho. Wenn die gemessene Streckenlänge bei 10 Versuchen immer innerhalb von +-0,2% bleiben, hat das eine sehr hohe Aussage über die Wiederholgenauigkeit. Da bekommt man nicht einfach mal zufällig eine Abweichung von 1%.

Aber ich bekomme keinerlei Aussagen über die absolute Entfernung, weil ich vielleicht einen systematisch falschen Umfang eingebe. Ob nun 10x oder 1.000x. Ist immer falsch, wenn auch präzise falsch.
 
Zuletzt bearbeitet:
Was wäre denn dein Vorschlag, wie ich hier besser argumentieren könnte?
Mit diesem Experiment? Schwerlich, da was Sinnvolles zu liefern. Ein viel zu komplexes System, um echte Erkenntnisse derartig banal zu gewinnen.
Wenn es jetzt um Erkenntnisgewinn geht, wuerde ich erstmal das Design des Experiments infrage stellen.
Wir koennen den Faktor Gewicht aufgrund der Theorie (nicht Hypothese, ich unterscheide da) zwar ausschliessen, wenn man das experimentell machen will, kann man aber dasselbe Rad mehrmals in geeigneter Reihenfolge hochfahren, mit und ohne Zusatzgewicht.
Wenn man jetzt die beiden Raeder vergleichen will, muss zunaechst das Powermeter natuerlich abgeglichen werden. Danach kann man beispielsweise beide auf einen Rollentrainer spannen und Powerkurbel und Rollentrainer Power vergleichen, um Verluste im Antrieb und Rahmen relativ abzugleichen. Relativ, da beide Messgeraete zu ungenau sind um absolut zu messen, aber Rad 1 und Rad 2 zu Rollentrainer, bei geeignet haeufiger Wiederholung birgt natuerlich Aussagekraft.
Wenn man es dann noch etwas ernster mein, muss dann mal der Widerstand verglichen werden. In "Kletterposition" des Fahrers ausrollen lassen ist eine der Moeglichkeiten.
Es gibt unsaeglich viele Ansaetze und vermutlich auch Unmengen besserer als die von mir genannten. Fakt ist aber, das Experiment ist einfach nicht zweckdienlich, gerade bei einem so komplexen System sollte man schon mal eine gewisse Variabilitaet bei den "Messungen" erzeugen.
 
Mit diesem Experiment? Schwerlich, da was Sinnvolles zu liefern. Ein viel zu komplexes System, um echte Erkenntnisse derartig banal zu gewinnen.
Siehst du, und genau da gibt es offenbar zwei Interpretationen der Eingangsfrage:

1. Was exakt führt zu dieser Differenz.
2. Ist diese eine Differenz Zufall (liegt sie also nicht an den unterschiedlichen Fahrrädern).

Für 1. gebe ich recht, das kann man so einfach nicht beziffern, da zu viele Größen unbekannt sind.
Für 2. wäre es erstmal ausreichend zu sehen, ob die Differenz reproduzierbar ist. Das beantwortet zwar nicht die Frage, was zur Differenz führt, beantwortet aber unter Umständen, ob überhaupt eine Differenz vorhanden ist (ob diese dann nun durch Systematik oder Gewicht oder sonst was entstanden ist steht auf einem anderen Blatt). Und dafür reicht dann auch eine relativ kleine Stichprobe.
 
Jetzt aber sorry.... ich arbeite seit gut 25 Jahren genau in diesem Bereich. Muss ich dir jetzt alles zerstückelt erklären? Oder ist es laut dir besser wenn Leute die von einem Thema eine Ahnung haben, besser still sein sollen und hier nicht posten??
Ich wollte nur dem Themenersteller einen weiteren Gesichtspunkt zu seiner Fragestellung aufweisen.
klar es sind die streben … das geheimnis von jumbo 🥳
 
Siehst du, und genau da gibt es offenbar zwei Interpretationen der Eingangsfrage:

1. Was exakt führt zu dieser Differenz.
2. Ist diese eine Differenz Zufall (liegt sie also nicht an den unterschiedlichen Fahrrädern).

Für 1. gebe ich recht, das kann man so einfach nicht beziffern, da zu viele Größen unbekannt sind.
Für 2. wäre es erstmal ausreichend zu sehen, ob die Differenz reproduzierbar ist. Das beantwortet zwar nicht die Frage, was zur Differenz führt, beantwortet aber unter Umständen, ob überhaupt eine Differenz vorhanden ist (ob diese dann nun durch Systematik oder Gewicht oder sonst was entstanden ist steht auf einem anderen Blatt). Und dafür reicht dann auch eine relativ kleine Stichprobe.
Nun, eventuell wissen wir mehr nach 10 Versuchen, abhaengig von der Verteilung. Wenn diese ungeeignet ist, koennten wir hoechstens sagen, dass das Experiment schlecht ist.
Aber ja, wir koennten wissen, ob das eine Rad mit diesem Fahrer bei gleicher Durchschnittsleistung schneller ist. Ich hatte die Frage eher als Ursachenforschung verstanden.
 
Zurück
Oben Unten