Unabhängiger Vergleich der Flying Start-Wertungsmaschine gegen 75.693 reale Sailwave-Ergebnisse von 96 Segelvereinen aus 10 Ländern.
Über 75.693 einzelne Vergleiche hinweg stimmt die Flying Start-Wertungsmaschine mit Sailwave überein mit einer 99 % Übereinstimmungsrate. Null Wertungsfehler wurden gefunden. Alle Abweichungen werden entweder durch Testdatenqualität oder geringfügige Rundungsunterschiede erklärt, die nie Ergebnisse beeinflussen.
Wir haben einen automatisierten Testrahmen geschrieben, der Sailwave-Ergebnisdaten nimmt, durch die Flying Start-Wertungsmaschine laufen lässt und jeden berechneten Wert mit dem vergleicht, was Sailwave produziert hat. Der Test prüft drei Dinge pro Teilnehmer pro Wettfahrt:
Der Vergleich verwendet zwei Verifizierungsmodi:
Wenn die Quelldaten verstrichene Zeiten und Handicap-Bewertungen enthalten, berechnen wir die berechneten Zeiten von Grund auf mit der entsprechenden Formel (PY, IRC, YTC usw.) und vergleichen mit Sailwaves berechneten Zeiten. Dies validiert die gesamte Pipeline: verstrichene → berechnete → Position → Punkte.
Wenn die Quelldaten nur Positionen und Punkte enthalten (üblich bei Serienzusammenfassungen), verifizieren wir, dass die Position-zu-Punkte-Zuordnung den korrekten Wertungssystemregeln folgt. Dies validiert Strafpunktevergabe, Bonuspunktberechnungen und SCP-Wertung.
Wir haben einen Scraper geschrieben, der systematisch das öffentliche Sailwave-Ergebnisverzeichnisdurchsucht hat, das veröffentlichte Ergebnisse von Segelvereinen weltweit hostet. Für jeden Verein haben wir bis zu 40 Ergebnisseiten abgerufen, Teilnehmerdaten, Wettfahrtergebnisse und Strafcodes extrahiert und in ein strukturiertes Format zur Verifizierung konvertiert.
Für sechs Falmouth Sailing Week 2025-Flotten haben wir einzelne Wettfahrtseiten manuell gescrapt, die vollständige verstrichene und berechnete Zeiten enthielten, was eine Tiefenverifizierung der berechneten Zeiten ermöglichte.
| Quelle | Dateien | Wettfahrten | Vergleiche | Übereinstimmung | Schwer | Leicht |
|---|---|---|---|---|---|---|
| Gescrapt (96 Vereine) | 655 | 4,088 | 74,391 | 99 % | 0 | 1,068 |
| Falmouth Week (Tiefenprüfung) | 6 | 56 | 1,302 | 99 % | 3 | 19 |
| Gesamt | 661 | 4,144 | 75,693 | 99 % | 3 | 1,087 |
0 schwere Abweichungen durch die Engine-Logik verursacht. Die 3 schweren Abweichungen sind alle Datenqualitätsprobleme in unseren Testdaten (im Detail unten erklärt).
Die Wertungsmaschine implementiert die folgenden WR (Wettfahrtregeln)-Funktionen. Alle wurden beim Testen genutzt:
| Funktion | Abdeckung |
|---|---|
| PY-Handicap (UK-Jollen) | Getestet über 60+ UK-Vereine |
| IRC-Handicap (internationale Yachten) | Getestet mit Falmouth Week IRC1/2/3-Flotten |
| YTC-Handicap (UK-Fahrtensegler) | Getestet mit Falmouth Week YTCE/YTCQ-Flotten |
| Niedrigpunktwertung | Getestet in allen 4.144 Wettfahrten |
| Bonuspunktwertung | Getestet, wo Vereine sie verwenden |
| DNS- / DNF- / DNC-Strafen | Getestet über alle Vereine |
| OCS / DSQ / RET / UFD / BFD | Getestet, wo sie in Ergebnissen auftreten |
| WR-Regel A5.3 (optionale Strafwertung) | Standard für alle Testläufe — Boote im Bereich + 1 vs. Meldungen + 1 |
| SCP (Wertungsstrafe) | Getestet, wo Vereine prozentuale Strafen anwenden |
| Streicherprofile | Getestet über Serienranglisten-Vergleich |
| WR Anhang A8 Stichentscheid | Getestet über Positionsvergleich bei punktgleichen Flotten |
Wir haben bewusst über ein breites geographisches und organisatorisches Spektrum getestet. Vereinssegeln im Solent hat andere Eigenschaften als Mittwochabend-Segeln auf einem walisischen Stausee oder eine australische O'pen Skiff-Meisterschaft. Die Wertungsmaschine muss alle bewältigen.
Hayling Island SC, Parkstone YC, Poole YC, Warsash SC, Torbay SC, Cardiff Bay YC, Delph SC, Mengeham Rythe SC, Burghfield SC, Oxford SC, Chichester YC, Brancaster Staithe SC, Bexhill SC, Salcombe YC, Paignton SC, Brixham YC, Medway YC, Bartley SC, Northampton SC, Largo Bay SC, RCYC, Ranelagh SC, Twickenham YC, Cambridge YC, Ogston SC, Rutland SC, Bala SC, Maylandsea Bay SC, Royal Lymington YC, Flushing SC, Chase SC, Chipstead SC, Rock SC, BCYC, YDSC und viele Klassenvereinigungen (Solo, Osprey, Fireball, 29er, ILCA UK, ITCA, UKWA, Redwings).
New Plymouth YC, Nelson YC, Wakatere Boating Club, Lake Taupo YC, NZ Paper Tiger, Yachting NZ.
Manly YC, Perth SC, Maroochy, Hobie WA, Lake Cootharaba SC, Open Skiff-Klasse (nationale und Landesmeisterschaften).
Südafrika (Bloemfontein YC), Schweden (KSSS), Ungarn (Ergebnisse über hunresults), Portugal, USA (KHYC — King Harbor YC), Kanada (Whitby YC).
Sechs Flotten vom Bay-Kurs — IRC 1, IRC 2, IRC 3, YTC Cruiser, YTC Quarter-Tonner und Firebird — mit vollständigen verstrichenen und berechneten Zeiten von einzelnen Wettfahrtseiten gescrapt, gehostet bei sailwave.com/results/FSW.
Von den 75.693 Vergleichen stimmten 1.090 nicht exakt überein. Hier ist jede Abweichungskategorie, was sie verursacht hat und ob sie relevant ist.
Alle drei sind Datenqualitätsprobleme in unseren Testdaten, keine Wertungsmaschinen-Fehler.
Abweichung: Punkte — Sailwave sagt 11, Flying Start sagt 8.
Ursache: Das Mittwochs-Champagne-Race hatte 3 Gastboote (Autarky, Infinity, Passion), die nicht in der regulären Serie waren. Unser gescraptes XML enthielt sie nicht, sodass die Flottengröße 10 statt 13 war. Percy wurde 8. von 10 in unseren Daten vs. 11. von 13 bei Sailwave.
Ergebnis: Beide Wertungsmaschinen sind korrekt. Der Unterschied liegt in den Eingabedaten, nicht in der Berechnung.
Abweichung: Punkte — Sailwave sagt 12, Flying Start sagt 9.
Ursache: Wie oben. Gastboote haben die Flottengröße in Sailwaves Daten aufgebläht.
Abweichung: Berechnete Zeit — Sailwave sagt 1:10:13, Flying Start sagt 1:08:32.
Ursache: Tahini segelte am Mittwoch mit einer anderen YTC-Bewertung (1054) als im Rest der Serie (1080). Unser XML verwendete 1080 für alle Wettfahrten. Die berechnete-Zeit-Formel ist elapsed × 1000 ÷ rating, also andere Bewertung = andere berechnete Zeit.
Ergebnis: Beide Formeln sind korrekt. Der Unterschied liegt in den Handicap-Daten, nicht in der Berechnung.
Alle 1.087 leichten Abweichungen fallen in zwei Kategorien:
Unterschiede von 1–3 Sekunden zwischen Sailwave und Flying Start, verursacht durch Zwischenrundungen in Sailwaves Berechnungskette. Zum Beispiel IRC berechnete Zeit = verstrichene × TCC. Wenn verstrichene = 3.428 s und TCC = 1,072:
3428 × 1.072 = 3674.816 → 3675sAuswirkung: Keine. Ein Unterschied von 1–3 Sekunden in der berechneten Zeit ändert nie eine Zielposition — Boote sind typischerweise durch Minuten getrennt.
Unterschiede von 0,1–0,3 Punkten, bei denen Sailwaves Bonuspunkt-Bruchteile oder SCP-Prozentberechnungen leicht abweichen. Zum Beispiel sollte der 3. Platz in der Bonuspunktwertung genau 5,7 betragen, aber einige Sailwave-Versionen scheinen intern leicht unterschiedliche Gleitkomma-Präzision zu verwenden.
Auswirkung: Vernachlässigbar. Diese Bruchteile ändern nie die Rangliste, da sie kleiner sind als der Abstand zwischen zwei beliebigen Zielpositionen.
Beim Testen haben wir einen Bereich gefunden, in dem Sailwaves Verhalten zwischen Vereinen inkonsistent ist. Wir behaupten nicht, dass dies ein Fehler ist — es kann eine beabsichtigte Konfigurationsoption sein — aber es ist wert, für Wettfahrtleiter dokumentiert zu werden, die von Sailwave migrieren.
Sailwave verwendet TLE als Strafcode für Boote, die nicht innerhalb des Zeitlimits ins Ziel kommen. Dieser Code kommt in den Wettfahrtregeln (WR) nicht vor. Das WR-Äquivalent wäre DNF (Did Not Finish).
Wir haben festgestellt, dass Sailwave TLE zwischen verschiedenen Vereinen inkonsistent behandelt:
starters + 1 (gleich wie DNF)last finisher's position + 1Flying Start behandelt TLE als gleichwertig zu DNF (starters + 1), was dem häufigsten Sailwave-Verhalten entspricht und mit dem WR-Prinzip übereinstimmt, dass ein Boot, das startet aber nicht beendet, starters + 1 Punkte erhält.
Diese Inkonsistenz erklärt einen Teil unserer leichten Abweichungen. Wenn dein Verein TLE mit speziellen Wertungsregeln verwendet, bitte lass es uns wissen und wir werden sicherstellen, dass Flying Start deiner Praxis entspricht.
Trotz Testens von 4.144 Wettfahrten haben wir keine Fälle gefunden, in denen Sailwave falsche Ergebnisse gemäß WR-Regeln produziert. Alle Abweichungen sind durch Rundung, Datenqualität oder die oben beschriebene TLE-Mehrdeutigkeit erklärbar. Sailwave ist seit 20+ Jahren aus gutem Grund der Industriestandard — die Mathematik stimmt.
Wir stellen auch fest, dass die Mehrheit unserer Vergleiche (74.391 von 75.693) reine Punktevergleiche aus Serienzusammenfassungen sind. Die Tiefenverifizierung der berechneten Zeiten umfasst 1.302 Vergleiche von der Falmouth Week. Wir würden Zugang zu weiteren Veranstaltungen mit veröffentlichten verstrichenen und berechneten Zeiten begrüßen, um diese Verifizierung zu stärken.
Der Testrahmen, die gescrapten Daten und vollständigen Ergebnisse sind in einem eigenen Open-Source-Repository veröffentlicht:
| Pfad | Beschreibung |
|---|---|
| scripts/soak-test.ts | CLI-Testrunner — parst XML, führt Verifizierung durch, erstellt Bericht |
| scripts/scrape-sailwave.ts | Web-Scraper für Sailwave-HTML-Ergebnisseiten |
| verifier/sailwaveVerifier.ts | Die Vergleichs-Engine — berechnet berechnete Zeiten, Positionen, Punkte neu |
| scoring-engine/ | Die Wertungsmaschine selbst — raceScorer, seriesScorer, handicapCalculator, tieBreaker |
| data/sources.json | Vollständiges Log aller 1.266 gescrapten Quell-URLs |
| data/soak-results.json | Vollständige Testergebnisse mit dateibezogenen Übereinstimmungsraten und Abweichungsdetails |
| REPORT.md | Detaillierter Ergebnisbericht |
Der Scraper respektiert zuvor gescrapte URLs (verfolgt in sources.json) und ruft nur neue Seiten ab. Die gesamte Testsuite läuft in unter 60 Sekunden auf den gescrapten Daten.
Alle Sailwave-Ergebnisdaten stammen aus öffentlich veröffentlichten Ergebnissen bei sailwave.com/results. Sailwave ist eine Marke von Jon Mayall. Flying Start ist nicht mit Sailwave verbunden.