Model ML · prognoza 5 dni
LightGBM na 25 latach danych IMGW · aktualizacja dzienna
Co to jest?
Autorski model gradient-boosting (LightGBM) wytrenowany wyłącznie na historycznych obserwacjach polskich stacji synoptycznych IMGW-PIB z lat 2001–2022. Przewiduje temperaturę, opady, wiatr, zachmurzenie i wilgotność 1–5 dni do przodu dla pięciu stacji: Warszawa-Okęcie, Kraków-Balice, Poznań-Ławica, Wrocław-Strachowice i Gdańsk-Świbno. 35 osobnych modeli (7 zmiennych × 5 horyzontów) uczy się z opóźnień (lagi 1–7 dni), średnich kroczących (3/7/14 dni) i sinusoidalnej pory roku.
Prognoza 5 dni z kotwicy 2026-04-17
Dokładność na zbiorze testowym (2023-01-01 → 2024-06-30)
| Zmienna | Horyzont | MAE | MAE persyst. | MAE klimat. | Skill vs persyst. | Skill vs klimat. |
|---|---|---|---|---|---|---|
| Max temperature (°C) | D+1 | 2.69 °C | 2.43 | 3.48 | -10.8% | +22.6% |
| ↳ | D+2 | 3.01 °C | 3.32 | 3.46 | +9.4% | +13.2% |
| ↳ | D+3 | 3.19 °C | 3.72 | 3.47 | +14.2% | +8.1% |
| ↳ | D+4 | 3.27 °C | 3.88 | 3.50 | +15.7% | +6.4% |
| ↳ | D+5 | 3.30 °C | 4.05 | 3.50 | +18.5% | +5.7% |
| Min temperature (°C) | D+1 | 2.38 °C | 2.49 | 3.12 | +4.6% | +23.8% |
| ↳ | D+2 | 2.63 °C | 3.17 | 3.10 | +16.8% | +14.9% |
| ↳ | D+3 | 2.73 °C | 3.36 | 3.07 | +18.7% | +11.0% |
| ↳ | D+4 | 2.80 °C | 3.43 | 3.09 | +18.2% | +9.3% |
| ↳ | D+5 | 2.82 °C | 3.54 | 3.08 | +20.3% | +8.4% |
| Mean temperature (°C) | D+1 | 2.20 °C | 1.83 | 2.95 | -19.8% | +25.5% |
| ↳ | D+2 | 2.48 °C | 2.66 | 2.92 | +6.7% | +15.2% |
| ↳ | D+3 | 2.63 °C | 2.99 | 2.93 | +12.1% | +10.3% |
| ↳ | D+4 | 2.72 °C | 3.14 | 2.95 | +13.3% | +7.9% |
| ↳ | D+5 | 2.73 °C | 3.31 | 2.93 | +17.5% | +6.8% |
| Precipitation (mm) | D+1 | 1.74 mm | 2.52 | 2.25 | +30.9% | +22.7% |
| ↳ | D+2 | 1.76 mm | 2.71 | 2.27 | +35.1% | +22.6% |
| ↳ | D+3 | 1.76 mm | 2.77 | 2.30 | +36.5% | +23.3% |
| ↳ | D+4 | 1.75 mm | 2.72 | 2.30 | +35.5% | +23.6% |
| ↳ | D+5 | 1.75 mm | 2.79 | 2.28 | +37.0% | +23.0% |
| Wind speed (m/s) | D+1 | 1.09 m/s | 1.18 | 1.15 | +7.7% | +5.3% |
| ↳ | D+2 | 1.11 m/s | 1.41 | 1.15 | +21.5% | +3.9% |
| ↳ | D+3 | 1.12 m/s | 1.46 | 1.17 | +23.3% | +4.4% |
| ↳ | D+4 | 1.12 m/s | 1.51 | 1.18 | +26.0% | +5.4% |
| ↳ | D+5 | 1.11 m/s | 1.55 | 1.18 | +28.1% | +6.1% |
| Cloud cover (oktas) | D+1 | 1.12 okt. | 1.15 | 2.29 | +1.9% | +50.9% |
| ↳ | D+2 | 1.15 okt. | 1.43 | 2.29 | +19.4% | +49.9% |
| ↳ | D+3 | 1.16 okt. | 1.48 | 2.29 | +21.5% | +49.2% |
| ↳ | D+4 | 1.18 okt. | 1.48 | 2.30 | +20.3% | +48.7% |
| ↳ | D+5 | 1.18 okt. | 1.53 | 2.30 | +23.1% | +48.7% |
| Relative humidity (%) | D+1 | 7.34 % | 7.29 | 8.04 | -0.6% | +8.8% |
| ↳ | D+2 | 7.66 % | 9.17 | 8.05 | +16.5% | +4.8% |
| ↳ | D+3 | 7.73 % | 9.78 | 8.05 | +21.0% | +4.0% |
| ↳ | D+4 | 7.81 % | 9.93 | 8.08 | +21.3% | +3.3% |
| ↳ | D+5 | 7.90 % | 10.28 | 8.08 | +23.1% | +2.2% |
Skill score = 1 − (MAE modelu / MAE punktu odniesienia). Wartość +20% oznacza, że błąd modelu jest o 20% niższy niż prostej heurystyki (persystencja: „jutro = dziś”; klimatologia: średnia z 2001–2022 dla danego dnia roku).
Wykresy diagnostyczne



Ograniczenia
- IMGW publikuje zweryfikowane dane dobowe z ok. 5-dniowym opóźnieniem, więc kotwica prognozy zawsze jest kilka dni „za” dniem dzisiejszym.
- Obecnie aktywne zmienne: T-max, T-min, T-średnia i opady. Zachmurzenie, wiatr i wilgotność są dostępne tylko do 2024-06-30 (ograniczenie źródłowe IMGW s_d_t).
- Lekki zimny bias (~0,5 °C) i suchy bias (~1,7 mm) w oknie testowym 2023–2024. Zwykła korekcja średniej krocznej reszt zniweluje większość.
- To model statystyczny bez asymilacji stanu atmosfery — model fizyczny (ECMWF/ICON) będzie precyzyjniejszy na krótkich horyzontach. Dedykowane użycie: szybka prognoza stacyjna + benchmark operacyjny.
Dane: IMGW-PIB (danepubliczne.imgw.pl) · Model: LightGBM, L1, ~500 drzew na zmienną × horyzont · Kod: build_dataset.py, train_and_forecast.py.