Model ML · prognoza 5 dni
LightGBM na 25 latach danych IMGW · aktualizacja dzienna
Co to jest?
Autorski model gradient-boosting (LightGBM) wytrenowany wyłącznie na historycznych obserwacjach polskich stacji synoptycznych IMGW-PIB z lat 2000–2022. Przewiduje temperaturę, opady, wiatr, zachmurzenie i wilgotność 1–5 dni do przodu dla pięciu stacji: Warszawa-Okęcie, Kraków-Balice, Poznań-Ławica, Wrocław-Strachowice i Gdańsk-Świbno. 35 osobnych modeli (7 zmiennych × 5 horyzontów) uczy się z opóźnień (lagi 1–7 dni), średnich kroczących (3/7/14 dni) i sinusoidalnej pory roku.
Prognoza 5 dni z kotwicy 2026-06-04
Dokładność na zbiorze testowym (2023-01-01 → 2024-06-30)
| Zmienna | Horyzont | MAE | MAE persyst. | MAE klimat. | Skill vs persyst. | Skill vs klimat. |
|---|---|---|---|---|---|---|
| Max temperature (°C) | D+1 | 3.09 °C | 2.38 | 3.80 | -29.5% | +18.8% |
| ↳ | D+2 | 3.43 °C | 3.35 | 3.82 | -2.3% | +10.2% |
| ↳ | D+3 | 3.58 °C | 3.82 | 3.84 | +6.2% | +6.5% |
| ↳ | D+4 | 3.64 °C | 4.09 | 3.85 | +11.1% | +5.5% |
| ↳ | D+5 | 3.66 °C | 4.31 | 3.85 | +15.0% | +4.9% |
| Min temperature (°C) | D+1 | 2.67 °C | 2.53 | 3.30 | -5.5% | +19.0% |
| ↳ | D+2 | 2.90 °C | 3.24 | 3.29 | +10.5% | +11.7% |
| ↳ | D+3 | 3.03 °C | 3.62 | 3.27 | +16.4% | +7.6% |
| ↳ | D+4 | 3.08 °C | 3.78 | 3.28 | +18.4% | +5.9% |
| ↳ | D+5 | 3.09 °C | 3.89 | 3.26 | +20.6% | +5.3% |
| Mean temperature (°C) | D+1 | 2.48 °C | 1.82 | 3.19 | -36.4% | +22.2% |
| ↳ | D+2 | 2.81 °C | 2.72 | 3.20 | -3.3% | +12.3% |
| ↳ | D+3 | 2.96 °C | 3.17 | 3.21 | +6.4% | +7.7% |
| ↳ | D+4 | 3.00 °C | 3.39 | 3.21 | +11.6% | +6.7% |
| ↳ | D+5 | 3.03 °C | 3.59 | 3.21 | +15.7% | +5.6% |
| Precipitation (mm) | D+1 | 1.42 mm | 2.08 | 2.03 | +31.9% | +30.2% |
| ↳ | D+2 | 1.42 mm | 2.25 | 2.04 | +36.9% | +30.4% |
| ↳ | D+3 | 1.41 mm | 2.28 | 2.03 | +38.3% | +30.6% |
| ↳ | D+4 | 1.41 mm | 2.29 | 2.03 | +38.4% | +30.4% |
| ↳ | D+5 | 1.41 mm | 2.36 | 2.01 | +40.3% | +30.0% |
| Wind speed (m/s) | D+1 | 1.05 m/s | 1.13 | 1.09 | +6.9% | +3.8% |
| ↳ | D+2 | 1.08 m/s | 1.37 | 1.10 | +21.7% | +2.3% |
| ↳ | D+3 | 1.08 m/s | 1.46 | 1.11 | +26.0% | +3.4% |
| ↳ | D+4 | 1.08 m/s | 1.50 | 1.13 | +28.3% | +4.3% |
| ↳ | D+5 | 1.07 m/s | 1.52 | 1.13 | +29.7% | +5.3% |
| Cloud cover (oktas) | D+1 | 1.36 okt. | 1.39 | 1.53 | +2.2% | +11.5% |
| ↳ | D+2 | 1.41 okt. | 1.69 | 1.54 | +16.7% | +8.6% |
| ↳ | D+3 | 1.41 okt. | 1.76 | 1.53 | +19.9% | +7.5% |
| ↳ | D+4 | 1.43 okt. | 1.79 | 1.53 | +20.1% | +6.8% |
| ↳ | D+5 | 1.43 okt. | 1.85 | 1.54 | +22.6% | +6.9% |
| Relative humidity (%) | D+1 | 7.55 % | 7.30 | 8.46 | -3.4% | +10.7% |
| ↳ | D+2 | 7.93 % | 9.12 | 8.48 | +13.0% | +6.4% |
| ↳ | D+3 | 8.07 % | 9.90 | 8.49 | +18.5% | +4.9% |
| ↳ | D+4 | 8.25 % | 10.32 | 8.44 | +20.0% | +2.3% |
| ↳ | D+5 | 8.42 % | 10.76 | 8.43 | +21.7% | +0.1% |
Skill score = 1 − (MAE modelu / MAE punktu odniesienia). Wartość +20% oznacza, że błąd modelu jest o 20% niższy niż prostej heurystyki (persystencja: „jutro = dziś”; klimatologia: średnia z 2000–2022 dla danego dnia roku).
Wykresy diagnostyczne



Ograniczenia
- IMGW publikuje zweryfikowane dane dobowe z ok. 5-dniowym opóźnieniem, więc kotwica prognozy zawsze jest kilka dni „za” dniem dzisiejszym.
- Obecnie aktywne zmienne: T-max, T-min, T-średnia i opady. Zachmurzenie, wiatr i wilgotność są dostępne tylko do 2024-06-30 (ograniczenie źródłowe IMGW s_d_t).
- Lekki zimny bias (~0,5 °C) i suchy bias (~1,7 mm) w oknie testowym 2023–2024. Zwykła korekcja średniej krocznej reszt zniweluje większość.
- To model statystyczny bez asymilacji stanu atmosfery — model fizyczny (ECMWF/ICON) będzie precyzyjniejszy na krótkich horyzontach. Dedykowane użycie: szybka prognoza stacyjna + benchmark operacyjny.
Dane: IMGW-PIB (danepubliczne.imgw.pl) · Model: LightGBM, L1, ~500 drzew na zmienną × horyzont · Kod: build_dataset.py, train_and_forecast.py.