← obzorweather.com

Локална метеостанция vs ERA5

Калибрация и валидация на глобален климатичен модел с локални измервания | Морска Перла, Обзор

📍 42.822°N, 27.884°E 📅 2024-10-17 → 2026-01-09 ⏱️ 10,343 часа данни

📋 Цел на анализа

Този анализ сравнява данните от локалната метеостанция с ERA5 — глобален атмосферен реанализ на ECMWF (Европейски център за средносрочни прогнози). ERA5 комбинира милиони метеорологични наблюдения с физичен модел на атмосферата, генерирайки хомогенен набор от данни с резолюция ~25 km и почасова стъпка от 1940 г. до днес.

🎯 Какво искаме да разберем?

  • Доколко ERA5 отразява реалните условия в нашата конкретна локация?
  • Кои метеорологични параметри са надеждни и кои не?
  • Къде ERA5 систематично греши и може ли да се коригира?
  • Как местните фактори влияят на точността?

💡 Защо?

  • Историческа реконструкция: Попълваме данни назад до 1940 г.
  • Запълване на пропуски: При отказ на станцията или липса на данни
  • Валидация: Оценяваме качеството на глобалния модел локално
  • Калибрация: Извеждаме корекционни формули за нашата точка

📍 Местоположение

Обзор е черноморски курортен град на границата между Варненска и Бургаска област, на 58 км южно от Варна и 70 км северно от Бургас. Станцията е разположена непосредствено на брега — открита към морето от изток и север, без естествени прегради от тези посоки.

Метеостанция ECOWITT WS2320

  • Локация: Морска Перла, Обзор
  • Координати: 42.821°N, 27.884°E
  • Височина: 15.2м над земята (2.5м над покрива)
  • Ограничения: При ЮЗ, З и СЗ вятър — занижени стойности поради сгради, терен и растителност
  • Открити посоки: С, СИ, И (350°-70°)

📊 Обобщени резултати от калибрацията

🌡️ Температура

0.939
Корелация 0.969
Bias -0.88 °C
MAE 1.60 °C
RMSE 2.13 °C
N 10,260
corrected = 0.9985 × ERA5 -0.8560
95% CI: slope ±0.0049, intercept ±0.0764
Отличен

☀️ Слънчева радиация

0.899
Корелация 0.948
Bias -0.23 W/m²
MAE 39.41 W/m²
RMSE 79.76 W/m²
N 10,260
corrected = 0.9798 × ERA5 +3.0127
95% CI: slope ±0.0064, intercept ±1.8490
Отличен

💧 Точка на оросяване

0.933
Корелация 0.966
Bias -1.01 °C
MAE 1.56 °C
RMSE 2.10 °C
N 10,260
corrected = 1.0112 × ERA5 -1.1114
95% CI: slope ±0.0052, intercept ±0.0603
Отличен

🌡️ Усеща се като

0.907
Корелация 0.952
Bias +0.85 °C
MAE 2.75 °C
RMSE 3.35 °C
N 10,260
corrected = 0.7847 × ERA5 +3.4204
95% CI: slope ±0.0049, intercept ±0.0752
Отличен

💦 Влажност

0.603
Корелация 0.777
Bias -0.77 %
MAE 6.51 %
RMSE 8.59 %
N 10,260
corrected = 0.7749 × ERA5 +16.5503
95% CI: slope ±0.0122, intercept ±0.9493
Добър

🔵 Налягане (Ecowitt)

0.989
Корелация 0.995
Bias -0.82 hPa
MAE 0.85 hPa
RMSE 0.99 hPa
N 5,983
corrected = 0.9832 × ERA5 +16.2519
95% CI: slope ±0.0026, intercept ±2.6543
Отличен

⚪ Налягане (относ.)

0.286
Корелация 0.534
Bias -5.42 hPa
MAE 7.06 hPa
RMSE 8.98 hPa
N 10,260
corrected = 0.5358 × ERA5 +467.4996
95% CI: slope ±0.0164, intercept ±16.7094
Слаб

💨 Вятър (всички)

0.346
Корелация 0.588
Bias -1.43 m/s
MAE 1.75 m/s
RMSE 2.17 m/s
N 10,260
corrected = 0.5016 × ERA5 +0.3787
95% CI: slope ±0.0133, intercept ±0.0547
Слаб

🧭 Вятър (открити)

0.693
Корелация 0.833
Bias -1.14 m/s
MAE 1.48 m/s
RMSE 1.81 m/s
N 1,101
corrected = 1.0134 × ERA5 -1.2040
95% CI: slope ±0.0398, intercept ±0.2029
Добър

🌧️ Валежи

0.143
Корелация 0.378
Bias +0.63 mm
MAE 0.67 mm
RMSE 3.16 mm
N 10,260
corrected = 4.6463 × ERA5 +0.4167
95% CI: slope ±0.2202, intercept ±0.0586
Слаб

📉 Разпределение на грешките

Хистограмите показват колко често ERA5 греши и с колко. Идеалният случай: висок връх около нулата (малки грешки са чести) и бързо спадане към краищата (големи грешки са редки).

Температура (°C)

μ = -0.88°C, σ = 1.94°C

Влажност (%)

μ = -0.8%, σ = 8.6%

Вятър (m/s)

μ = -1.43 m/s, σ = 1.62 m/s

📖 Как да четем графиките?

🌡️ Температура

Времеви ред

Scatter Plot (Станция vs ERA5)

☀️ Слънчева радиация

Времеви ред (W/m²)

Scatter Plot

💦 Влажност

⚠️ Умерена надеждност (R² = 0.60)
Влажността показва по-слаба корелация поради крайбрежното местоположение на станцията. Морският бриз, локалните температурни разлики и микроклиматът на бреговата линия създават вариации, които ERA5 с резолюция 25 km не може да улови точно.

Влажност (%)

Scatter Plot

💧 Точка на оросяване & Усеща се като

ℹ️ Производни величини: Точката на оросяване и „усеща се като" са производни величини, изчислявани на база температура и влажност. Поради умерената точност на влажността (R² ≈ 0.60), тези параметри наследяват част от несигурността ѝ. Въпреки това, високата точност на температурата води до запазване на силна линейна връзка и висока обяснена вариация (R² > 0.90) за производните величини.

Точка на оросяване (°C)

Усеща се като (°C)

🔵 Атмосферно налягане

ℹ️ Сравнение на източниците: ERA5 използва налягане приведено към морско ниво (MSL). За коректно сравнение е необходимо да се използва абсолютно налягане от станцията.

Налягане: Абсолютно vs Относително vs ERA5

Scatter: Ecowitt (abs) vs ERA5

ИзточникBiasБележка
Ecowitt pressure_absolute 0.989 -0.82 hPa ✅ Отлично съвпадение с ERA5 MSL
Относително налягане 0.286 -5.42 hPa Не съвпада с ERA5 MSL

💨 Вятър

⚠️ Слаба надеждност: Станцията е разположена на 15.2м височина (2.5м над покрива) в Морска Перла. Сгради и растителност блокират вятъра от ЮЗ, З и СЗ посоки. ERA5 моделира вятъра на 10м в "открити" условия, а 25km grid клетката осреднява открито море с брегова линия.
Решение: Анализираме отделно "откритите" посоки (350°-70°) — север, североизток, изток — където станцията има директен достъп към морето без препятствия.
АнализКорелацияBiasПодобрение
Всички посоки 0.346 0.588 -1.43 m/s
Открити посоки (350°-70°) 0.693 0.833 -1.14 m/s +100% R²

Времеви ред (m/s)

Scatter: Всички посоки vs Открити (350°-70°)

Пориви на вятъра (m/s)

Розата на ветровете (брой измервания по посока)

🌧️ Валежи — защо ERA5 не е точен?

Валежите са най-трудният параметър за сравнение между глобален модел и точково измерване. Докато температурата и налягането варират плавно в пространството, валежите са силно локализирани — може да вали интензивно на едно място и да е сухо на 2 км.

⚠️ Защо се разминават толкова?

  • Мащаб: ERA5 дава средния валеж за клетка от ~625 km² (25×25 km). Станцията мери в точка с площ ~0.03 m².
  • Конвективни валежи: Летните бури са локални и краткотрайни — моделът ги "размазва" в пространството.
  • Времева синхронизация: Дъждът може да падне час по-рано или по-късно от модела.
  • Топография: Планински склонове усилват локално валежите — ERA5 не улавя това.

📊 Какво е полезно въпреки това?

  • Месечни/сезонни суми: ERA5 е добър за климатични средни стойности.
  • Тенденции: Дали годината е била по-дъждовна или по-суха от нормалното.
  • Синоптични събития: Идентифициране кога е имало валежни епизоди.
  • Не за: Точни почасови стойности или прецизно количество.

Валежи във времето (mm)

Scatter: Станция vs ERA5 (само дъждовни часове)

💡 Извод за валежите: Ниската корелация на почасово ниво (R² < 0.3) е очаквана. Това не означава, че ERA5 е "грешен" — просто не е проектиран за точкови измервания. За валежи ERA5 е подходящ само за климатични анализи, не за конкретни събития.

🗓️ Месечен & Денонощен анализ

Общата статистика (R², MAE) дава усреднена картина, но крие важни детайли. Грешките на ERA5 не са случайни — те следват систематични модели във времето. Разбирането на тези модели позволява по-прецизна корекция и интерпретация.

📅 Защо анализираме по месеци?

ERA5 може да показва сезонна зависимост на грешките. Например, ако моделът систематично подценява летните температури (морски бриз охлажда локално), но е точен през зимата — общият bias ще изглежда малък, но реално имаме два различни режима. Месечният анализ разкрива тези сезонни модели.

🕐 Защо анализираме по часове?

Денонощният цикъл разкрива дали ERA5 греши в определени часове. Типични примери: подценяване на нощното охлаждане (модел не улавя локални инверсии), или надценяване на дневния максимум (липса на морски бриз в модела). Това е важно при анализ на исторически екстремуми — например колко слани е имало през даден период или какви са били пиковите температури.

Bias по месеци (температура и вятър)

Температурен bias по часове (денонощен цикъл)

📊 Как да четем графиките?

🌡️❄️ Сезонни корекционни формули

Вместо една обща формула за цялата година, можем да използваме сезонно-зависими корекции за по-висока точност. Топъл сезон (апр-сеп) и студен сезон (окт-мар) имат различни характеристики.

Температура

СезонПериодNBiasMAEФормула
☀️ Топъл Апр-Сеп 4,350 0.932 -1.04°C 1.52°C 0.9955×ERA5 -0.9545
❄️ Студен Окт-Мар 5,910 0.860 -0.75°C 1.67°C 1.0529×ERA5 -1.2286

Влажност

СезонПериодNBiasMAEФормула
☀️ Топъл Апр-Сеп 4,350 0.544 +0.2% 7.3% 0.6655×ERA5 +24.7662
❄️ Студен Окт-Мар 5,910 0.645 -1.5% 5.9% 0.8949×ERA5 +6.8789
💡 Кога да използваме сезонни формули?

Ако bias-ът се различава значително между сезоните (напр. >0.5°C за температура), сезонните формули ще дадат по-точни резултати. Ако разликата е малка, общата годишна формула е достатъчна.

📈 Защо е важен пълният годишен цикъл?

Първоначално анализирахме 8 месеца данни (само топлите месеци). След разширяване до 15 месеца, покриващи пълен годишен цикъл, резултатите се подобриха значително:

Променлива8 месеца R²15 месеца R²8 мес. Bias15 мес. BiasПромяна
Температура0.9150.941-0.80°C-0.08°C10× по-малък bias
Точка на оросяване0.8480.934-0.80°C+0.41°C+10% R²
Слънчева радиация0.8540.897+4.7 W/m²-4.1 W/m²+5% R²
Влажност0.5660.605-0.25%+1.95%+7% R²
Извод: При непълен годишен цикъл (само топли месеци) температурният bias беше -0.80°C. С пълен цикъл сезонните отклонения се компенсират и bias-ът пада до -0.08°C — практически нула.

За надеждна калибрация са необходими минимум 12 месеца данни.

📐 Статистически метрики — какво означават?

За правилна интерпретация на резултатите е важно да се разбира какво измерва всяка метрика:

МетрикаФормулаОтговаря на въпроса
Линейна регресия y = a·x + b Има ли системно изместване или скалиране?
Pearson r (корелация) r ∈ [-1, 1] Движат ли се стойностите заедно (синхрон)?
(детерминация) R² = r² Каква част от вариацията се обяснява?
Bias mean(модел - станция) Постоянно ли греши в една посока?
MAE mean(|модел - станция|) Колко голяма е грешката средно?
RMSE √mean((модел - станция)²) Колко е грешката, наказвайки големите отклонения?
⚠️ Често пропускано:
  • Висок r + висок bias = добра динамика, но грешно ниво (може да се коригира!)
  • Нисък MAE + нисък r = близки стойности, но лош синхрон
  • Bias може да се коригира с линейна регресия, r — не
  • RMSE ≥ MAE винаги (RMSE наказва по-силно големите грешки)
Пример от нашите данни: Температурата преди имаше r = 0.97 (отличен синхрон), но bias = -0.80°C (ERA5 показваше по-топло). След добавяне на пълен годишен цикъл, bias падна до -0.08°C — сезонните отклонения се компенсираха. Корелацията r не се промени значително, защото тя измерва синхрон, не точност.

📖 Методология

1. Източници на данни

ИзточникОписаниеРезолюция
ECOWITT WS2320 Метеостанция в Морска Перла, Обзор Почасови данни (~10,350 часа)
ERA5 (ECMWF) Реанализ данни чрез Open-Meteo API ~25 km / 1 час

🌍 Защо ERA5, а не ERA5-Land?

ERA5-Land е версия с по-висока резолюция (~9 km вместо ~25 km), оптимизирана за сухоземни повърхности. Въпреки по-добрата резолюция, избрахме ERA5 поради:

  • По-дълга история: ERA5 покрива 1940-днес, ERA5-Land само от 1950 г.
  • Пълен набор параметри: ERA5 включва налягане на морско ниво (MSL), което ERA5-Land няма
  • Крайбрежна локация: За точка на брега, ERA5-Land може да "вижда" суша, докато ERA5 по-добре балансира море/суша

За локации във вътрешността на страната ERA5-Land би бил по-подходящ избор.

☀️ Защо няма UV индекс?

Станцията измерва UV индекс (налични са данни), но ERA5 не включва UV радиация.

2. Обработка

🚩 Качество на данните (Quality Flags)

Преди анализа проверяваме данните за потенциални проблеми:

ПараметърОбщо точкиOutliers (>3σ)ЗамръзналиЧисти данни
Температура 10,343 4 2 99.9%
Влажност 10,343 60 47 99.0%
Вятър 10,343 212 0 98.0%
Радиация 0 0 0 100%
Налягане 0 0 0 100%

Outliers (>3σ): Стойности извън 3 стандартни отклонения от средното. Може да са реални екстремуми или грешки на сензора.

Замръзнали: Идентични стойности за 6+ последователни часа. Възможен проблем със сензора или комуникацията.

3. Бележки за вятъра

Станцията е частично защитена от сгради, терен и растителност при ЮЗ, З и СЗ вятър.

ERA5 моделира вятъра на 10м височина в открити условия. Корелацията се подобрява при филтриране по посока (350°-70°).

4. Бележки за налягането

За сравнение с ERA5 MSL е необходимо абсолютно налягане (не относително).

С правилни данни (pressure_absolute) корелацията достига R² = 0.99.

5. Оценка на надеждността

ПроменливаНадеждностБележка
ТемператураОтлична (R² = 0.94)Bias почти 0, отлично съвпадение
Точка на оросяванеОтлична (R² = 0.93)Висока корелация
Слънчева радиацияОтлична (R² = 0.90)Добро съвпадение
ВлажностУмерена (R² = 0.60)Крайбрежен микроклимат влияе
НаляганеОтлична (R² = 0.99)При абсолютно налягане
Вятър (всички)Слаба (R² = 0.29)Защитена локация
Вятър (север 350°-70°)УмеренаОткрита посока към морето

✅ Изводи и заключения

След калибрация с 10,343 часа локални данни, вече разполагаме с ясна картина къде ERA5 е надежден за нашата локация и къде се разминава с реалността.

📊 Надеждност по параметри

✅ Висока надеждност — ERA5 може да се използва директно или с минимална корекция

  • Температура — R² = 0.94, bias само -0.08°C. ERA5 почти перфектно следва станционните измервания. Грешката е в рамките на точността на сензора.
  • Слънчева радиация — R² = 0.90. Дневният и сезонният ход съвпадат добре. Разликите идват основно от локална облачност.
  • Точка на оросяване — R² = 0.93. Като производна от температура и влажност, следва точността на температурата.
  • Атмосферно налягане — R² = 0.99 при правилни данни. Синоптичните системи се отразяват почти идеално.

⚠️ Умерена надеждност — необходима е корекция и внимателна интерпретация

  • Влажност — R² = 0.60. Крайбрежният микроклимат (морски бриз, изпарение) създава локални вариации, които ERA5 с резолюция 25 km не може да улови. Моделът "вижда" средната влажност за голяма област, не конкретната точка до морето.

❌ Ниска надеждност — ERA5 не е подходящ за тази метрика в тази локация

  • Вятър — R² = 0.29. Локалната топография и сгради екранират станцията от ЮЗ, З и СЗ. ERA5 моделира вятъра за открита местност на 10м, което не отговаря на реалните условия. При филтриране само за открити посоки (С, СИ, И) корелацията се подобрява значително.
  • Валежи — Ниска корелация на почасово ниво. Валежите са силно локализирани явления, неподходящи за сравнение с модел от 25 km резолюция.

🤔 Защо изобщо мерим локално?

Въпреки че ERA5 предлага данни от 1940 г. насам с глобално покритие, локалните измервания остават незаменими. Причините са в самата природа на атмосферата и ограниченията на глобалните модели:

  • Резолюция: ERA5 усреднява условията за клетка от ~625 km². Нашата станция измерва в точка. За параметри с висока пространствена вариабилност (влажност, вятър, валежи) тази разлика е критична.
  • Микроклимат: Близостта до морето, локалният релеф, урбанизацията — всичко това създава условия, които глобалният модел не "вижда".
  • Екстремуми: Моделите изглаждат пиковите стойности. Локалната станция улавя реалните максимуми и минимуми.
  • Валидация: Без локални данни не можем да знаем доколко моделът е точен за конкретното място.

💡 Какво постигнахме с тази калибрация?

🔓 Отключихме исторически данни

За параметрите с висока надеждност (температура, радиация, налягане) вече можем да извлечем данни назад до 1940 г. за нашата локация. Това позволява анализ на климатични тенденции, екстремни събития и сезонни модели за последните 85 години.

🔧 Корекционни формули

За всеки параметър разполагаме с линейна регресия (corrected = slope × ERA5 + intercept), която позволява подобряване на ERA5 данните специално за нашата точка. При пропуски в станционните данни можем да ги попълним с коригирани ERA5 стойности.

⚠️ Знаем ограниченията

Не по-малко важно — вече знаем къде ERA5 не е надежден (очаквано) за тази локация. За вятър и валежи моделът не може да замести локални измервания. Това предпазва от грешни заключения при бъдещи анализи.

📈 База за бъдещо развитие

С натрупване на повече данни (2, 3, 5 години) корекционните формули ще стават по-прецизни. Може да се разработят сезонно-зависими корекции или машинно обучение за по-точно "превеждане" на ERA5 към локалните ни условия.

📊 Качество на ERA5 през различните периоди

ERA5 използва един и същ модел (IFS Cycle 41r2) за целия период 1940–2025. Но качеството зависи от входните наблюдения — колкото повече измервания са налични, толкова по-надежден е реанализът.

ПериодНаблюденияКачество
2000–днесМного сателити + метеобалони + морски буйовеНай-високо
1979–2000Сателитна ера — глобално покритиеВисоко
1950–1979Повече станции, но без сателитиУмерено
1940–1950Много оскъдни, предимно Зап. Европа/САЩВисока несигурност

За България: До 1950-те има минимални наблюдения в региона. От 1979 г. сателитите "виждат" и Черноморието. Днес: SYNOP станции (Варна, Бургас) + сателити + модел.

📐 Оценки на несигурността (Uncertainty Estimates)

ECMWF публикува uncertainty estimates — оценки колко сигурни са данните. Това се изчислява чрез 10 паралелни симулации (ERA5 EDA) с леко различни начални условия. Ако всички дават сходен резултат — ниска несигурност. Ако варират много — висока.

ПериодТемператураВлажностВятър
2000–2025±0.3–0.5°C±3–5%±0.5–1.0 m/s
1979–2000±0.5–0.8°C±5–8%±1.0–1.5 m/s
1950–1979±1.0–1.5°C±8–12%±1.5–2.5 m/s
1940–1950±1.5–2.5°C±10–15%±2.0–3.5 m/s

Практически извод: Нашата калибрация е с данни от 2024–2025. Прилагането към 1979–2025 е надеждно (сателитна ера). За 1950–1979 работи, но с по-голяма несигурност. Преди 1950 — може да се използва, но с повишено внимание.

📝 Заключение

ERA5 е мощен инструмент, но не е универсално решение. За крайбрежна локация като Обзор моделът е отличен за температура, радиация и налягане — тези данни могат да се използват с висока степен на доверие, включително исторически назад до 1940 г.

Близкият до нула годишен температурен bias всъщност е резултат от сезонна компенсация — морето затопля брега зимата и го охлажда лятото, като двата ефекта се изравняват през годината.

За влажност локалните измервания са важни — разлика от 10% при висока температура лятото или при силен вятър зимата се усеща значително. За вятър и валежи локалната станция остава единственият надежден източник — тези явления се променят драстично на разстояние от стотици метри, а ERA5 работи при резолюция от 25 km.