1. Glossari repte 3: Predicció d’ozó troposfèric

Termes relatius a models de Machine Learning (ML) i altres aspectes relacionats amb ciències de la computació

  • Application Programming Interface (API) – Conjunt de definicions i protocols perquè dues aplicacions, programari o serveis es comuniquin entre si.
  • Aprenentatge supervisat – Branca del ML, on s'utilitzen algoritmes als quals s'entrena amb sèries de dades etiquetades. S'entén com a sèrie de "dades etiquetades" aquella que inclou els valors de les variables independents i el valor de la variable dependent a predir.

  • Bagging – Mètode algorítmic associat a tècniques de ML, en el qual es selecciona una mostra aleatòria de dades d'un conjunt d'entrenament amb substitució, el que significa que els punts de dades individuals es poden triar més d'una vegada.
  • Boosting – Mètode algorísmic associat a tècniques de ML, mitjançant el qual els models aprenen seqüencialment. Això vol dir que es construeixen una sèrie de models i amb cada iteració del nou model, s'incrementen els pesos de les dades mal classificades en el model anterior.
  • Boosted Regression Trees (BRT) Són tècniques de ML d'aprenentatge supervisat, l'estructura algorítmica del qual es basa en la generació d'un conjunt (ensemble) d'arbres de decisió (DT), sobre els quals s'aplica tècniques de “boosting”.
  • Calibratge de models – Procés iteratiu de modificació dels meta-paràmetres numèrics del models de ML per minimitzar la diferència entre els valors mesurats i els valors calculats.
  • Codi obert - Model de desenvolupament de software basat en la col·laboració oberta.
  • Dades d'entrenament – Conjunt de dades utilitzades per construir els models de ML. Aquest conjunt, generalment inclou un ampli nombre d'observacions, i proporciona valors tant de les variables independents com de les dependents.
  • Dades de validació – Conjunt de dades, independents de les dades d'entrenament, utilitzats per seleccionar el millor model de ML. Per a ell, es poden efectuar accions com la calibració dels models (ajust de metaparàmetres) o la reducció de variables input (seleccionant les variables més influyentes).
  • Dades del test – Conjunt de dades, independents de les dades d'entrenament y de validació, utilitzats per medir la precisió real del model de ML finalment seleccionat. En aquesta fase, es proporciona les entrades del conjunt de dades, es realitza les prediccions associades a cada sèrie i es compara els valors predits amb els reals corresponents a cada observació. Això permet quantificar la seva capacitat de generalització abans de la introducció de noves sèries d'entrada.
  • Decision Trees (DT) o arbres de decisió – Són tècniques de ML d'aprenentatge supervisat, l'estructura algorítmica del qual està formada per nodes interns (representen cadascuna de les característiques o propietats a considerar per prendre una decisió) i branques (representen la decisió en funció d'una determinada condició) , per arribar a determinar mitjançant processos iteratius els valors d'una sèrie de nodes finals (representen el resultat de la decisió).
  • Interpolació espacial de dades – Part de la geoestadística que es basa en el càlcul dels valors desconeguts d'una variable espacial a partir d'altres punts el valor i la localització dels quals són coneguts.
  • K-Fold Cross Validation (CV) – Tècnica utilitzada per avaluar els resultats dels models de ML i garantir que siguin independents de la partició entre dades d'entrenament i validació. Consisteix a dividir el conjunt de dades utilitzades per a l'entrenament i la validació en K particions i realitzar un procés d'entrenament/validació en K iteracions, essent diferent cada subconjunt a cada iteració. Finalment, la precisió dels models es calcula com la mitjana aritmètica obtinguda de les mesures d'avaluació sobre diferents particions.
  • Machine Learning (ML) – Disciplina del camp de la Intel·ligència Artificial que, mitjançant algorismes, dota els ordinadors de la capacitat d'identificar patrons en dades massives i elaborar prediccions (anàlisi predictiva).
  • Metaparámetros – Valors dels paràmetres dun algorisme de ML utilitzats durant el procés dentrenament.
  • Models de ML específics ( ) Conjunt de models predictius de ML, generats específicament per al present projecte, els outputs dels quals difereixen quant al període (Per) i al paràmetre de predicció (Par): (i) (output del model: O3Max a 24-hores), (ii) (output del model: O3Max a 48-hores), (iii) (output del model: O38h a 24-hores) y (iv) (output del model: O38h a 48-hores)
  • Python Llenguatge de programació, interpretat i orientat a objectes.
  • R – Llenguatge de programació, interpretat i orientat a objectes.
  • Random Forest (RF) o boscos aleatoris – Són tècniques de ML d'aprenentatge supervisat, l'estructura algorítmica del qual es basa en la generació d'un conjunt (ensemble) d'arbres de decisió (DT), sobre els quals s'aplica tècniques de “bagging” perquè cada arbre difereixi entre si. El resultat final del model es calcula a partir de la mitjana dels resultats obtinguts a cadascun dels arbres generats.
  • Regressió – L'anàlisi de regressió és un subcamp de l'aprenentatge supervisat que té com a objectiu establir un mètode per a la relació entre un cert nombre de característiques i una variable objectiu numèrica contínua.
  • Resolució espacial – Mida característica de la discretització utilitzada per a resoldre el domini de càlcul.
  • Simulador de Escenarios Sintéticos (SES) –Eina per simular escenaris sintètics d'O3, mitjançant la definició dels valors de les variables més rellevants per part de l'usuari.
  • Technology Readiness Levels (TRL) – Els nivells de maduresa tecnològica són els blocs constitutius d‟un mètode per estimar la maduresa de tecnologies.
  • Variables “inputs” Variables independents dels models de ML, a partir de les quals es tracta de predir valors de la variable dependent (variable output).
  • Variable “output” – Variable dependent, o resposta del model, el valor del qual es tracta de predir a partir dels valors de les variables independents proporcionats als models de ML.

Termes relacionats amb aspectes de qualitat de l'aire

  • Concentració – Proporció de la quantitat de substància dissolta en una altra substància. Per exemple, podem parlar de la concentració de 150 µg de O3 per cada m3 d’aire (150 µg/m3).
  • Compostos orgànics volàtils (COVs) Els compostos orgànics volàtils són un tipus de substàncies (hidrocarburs) que s'evaporen a la temperatura ambient. participen juntament amb els òxids de nitrogen, són precursors de l'ozó troposfèric.
  • Diòxid de nitrogen (NO2) – Compost químic format per dos elements d’oxigen i un de nitrogen. És un gas tòxic, irritant i precursor de la formació de partícules de nitrat.
  • Diòxid de sofre (SO2) – Compost químic format per dos elements d’oxigen i un de sofre.
  • Episodis ambientals – Situació en què les condicions atmosfèriques són desfavorables per a la dispersió i la ventilació, la qual cosa fa que la concentració del contaminant en estudi augmenti tant que pot arribar a superar els valors límit establerts per la legislació.
  • Llindar d’informació – Llindar basat en nivell de variable O3Max, establert en valor de 180 µg/m3.
  • Llindar d’alerta – Llindar basat en nivell de variable O3Max, establert en valor de 240 µg/m3.
  • Monòxid de carboni (CO) – Compost químic format per un element d’oxigen i un de carboni.
  • Monòxid de nitrogen (NO) – Compost químic format per un element d’oxigen i un de nitrogen.
  • Òxids de nitrogen (NOx) – Terme genèric que fa referència a un grup de gasos que contenen nitrogen i oxigen en diverses proporcions.
  • Ozó (O3) Molècula triatòmica d’oxigen. A la troposfera es forma mitjançant reaccions fotoquímiques en presència de contaminants precursors com el NOx i compostos orgànics volàtils (COVs). La seva presència prop del sòl és perillosa perquè el seu elevat potencial d’oxidació pot causar danys en els teixits respiratoris d’animals i als teixits de les plantes.
  • Ozó: Valor màxim diari horari (O3Max) – Variable utilitzat per establir llindars d'informació i d'alerta, associats a la legislació vigent de contaminació atmosfèrica.
  • Ozó: Valor màxim diari de las mitjanes 8-horàries mòbils (O38h) – Variable utilitzada per establir indicadors associats a Valor Objectiu de Protecció de la Salut humana (VOPS).
  • PM2.5Partícules sòlides o líquides de pols, cendres, sutge, partícules metàl·liques, ciment o pol·len, disperses a l'atmosfera, i el diàmetre de les quals és menor a 2,5 µm.
  • PM10Partícules sòlides o líquides de pols, cendres, sutge, partícules metàl·liques, ciment o pol·len, disperses a l'atmosfera, i el diàmetre del qual varia entre 2,5 i 10 µm.
  • Predicció d'ozó a 24 hores – Valor d'ozó que, seguint una metodologia determinada ia través dels resultats dels models de predicció, van dirigides a definir el valor més probable dels indicadors d'aquest contaminant les properes 24 hores.
  • Predicció d'ozó a 48 hores – Valor d'ozó que, seguint una metodologia determinada ia través dels resultats dels models de predicció, van dirigides a definir el valor més probable dels indicadors d'aquest contaminant les properes 48 hores.
  • Punts de mesurament i equipament de la XVPCA – Cadascun dels punts on es localitza un mesurador de nivells de contaminació atmosfèrica.
  • Valor Objectiu de Protecció de la Salut humana (VOPS) – Llindar basat en nivell de variable O38h, el qual estableix que no podrà superar-se el valor de 120 μg/m3 en més de 25 ocasions per any i amb una mitjana de 3 anys consecutius.
  • Xarxa de Vigilància i Previsió de la Contaminació Atmosfèrica (XVPCA) – Sistema de detecció dels nivells d'immissió dels contaminants principals a Catalunya. Xarxa creada per la Llei 22/1983, de 21 de novembre, definida per l’Ordre de 20 de juny de 1986 i actualment està adscrita administrativament al Departament d’Acció Climàtica, Alimentació i Agenda Rural de la Generalitat de Catalunya.
  • Zones de Qualitat d’Aire (ZQA) – Regions espacials on s'ha distribuït el territori de Catalunya, que tenen com a objectiu que les mesures que es realitzen en una zona siguin representatives de la qualitat de l'aire de tota l'àrea que la comprèn . Amb l'objectiu de cada ZQA sigui homogènia, els criteris per definir-ne la superfície es basa en aspectes com l'orografia, la climatologia, la densitat de població i el volum d'emissions industrials i de trànsit.

Termes relacionats amb aspectes meteorològics

  • Anàlisi de Components Principals (ACP) – Mètode estadístic que permet simplificar un conjunt de valors de variables mitjançant combinacions lineals de noves variables, o components, no correlacionades entre si, sense una pèrdua significativa de la informació. És útil per analitzar grans conjunts de dades de moltes variables en expressar-les mitjançant unes quantes components.
  • Classificació sinòptica – Catàleg de situacions sinòptiques per a una regió (i un determinat objectiu).
  • Estabilitat atmosfèrica (EA) – Terme relacionat amb la major o menor facilitat de dispersió (barreja) que experimenta un paquet d'aire a l’atmosfera. Està L’estabilitat atmosfera, doncs, és clau perla dispersió d’un contaminant a l’atmosfera.
  • Estabilitat atmosfèrica: Classificació de Pasquill i Gifford – Esquema utilitzat per quantificar de manera senzilla l'estabilitat atmosfèrica en un punt. Es calcula a partir de les dades de velocitat del vent i irradiació solar i el resultat es una classificació en 6 categories: de l'A (la més inestable) a la F (la més estable), passant per la D, que correspon a una atmosfera neutra (en què el gradient real coincideix amb el adiabàtica).
  • European Centre for Medium-Range Weather Forecasts (ECMWF) Centre Europeu de Predicció a Mitjà Termini. Organització intergovernamental europea de recerca i serveis operatius de predicció numèrica del temps.
  • Humitat relativa mitjana (HR) – Humitat relativa mitjana diària (%).
  • Irradiació solar global (RS24) – Irradiació solar global diària (MJ/m2).
  • Isobara – Línia que uneix punts amb la mateixa pressió atmosfèrica reduïda al nivell del mar.
  • Precipitació acumulada (PPT24) – Precipitació acumulada diària (mm).
  • Pressió atmosfèrica – Pes de l'aire per unitat de superfície, expressada normalment a hectopascals (hPa).
  • Reanàlisi ERA-5 Cinquena generació de la reanàlisi atmosfèrica de l'ECMWF que cobreix el planeta i el període del 1950 fins a l'actualitat.
  • Situació sinòptica Conjunt típic de configuracions d'isòbares (i, en alçada, d'isohipses) d'una regió.
  • Temperatura mitjana (TM) – Temperatura mitjana diària obtinguda com a mitjana de valors de temperatura horaris (ºC).
  • Temperatura màxima (TX) – Temperatura màxima absoluta diària obtinguda com a valor màxim de la temperatura horari (ºC).
  • Temperatura mínima (TN) – Temperatura mínima absoluta diària obtinguda com a valor mínim de la temperatura horari (ºC).
  • Vent: Velocitat del vent escalar (VVEM10) – Velocitat mitjana diària del vent a 10 metres d'alçada (escalar) (m/s).
  • Vent: Velocitat del vent vectorial (VVVM10) – Velocitat mitjana diària del vent a 10 metres (vectorial) (m/s).
  • Vent: Direcció del vent m. u. (DVUM10) – Direcció mitjana diària del vent a 10 metres (mòdul unitari).
  • Vent: Direcció del vent m. 1 (DVM10) – Direcció mitjana diària del vent a 10 metres (mòdul 1)
  • Xarxa d’Estacions Meteorològiques Automàtiques (XEMA) – Sistema de mesurament de variables meteorològiques a Catalunya, que gestiona el Servei Meteorològic de Catalunya (SMC), i que està integrada a la Xarxa d’Equipaments Meteorològics de la Generalitat de Catalunya (Xemec), creada per la Llei 15/2001, de 14 de novembre, de meteorologia. La XEMA es composa actualment (desembre 2017) per un total de 186 Estacions Meteorològiques Automàtiques (EMA).

Back to Top

Informació del document

Publicat a 05/07/22
Presentat el 05/07/22

llicència: CC BY-NC-SA license

Categories

Ozó troposfèric

Puntuació document

0

Visites 0
Recomanacions 0