Regresión lineal multivariable versus regresión simbólica a partir de programación genética. Aplicación a la caracterización espectroscópica de aguas residuales urbanas
DOI:
https://doi.org/10.4995/ia.2022.18073Palabras clave:
Caracterización de aguas residuales, regresión simbólica, espectrofotometría LED, modelación heurísticaResumen
Caracterizar en tiempo real las aguas residuales urbanas es clave para poder garantizar una correcta gestión de los recursos hídricos y la protección del medioambiente. A partir de mediciones indirectas, como la espectroscopía molecular que proporciona información sobre las propiedades físico-químicas del agua, es posible determinar la carga contaminante de las aguas residuales empleando modelos matemáticos de correlación. El presente trabajo compara la regresión lineal multivariable y los modelos de regresión simbólica basados en programación genética, para establecer una correlación con la carga contaminante de las aguas residuales. El estudio se ha centrado en la comparativa de modelos para la caracterización de nitrógeno total, fósforo total y nitrógeno en forma de nitrato, considerando 90 muestras de aguas residuales urbanas. Se observa que la regresión simbólica basada en programación genética proporciona una mejora en el ajuste (R2) de entre el 72.76% y 146.39% respecto a la regresión lineal multivariable.
Descargas
Citas
APHA–AWWA–WPCF, Standard Methods for the Examination of Water and Wastewater, twentieth edition, Washington, DC, 1998
Brunton, S.L., Proctor, J.L., Kutz, J.N. 2016. Discovering governing equations from data by sparse identification of nonlinear dynamical systems. Proceedings of the national academy of sciences, 113(15), 3932-3937. https://doi.org/10.1073/pnas.1517384113
Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J. 2019. Spectroscopy transmittance by LED calibration. Sensors, 19(13), 2951. https://doi.org/10.3390/s19132951
Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J. 2020. Wastewater quality estimation through spectrophotometry-based statistical models. Sensors, 20(19), 5631. https://doi.org/10.3390/s20195631
Carreres-Prieto, D. 2021. Contribución al campo del IOT mediante el desarrollo de sensores inteligentes basados en espectrofotometría de longitud de onda variable. Aplicación a la monitorización en continuo de la carga contaminante en aguas residuales urbanas. Tesis Doctoral. Universidad Politécnica de Cartagena.
Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J., Lardín, C. 2022. Implementing Early Warning Systems in WWTP. An investigation with cost-effective LED-VIS spectroscopy-based genetic algorithms. Chemosphere, 293, 133610. https://doi.org/10.1016/j.chemosphere.2022.133610
Leardi, R., Boggia, R., Terrile, M. 1992. Genetic algorithms as a strategy for feature selection. Journal of chemometrics, 6(5), 267-281. https://doi.org/10.1002/cem.1180060506
Lepot, M., Torres, A., Hofer, T., Caradot, N., Gruber, G., Aubin, J.B., Bertrand-Krajewski, J.L. 2016 Calibration of UV/Vis spectrophotometers: a review and comparison of different methods to estimate TSS and total and dissolved COD concentrations in sewers, WWTPs and rivers. Water Research, 101, 519-534. https://doi.org/10.1016/j.watres.2016.05.070
Mesquita, D.P., Quintelas, C., Amaral, A.L., Ferreira, E.C. 2017. Monitoring biological wastewater treatment processes: recent advances in spectroscopy applications. Reviews in Environmental Science and Bio/Technology, 16(3), 395-424. https://doi.org/10.1007/s11157-017-9439-9
Niazi, A., Leardi, R. 2012. Genetic algorithms in chemometrics. Journal of Chemometrics, 26(6), 345-351. https://doi.org/10.1002/cem.2426
Otto, M. 2016. Chemometrics: statistics and computer application in analytical chemistry. John Wiley & Sons. https://doi.org/10.1002/9783527699377
Quade, M., Abel, M., Nathan Kutz, J., Brunton, S.L. 2018. Sparse identification of nonlinear dynamics for rapid model recovery. Chaos: An Interdisciplinary Journal of Nonlinear Science, 28(6), 063116. https://doi.org/10.1063/1.5027470
Searson, D.P., Leahy, D.E., Willis, M.J. 2010. GPTIPS: an open source genetic programming toolbox for multigene symbolic regression. Proceedings of the International multiconference of engineers and computer scientists, 1, 77-80. Citeseer.
TuringBot, S. 2020. Symbolic Regression Software. URL: https://turingbotsoftware.com.
Udrescu, S.M., Tegmark, M. 2020. AI Feynman: A physics-inspired method for symbolic regression. Science Advances, 6(16), eaay2631. https://doi.org/10.1126/sciadv.aay2631
Wagner, S., Kronberger, G., Beham, A., Kommenda, M., Scheibenpflug, A., Pitzer, E., Affenzeller, M. 2014. Architecture and design of the HeuristicLab optimization environment. Advanced methods and applications in computational intelligence, 197-261. Springer, Heidelberg. https://doi.org/10.1007/978-3-319-01436-4_10
Zelinka, I., Oplatkova, Z., Nolle, L. (2005). Analytic programming–Symbolic regression by means of arbitrary evolutionary algorithms. International Journal of Simulation: Systems, Science and Technology, 6(9), 44-56.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2022 Ingeniería del Agua
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Esta revista se publica bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional
Datos de los fondos
-
Fundación Séneca
Números de la subvención Mod. B, Ref. 20320/FPI/17;21662/PDC/21 -
Ministerio de Ciencia e Innovación
Números de la subvención RTC2019-007115-5