Regresión lineal multivariable versus regresión simbólica a partir de programación genética. Aplicación a la caracterización espectroscópica de aguas residuales urbanas
Enviado: 12-07-2022
|Aceptado: 05-10-2022
|Publicado: 28-10-2022
Derechos de autor 2022 Ingeniería del Agua

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Descargas
Palabras clave:
Caracterización de aguas residuales, regresión simbólica, espectrofotometría LED, modelación heurística
Agencias de apoyo:
Fundación Séneca-Agencia de Ciencia y Tecnología de la Región de Murcia (España)
Ministerio de Ciencia e Innovación – Agencia Estatal de Investigación
Resumen:
Caracterizar en tiempo real las aguas residuales urbanas es clave para poder garantizar una correcta gestión de los recursos hídricos y la protección del medioambiente. A partir de mediciones indirectas, como la espectroscopía molecular que proporciona información sobre las propiedades físico-químicas del agua, es posible determinar la carga contaminante de las aguas residuales empleando modelos matemáticos de correlación. El presente trabajo compara la regresión lineal multivariable y los modelos de regresión simbólica basados en programación genética, para establecer una correlación con la carga contaminante de las aguas residuales. El estudio se ha centrado en la comparativa de modelos para la caracterización de nitrógeno total, fósforo total y nitrógeno en forma de nitrato, considerando 90 muestras de aguas residuales urbanas. Se observa que la regresión simbólica basada en programación genética proporciona una mejora en el ajuste (R2) de entre el 72.76% y 146.39% respecto a la regresión lineal multivariable.
Citas:
APHA–AWWA–WPCF, Standard Methods for the Examination of Water and Wastewater, twentieth edition, Washington, DC, 1998
Brunton, S.L., Proctor, J.L., Kutz, J.N. 2016. Discovering governing equations from data by sparse identification of nonlinear dynamical systems. Proceedings of the national academy of sciences, 113(15), 3932-3937. https://doi.org/10.1073/pnas.1517384113
Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J. 2019. Spectroscopy transmittance by LED calibration. Sensors, 19(13), 2951. https://doi.org/10.3390/s19132951
Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J. 2020. Wastewater quality estimation through spectrophotometry-based statistical models. Sensors, 20(19), 5631. https://doi.org/10.3390/s20195631
Carreres-Prieto, D. 2021. Contribución al campo del IOT mediante el desarrollo de sensores inteligentes basados en espectrofotometría de longitud de onda variable. Aplicación a la monitorización en continuo de la carga contaminante en aguas residuales urbanas. Tesis Doctoral. Universidad Politécnica de Cartagena.
Carreres-Prieto, D., García, J.T., Cerdán-Cartagena, F., Suardiaz-Muro, J., Lardín, C. 2022. Implementing Early Warning Systems in WWTP. An investigation with cost-effective LED-VIS spectroscopy-based genetic algorithms. Chemosphere, 293, 133610. https://doi.org/10.1016/j.chemosphere.2022.133610
Leardi, R., Boggia, R., Terrile, M. 1992. Genetic algorithms as a strategy for feature selection. Journal of chemometrics, 6(5), 267-281. https://doi.org/10.1002/cem.1180060506
Lepot, M., Torres, A., Hofer, T., Caradot, N., Gruber, G., Aubin, J.B., Bertrand-Krajewski, J.L. 2016 Calibration of UV/Vis spectrophotometers: a review and comparison of different methods to estimate TSS and total and dissolved COD concentrations in sewers, WWTPs and rivers. Water Research, 101, 519-534. https://doi.org/10.1016/j.watres.2016.05.070
Mesquita, D.P., Quintelas, C., Amaral, A.L., Ferreira, E.C. 2017. Monitoring biological wastewater treatment processes: recent advances in spectroscopy applications. Reviews in Environmental Science and Bio/Technology, 16(3), 395-424. https://doi.org/10.1007/s11157-017-9439-9
Niazi, A., Leardi, R. 2012. Genetic algorithms in chemometrics. Journal of Chemometrics, 26(6), 345-351. https://doi.org/10.1002/cem.2426
Otto, M. 2016. Chemometrics: statistics and computer application in analytical chemistry. John Wiley & Sons. https://doi.org/10.1002/9783527699377
Quade, M., Abel, M., Nathan Kutz, J., Brunton, S.L. 2018. Sparse identification of nonlinear dynamics for rapid model recovery. Chaos: An Interdisciplinary Journal of Nonlinear Science, 28(6), 063116. https://doi.org/10.1063/1.5027470
Searson, D.P., Leahy, D.E., Willis, M.J. 2010. GPTIPS: an open source genetic programming toolbox for multigene symbolic regression. Proceedings of the International multiconference of engineers and computer scientists, 1, 77-80. Citeseer.
TuringBot, S. 2020. Symbolic Regression Software. URL: https://turingbotsoftware.com.
Udrescu, S.M., Tegmark, M. 2020. AI Feynman: A physics-inspired method for symbolic regression. Science Advances, 6(16), eaay2631. https://doi.org/10.1126/sciadv.aay2631
Wagner, S., Kronberger, G., Beham, A., Kommenda, M., Scheibenpflug, A., Pitzer, E., Affenzeller, M. 2014. Architecture and design of the HeuristicLab optimization environment. Advanced methods and applications in computational intelligence, 197-261. Springer, Heidelberg. https://doi.org/10.1007/978-3-319-01436-4_10
Zelinka, I., Oplatkova, Z., Nolle, L. (2005). Analytic programming–Symbolic regression by means of arbitrary evolutionary algorithms. International Journal of Simulation: Systems, Science and Technology, 6(9), 44-56.




