El monitoreo de residuos marinos representa un desafío creciente para la ciencia, la gestión ambiental y la salud pública. La acumulación de plásticos y otros desechos en los océanos plantea riesgos tanto para la biodiversidad como para las actividades humanas, lo que impulsó la búsqueda de tecnologías capaces de rastrear estos contaminantes de manera precisa.
Un equipo internacional, con investigadores del Instituto Skidaway de Oceanografía de la Universidad de Georgia, la Universidad de Oldenburgo y el respaldo de la NASA, publicó un estudio en la revista Earth System Science Data sobre la creación de MADLib (MArine Debris hyperspectral reference Library collection), una base de datos pública que reúne y organiza información sobre cómo diferentes tipos de basura marina reflejan la luz.
Incluye más de 3.000 muestras de objetos como plásticos, metales y tejidos encontrados en el mar. Esta colección ayuda a los científicos a identificar y clasificar residuos en los océanos a partir de sensores especiales, como los de los satélites. El objetivo es facilitar el desarrollo de algoritmos confiables para la detección remota de desechos en ambientes acuáticos.
El estudio explica que MADLib funciona como un catálogo con 3.032 piezas de basura, de las cuales se guardaron 24.889 registros de luz (o espectros) para enseñarles a los sensores cómo se ve cada material. Aunque la colección incluye metales, telas y caucho, la gran mayoría son plásticos, lo que funciona como un espejo de la realidad: estos materiales son, por lejos, los contaminantes que más abundan flotando en nuestros océanos.

Los autores destacan que esta base de datos permite entender cómo cambian las señales de la basura según cuatro factores clave: de qué material está hecha, su color, su tamaño y qué tan desgastada está por el ambiente. La colección identifica diecinueve familias de plásticos (siendo los más comunes los que se usan en envases y botellas, como el polipropileno y el polietileno), pero un dato revelador es que el 35% de las muestras son materiales imposibles de identificar, lo que demuestra lo compleja y variada que es la contaminación marina.
Uno de los hallazgos más importantes del equipo es la diferencia entre lo que vemos y lo que detectan los sensores avanzados. Señalan que el color y la presencia de “verdín” o microorganismos (biofilm) cambian cómo se ve el objeto ante la luz normal (visible). En cambio, el tipo de plástico y si está mojado o seco afectan principalmente a la luz infrarroja (invisible al ojo humano, pero clave para los satélites). Al haber medido residuos secos, mojados, flotando y hundidos, la base de datos permite por primera vez corregir las distorsiones que el agua provoca en los datos que registran los radares y satélites.
Finalmente, los investigadores sostienen que “MADLib demuestra la importancia de los datos abiertos y armonizados para promover el desarrollo de algoritmos robustos”, subrayando que compartir esta información estandarizada es el único camino para que la tecnología de detección avance y pueda aplicarse a gran escala.
Para construir MADLib, el equipo seleccionó y unificó trece bases de datos abiertas bajo reglas muy estrictas: solo aceptaron mediciones de luz tomadas con sensores manuales (espectrorradiómetros) que captan tanto el rango visible como el infrarrojo. El estudio explica que cada muestra registrada representa un objeto único o un grupo de partículas, y que estas fueron medidas en todas sus condiciones posibles: secas, mojadas, flotando o totalmente sumergidas.

El estudio especifica que a cada muestra se le asignaron treinta y nueve categorías descriptivas, que funcionan como una ficha técnica completa: incluyen qué objeto es, su color, tamaño, material, qué tan desgastado está y en qué tipo de agua se midió. En los casos donde faltaba algún dato, se dejó indicado explícitamente con un valor nulo para mantener la transparencia y evitar que los investigadores saquen conclusiones erróneas.
Finalmente, el artículo aclara que, aunque la base de datos es grande, todavía tiene “puntos ciegos”: faltan ejemplos de ciertos plásticos y colores, lo que significa que los algoritmos aún no pueden reconocer con perfección toda la basura que existe en el mar. Por esta razón, los autores proponen una nueva plantilla estandarizada para que, en el futuro, todos los científicos clasifiquen sus hallazgos con el mismo nivel de detalle.
Según el estudio, la existencia de una base de datos como MADLib abre nuevas posibilidades para el desarrollo de algoritmos de detección de residuos marinos por sensores remotos. La información reunida permite distinguir diferentes materiales y condiciones, y puede emplearse tanto para identificar patrones robustos de contaminación como para entrenar inteligencia artificial capaz de analizar imágenes satelitales.

En palabras de Ashley Ohall, autora principal del estudio, dijo en declaraciones difundidas por la NASA: “Mi mayor esperanza es que las personas vean la detección remota como una herramienta importante y útil para el monitoreo de residuos marinos. Solo porque no se haya hecho antes, no significa que no se pueda hacer”.
La publicación sostiene que la accesibilidad y apertura de MADLib favorece la colaboración entre científicos, modeladores y responsables de políticas públicas. El equipo recomienda que futuras ampliaciones del catálogo prioricen la inclusión de datos sobre residuos subrepresentados, como ciertos polímeros y colores, y que se mejore la documentación de metadatos para optimizar la utilidad de la colección.
El artículo concluye que la integración de bases de datos armonizadas y abiertas como MADLib constituye un avance para la comunidad científica y un recurso fundamental para enfrentar el desafío global de los residuos marinos a través de la observación remota.
