Convirtiendo los trinos en datos: esta IA estudia la migración de las aves a través del sonido
CIENCIAS DE LA COMPUTACIÓN / INTELIGENCIA ARTIFICIAL.
Tras décadas de frustración, las herramientas de aprendizaje automático están revelando a los ecologistas un tesoro de datos acústicos.
Un pequeño pájaro cantor sobrevuela Ithaca (Nueva York, EE UU) una noche de septiembre. Es uno de los 4.000 millones de pájaros del gran río anual de migración emplumada que atraviesa Norteamérica. En pleno vuelo, emite lo que los ornitólogos llaman una llamada nocturna para comunicarse con su bandada. Es la más breve de las señales, de apenas 50 milisegundos de duración, emitida en el bosque en plena noche. No obstante, los humanos la han captado con un micrófono rematado por un canalizador de enfoque. Instantes después, un software llamado BirdVoxDetect, fruto de la colaboración entre la Universidad de Nueva York (Nueva York, EE UU), el Laboratorio de Ornitología de Cornell (Ithaca, Nueva York) y la École Centrale de Nantes (Francia), identifica el ave y la clasifica a nivel de especie.
Biólogos como Andrew Farnsworth, de Cornell (Nueva York, EE UU), llevaban mucho tiempo soñando con espiar a las aves de este modo. En un mundo cada vez más cálido y lleno de infraestructuras humanas que pueden ser mortales para ellas, como los rascacielos de cristal o los tendidos eléctricos, las aves migratorias se enfrentan a muchas amenazas existenciales. Los científicos recurren a una combinación de métodos para rastrear el momento y la ubicación de sus migraciones, pero cada uno tiene sus defectos.
El radar Doppler, con las condiciones meteorológicas excluidas, puede detectar la biomasa total de aves en el aire, pero no puede desglosar ese total por especies. Las etiquetas GPS en aves individuales y las cuidadosas observaciones de los ciudadanos-científicos ayudan a llenar ese vacío, pero etiquetar aves a gran escala es una tarea cara e invasiva. Y hay otro problema clave: la mayoría de las aves migran de noche, cuando es más difícil identificarlas visualmente y cuando la mayoría de los observadores están en la cama.
Durante más de un siglo, el seguimiento acústico ha sido un método inalcanzable, a pesar de que podría resolver la aflicción de los ornitólogos. A finales de la década de 1800, los científicos se dieron cuenta de que cada especie migratoria emitía cantos de vuelo nocturnos específicos: "huellas acústicas".
Cuando los micrófonos empezaron a comercializarse en la década de 1950, los científicos empezaron a grabar a las aves por la noche. Farnsworth dirigió algunas de estas investigaciones sobre ecología acústica en la década de 1990. Sin embargo, ya entonces resultaba difícil detectar las llamadas cortas, algunas de las cuales se encuentran en el límite de la gama de frecuencias que puede oír el ser humano. Los científicos acababan con miles de cintas que tenían que revisar en tiempo real mientras observaban los espectrogramas que permiten visualizar el audio.
Aunque la tecnología digital facilitó la grabación, el "problema perpetuo", dice Farnsworth, "era que cada vez resultaba más fácil recopilar una enorme cantidad de datos de audio, pero más difícil analizarlos". Entonces Farnsworth conoció a Juan Pablo Bello, director del Laboratorio de Investigación de Música y Audio de la NYU (Nueva York, EE UU). Recién salido de un proyecto de aprendizaje automático para la identificación de fuentes de contaminación acústica urbana en Nueva York, Bello aceptó abordar el problema de las llamadas de vuelo nocturnas. Formó un equipo que incluía al experto francés en escucha automática Vincent Lostanlen, y en 2015 nació el proyecto BirdVox para automatizar el proceso.
"Todo el mundo decía: «Con el tiempo, cuando se resuelva el problema, esto se convertirá en una fuente de información superrica»", dice Farnsworth. Sin embargo, al principio, recuerda Lostanlen, "ni siquiera había un atisbo de que esto fuera a ser factible". Parecía inimaginable que el aprendizaje automático pudiera acercarse a la capacidad de escucha de expertos como Farnsworth. "Andrew es nuestro héroe", dice Bello. "Todo lo que queremos imitar con los ordenadores es a Andrew".
Empezaron entrenando BirdVoxDetect, una red neuronal, para que ignorara fallos como los zumbidos bajos causados por el agua de lluvia que daña los micrófonos. Luego, entrenaron al sistema para detectar las llamadas de vuelo, que difieren entre especies (e incluso dentro de una misma especie) y pueden confundirse fácilmente con el pitido de la alarma de un coche o un mirlo primaveral.
El reto, dice Lostanlen, era similar al que afronta un altavoz inteligente cuando escucha su "palabra despertador", salvo que en este caso la distancia entre el ruido objetivo y el micrófono es mucho mayor (lo que significa que hay que compensar mucho más el ruido de fondo). Y, por supuesto, los científicos no pudieron elegir un sonido único como "Alexa" o "Hey Google" para su activación. "Para las aves, en realidad no hacemos esa elección. Charles Darwin lo hizo por nosotros", bromea. Por suerte, tenían muchos datos de entrenamiento con los que trabajar: el equipo de Farnsworth había anotado a mano miles de horas de grabaciones recogidas por los micrófonos de Ithaca.
Con BirdVoxDetect entrenado para detectar las llamadas de vuelo, quedaba por delante otra tarea difícil: enseñarle a clasificar las llamadas detectadas por especies, algo que pocos observadores expertos pueden hacer de oída. Para hacer frente a la incertidumbre, y dado que no hay datos de entrenamiento para todas las especies, optaron por un sistema jerárquico. Por ejemplo, para una llamada determinada, BirdVoxDetect puede identificar el orden y la familia del ave, aunque no esté seguro de la especie, del mismo modo que un observador puede identificar la llamada de una curruca, ya sea rabilarga o capirotada. En el entrenamiento, la red neuronal recibía menos penalizaciones cuando confundía aves que se hallaban próximas en el árbol taxonómico.
El pasado agosto, como colofón a ocho años de investigación, el equipo publicó un artículo en el que se detallaban los algoritmos de aprendizaje automático de BirdVoxDetect. También lanzaron el software como producto gratuito y de código abierto para que los ornitólogos pudieran utilizarlo y adaptarlo. La red neuronal detectó 233.124 llamadas de vuelo en una prueba realizada con grabaciones de una temporada completa de migración, que sumaban un total de 6.671 horas. En un estudio publicado en 2022 en el Journal of Applied Ecology, el equipo que probó BirdVoxDetect descubrió que los datos acústicos eran tan eficaces como los radares para estimar la biomasa total.
BirdVoxDetect funciona con un subconjunto de aves cantoras migratorias norteamericanas. Sin embargo, mediante un aprendizaje de "pocos impactos", puede entrenarse para detectar otras aves similares con solo unos pocos ejemplos. "Es como aprender un idioma similar al que ya se habla", afirma Bello. Mediante micrófonos baratos, el sistema podría ampliarse a otros lugares del mundo sin observadores de aves ni radares Doppler, incluso con condiciones de grabación muy diferentes.
"Si vas a una conferencia de bioacústica y hablas con varias personas, todas plantean casos de uso distintos", dice Lostanlen. El siguiente paso para la bioacústica, dice, es crear un modelo básico, como en los que están trabajando los científicos para el procesamiento del lenguaje natural y el análisis de imágenes y vídeo, que sea reconfigurable para cualquier especie, incluso más allá de las aves. De ese modo, los científicos no tendrían que construir un nuevo BirdVoxDetect para cada animal que quisieran estudiar. El proyecto BirdVox ha concluido, pero los científicos ya están desarrollando más allá sus algoritmos y su enfoque.
Benjamin Van Doren, biólogo de migraciones de la Universidad de Illinois Urbana-Champaign (Illinois, EE UU) que trabajó en BirdVox, utiliza Nighthawk, una nueva red neuronal de fácil manejo basada en BirdVoxDetect y en la popular aplicación de identificación de cantos de aves Merlin, para estudiar las aves que migran sobre Chicago y otros lugares de Norteamérica y Sudamérica. Dan Mennill, que dirige un laboratorio de bioacústica en la Universidad de Windsor (Ontario, Canadá), dice que le entusiasma probar Nighthawk con las llamadas de vuelo que su equipo anota manualmente después de grabarlos con micrófonos en la orilla canadiense de los Grandes Lagos.
Uno de los puntos débiles del seguimiento acústico es que, a diferencia de los radares, un solo micrófono no puede detectar la altitud de un ave ni la dirección en la que se mueve. El laboratorio de Mennill está experimentando con un conjunto de ocho micrófonos que pueden triangularse para resolver ese problema. Buscar en las grabaciones ha sido un proceso lento. No obstante, con Nighthawk, el análisis se acelerará drásticamente.
Con las aves y otros animales migratorios amenazados, BirdVoxDetect llega en el momento justo. Saber exactamente qué aves están sobrevolando en tiempo real puede ayudar a los científicos a controlar el estado de las especies y hacia dónde se dirigen. Esto puede servir de base para iniciativas prácticas de conservación, como la de "apagar las luces", que anima a los rascacielos a oscurecerse por la noche para evitar las colisiones de las aves. "La bioacústica es el futuro de la investigación sobre la migración, y estamos llegando a la fase en que disponemos de las herramientas adecuadas", afirma. "Esto nos adentra en una nueva era".
Por: Christian Elliott. Es un periodista científico y medioambiental radicado en Illinois.
Sitio Fuente: MIT Technology Review