Los impactos ambientales, incluida la urbanización, la globalización y el cambio climático, están transformando el planeta a un ritmo vertiginoso. Sin embargo, a pesar de nuestros mejores esfuerzos, cuantificar los impactos de la actividad humana es un desafío, como lo demuestra la dificultad de delimitar el inicio del Antropoceno (Lewis y Maslin, 2015). Parte de esta incertidumbre se debe a la falta de datos históricos que rastreen el cambio biológico a lo largo del tiempo. Sin embargo, las colecciones de historia natural (CHN), con su amplio alcance taxonómico, geográfico y temporal, ofrecen una solución clave a este problema. En los últimos 20 años, ha habido un aumento dramático en el uso de CHN en busca de respuestas a la amplia variedad de cuestiones científicas (Suarez y Tsutsui, 2004, Pyke y Ehrlich, 2010, Park y Potter, 2015, Meineke et al. 2018, 2019). De hecho, han surgido como uno de los mejores recursos para establecer líneas de base biológicas que permiten comprender los impactos de, por ejemplo, los orígenes de la agricultura, la revolución industrial, el desarrollo de armamentos nucleares y, de manera más general, la influencia y la aceleración del cambio antropogénico en la biodiversidad (Moritz et al., 2008, Johnson et al., 2011, Lister 2011, Funk, 2018, Nelson y Ellis, 2018).
La mayoría de los grandes CHN proporcionan información a los investigadores y al público mediante la movilización de bases de datos de recopilación en línea con capacidad de búsqueda. Podemos afirmar que estas colecciones a la vista figuran entre los avances más importantes en la curaduría de museos del siglo pasado. Han abierto, significativamente, el acceso al conocimiento y estimulado, en gran medida, los análisis a gran escala que abarcan novedosos estudios académicos. Estos recursos logran conectar diversos dominios del saber, impulsando a una nueva generación de científicos y eliminando los obstáculos financieros, sociológicos, institucionales y académicos que impiden el acceso a estos materiales (Drew et al., 2017; Sweeney et al., 2018). En resumen, la digitalización de una muestra física (traducir los metadatos asociados con un objeto de muestra física a formatos de datos digitales flexibles) aumenta el valor de la misma de manera exponencial.
Una visión ambiciosa y doble de la digitalización es la que denominamos Digitalización 1.0 y Digitalización 2.0. La Digitalización 1.0 representa el impulso continuo para crear imágenes digitales y contenido relacionado directamente a partir de muestras de valores físicos; la Digitalización 2.0, en cambio, tiene que ver, exclusivamente, con la recopilación de datos, las tareas o los flujos de trabajo derivados de los productos digitalizados de la Digitalización 1.0, en lugar de las muestras físicas en sí mismas. Además de la gran expansión y subida en línea de estas colecciones visibilizadas para crear un CHN digital verdaderamente global, la Digitalización 2.0 también extiende el proceso de digitalización a nivel mundial y potencia la fuerza laboral que interactúa con estos objetos, ya que incluye a investigadores lejos de los CHN y ciudadanos con curiosidad científica. De este modo, se acelera el progreso de la digitalización.
La práctica de la digitalización es muy habitual en proyectos y grupos de organizaciones, en la medida en que cada espécimen está representado por metadatos textuales de etiquetas o catálogos e imágenes digitales bidimensionales. Pero cada vez son más frecuentes las representaciones tridimensionales, las de audio o video y/o grabaciones, cuando resulta pertinente. El tamaño de la muestra oscila enormemente, las condiciones de almacenamiento (líquido conservado, portaobjetos de microscopio, almacenamiento en seco), así como la dimensionalidad (representación bidimensional versus tridimensional) y los detalles asociados a los especímenes, sin mencionar las prácticas, muy variadas, en la recolección y curación de especímenes entre dominios e instituciones taxonómicas. Esta heterogeneidad de colecciones, políticas y prioridades institucionales, genera desafíos para la obtención de imágenes y la recolección masiva eficiente de metadatos. Sin embargo, como mínimo, los flujos de trabajo de digitalización deben intentar integrar todos los metadatos de muestras disponibles en los trabajos de digitalización y relacionarlos, adecuadamente, con sus muestras de comprobante físico asociadas. Más allá de los vínculos tradicionales, los metadatos no tradicionales ligados a los especímenes incluyen datos bióticos (p. Ej., Masa) y abióticos (p. Ej., Clima), medios (p. Ej., Grabaciones de video y audio), metadatos a nivel de comunidad y población (p. Ej., Abundancia), observaciones de especies en el campo y muestras genéticas (es decir, el espécimen extendido; Lendemer et al.2019). Muchos de estos datos digitales se proporcionan, en parte o en su totalidad, a través de plataformas de bases de datos de recopilación en línea y software de gestión (p. Ej., Arctos, Specify, Symbiota, EMu) o de agregadores de datos (p. Ej., IDigBio, Global Biodiversity Information Facility [GBIF], Botanical Red de Información y Ecología). Vincular las muestras de comprobantes a estas nuevas capas de datos tras la recolección es importante y se ha facilitado asociando URL, números de acceso a datos, DOI (identificadores de objetos digitales) o ARK (claves de investigación de archivo), con registros de muestras en las bases de datos de la colección. Por otro lado, los datos de rasgos se pueden incorporar a los registros de especímenes utilizando extensiones de los Archivos centrales de Darwin (Yost et al., 2018). Para la próxima generación de colecciones, se están desarrollando protocolos que permiten expandir el flujo de trabajo de digitalización al evento de recolección en sí (Heberling e Issac, 2018).
Debido al esfuerzo variable requerido por las diferentes estrategias de digitalización (datos de etiquetas, imágenes, reconstrucciones tridimensionales), los tipos de datos que sirven a la mayor diversidad de casos de uso también deben priorizarse. Por ejemplo, la información clave, incluido el nombre del taxón, la localidad de recolección y la fecha, se puede capturar de manera relativamente eficiente, facilitando las evaluaciones de la distribución de especies a lo largo del tiempo. Aparecen áreas de investigación en rápida expansión, incluida la fenología (p. Ej., Primack et al., 2004, Willis et al., 2017), inventarios taxonómicos a gran escala (p. Ej., Cardoso et al., 2017) y morfometría. Algunas investigaciones (Hedrick et al.2015), se basan en datos de etiquetas y datos de la mejora posterior a la digitalización (Sweeney et al., 2018). En uno de los primeros estudios realizados para averiguar cómo se pueden utilizar especímenes históricos para cuantificar los efectos bióticos del cambio climático, Primack y sus colegas (2004) recurrieron a especímenes de plantas con flores recolectados entre 1885 y 2003 en el área metropolitana de Boston. Demostraron que las plantas florecieron hasta 8 días antes en los últimos años que en los primeros años del siglo XX. La utilidad de datos tan diversos (ubicación geográfica, fecha de floración, medidas anatómicas) es importante para muchos investigadores, y por ello debe priorizarse. Además, creemos que es mejor aplicar únicamente métodos de digitalización más complejos y holísticos en un subconjunto clave de muestras ricas en datos, como se ha demostrado recientemente en la red de recopilación temática de openVertebrate (oVert) (Blackburn et al., Resumen de NSF, nº. 1701714). Aumentar la magnitud de la colección de archivos multimedia (fotogrametría de pieles de aves, nueces) para este subconjunto de datos, a través de nuevas canalizaciones y avances tecnológicos, será algo prioritario.
Para terminar, mencionar que la digitalización facilita la democratización de la investigación basada en colecciones. Es fundamental para establecer y evaluar líneas de base biológicas que permitirán cuantificar los impactos del cambio climático, transformaciones en el uso de la tierra, invasiones de especies y la extinción masiva actual. Pero además facilita la extracción de datos de muestras de la misma manera que exploramos los genomas de los organismos. La clave para desarrollar aún más la Digitalización 1.0 y establecer la Digitalización 2.0 radica en aprovechar lo que las comunidades de investigación, financiación y políticas han aprendido en las varias décadas desde el inicio de este esfuerzo. Los especímenes de CHN ricos en datos son útiles y brindan perspectivas únicas sobre la diversidad y distribución de un taxón dado. Sin embargo, si la búsqueda de una muestra no es eficiente, es probable que ni se encuentre ni se estudie, a pesar de su uso potencial. Ya estamos recogiendo los frutos de la sinergia entre Digitalización 1.0 y 2.0.
Muchas de las actividades de investigación que se benefician de la digitalización tienen una larga trayectoria en las ciencias de la biodiversidad, como los modelos de distribución de especies, las evaluaciones de la respuesta fenológica y los estudios morfométricos. La digitalización está facilitando el trabajo en estos campos con una intensidad que antes era impensable, marcando el comienzo de nuevos dominios ( detección de características mediante el aprendizaje automático, identificación de especies automatizada), nuevas preguntas y nuevas audiencias que aún no se han realizado (o incluso imaginado). Solo con creatividad y técnicas mejoradas – incluidos métodos automatizados y semiautomatizados -, una carga de trabajo de digitalización mejor distribuida que haga uso de nuevas tecnologías y fuerzas de trabajo, y una atención concienzuda a la cadena de atribución, los investigadores estarán en mejores condiciones para rastrear el cambio de biodiversidad en curso a partir de todos los datos existentes. A pesar de la aparición de nuevas tecnologías y técnicas de digitalización, siempre tendremos que volver a las muestras físicas – de formas ahora inimaginables – para generar datos novedosos que permitan comprender mejor nuestro planeta cambiante. Aunque remarcamos la importancia de métodos y prácticas mejorados para la digitalización, la recolección activa y la curación continua de especímenes físicos por biólogos expertos sigue siendo el pilar central que respalda los avances en biología evolutiva y conservación representados de manera tan importante por los CHN.
Consultas: info@evemuseos.com
Recursos:
Brandon, P., Hedrick, J., Mason H., Emily, K., Meineke, K.G., Turner, C., Christopher, J., Grassa, D.S. Park, J., Kennedy, J.A., Clarke, J.A., Cook, D.C. Blackburn, S.V., Edwards y Davis, C. (2020): Digitization and the Future of Natural History Collections. BioScience • Marzo 2020 / Vol. 70 Nº. 3.
Ballard, H.L., Robinson, L.D., Young, A.N., Pauly, G.B., Higgins, L.M., Johnson. R.F., Tweddle, J.C. (2017): Contributions to conservation outcomes by natural history museum-led citizen science: Examining evidence and next steps. Biological Conservation 208: 87–97.
Beck, J., Ballesteros-Mejía, L., Nagel y P., Kitching, I.J. (2013): Online solutions and the ‘Wallacean shortfall’: what does GBIF contribute to our knowledge of species’ ranges? Diversity and Distributions 19: 1043–1050.
Beck, J., Böller, M., Erhardt, A. y Schwanghart, W. (2014). Spatial bias in the GBIF database and its effect on modeling species’ geographic distributions. Ecological Informatics 19: 10–15.
Cardoso, D. y et al. (2017): Amazon plant diversity revealed by a taxonomically verified species list. Proceedings of the National Academy of Sciences 114: 10695–10700.
Chang, J. y Alfaro, M.E. (2016): Crowdsourced geometric morphometrics enable rapid large‐scale collection and analysis of phenotypic data. Methods in Ecology and Evolution 7: 472–482.
Cobb, N.S., Gall L.F., Zaspel, J.M., Dowdy, N,J,, McCabe, L.M. y Akito, Y.Y. (2019): Assessment of North American arthropod collections: prospects and challenges for addressing biodiversity research. PeerJ 7:e8086.
Comoglio, F., Fracchia, L. y Rinaldi, M. (2013): Bayesian inference from count data using discrete uniform priors. PLOS ONE 8 (art. e74388).
Cooney, C.R., Bright, J.A., Capp, E.J., Chira, A.M., Hughes, E.C., Moody, C.J., Nouri, L.O., Varley,Z.K. y Thomas, G.H. (2017): Mega-evolutionary dynamics of the adaptive radiation of birds. Nature 542: 344–347.
Daru, B.H. y et al. (2018): Widespread sampling biases in herbaria revealed from large-scale digitization. New Phytologist 217: 939–955.
Dou, L., Cao, G., Morris, P.J., Morris, R.A., Ludäscher, B., Macklin, J.A. y Hanken, J. (2012): Kurator: A Kepler package for data curation workflows. Procedia Computer Science 9: 1614–1619.
Drew, J.A., Moreau, C.S. y Stiassny, M.L.J. (2017): Digitization of museum col- lections holds the potential to enhance researcher diversity. Nature Ecology and Evolution 1: 1789.
Edwards, J.L. (2004): Research and societal benefits of the global biodiversity information facility. Bioscience 54: 485–486.
Ellwood, E.R. y et al. (2015): Accelerating the digitization of biodiversity research specimens through online public participation. Bioscience 4: 383–396.
Ellwood, E.R., Crimmins, T.M. y Miller-Rushing, A.J. (2017): Citizen science and conservation: Recommendations for a rapidly moving field. Biological Conservation 208: 1–4.
Feng, L., Bhanu, B. y Heraty J. (2016) A software system for automated identi- fication and retrieval of moth images based on wing attributes. Pattern Recognition 51: 225–241.
Funk, V.A. (2018): Collections‐based science in the 21st century. Journal of Systematics and Evolution 56: 175–193.
Goodwin, Z.A., Harris, D.J., Filer, D., Wood, J.R., Scotland, R.W. (2015): Widespread mistaken identity in tropical plant collections. Current Biology 25: 1066–1067.
Guralnick, R.P., Zermoglio, P.F., Wieczorek, J., LaFrance, R., Bloom, D. y Russell, L. (2016): The importance of digitized biocollections as a source of trait data and a new VertNet resource. The Journal of Biological Databases and Curation:1–13.
Heberling, J.M. e Isaac, B.L. (2018): iNaturalist as a tool to expand the research value of museum specimens. Applications in Plant Sciences 6: e1193.
Hedrick, B.P., Manning, P.L., Lynch, E.R., Cordero, S.A. y Dodson, P. (2015): The geometry of taking flight: Limb morphometrics in Cretaceous thero- pods. Journal of Morphology 276: 152–166.
Hill, A. y et al. (2012): The notes from nature tool for unlocking biodiversity records from museum records through citizen science. ZooKeys 209: 219. Hopkins GW, Freckleton RP. 2002. Declines in the numbers of amateur and professional taxonomists: Implications for conservation. Animal Conservation 5: 245–249.
Johnson, K.G. y et al. (2011): Climate change and biosphere response: Unlocking the collections vault. Bioscience 61: 148–153.
Kho, S.J., Manickam, S., Malek, S., Mosleh, M. y Dhillon, S.K. (2017): Automated plant identification using artificial neural network and support vector machine. Frontiers in Life Science 10: 98–207.
Kissling, W.D. y et al. (2018): Towards global data products of essential bio-diversity variables on species traits. Nature Ecology and Evolution 2: 1531–1540.
Krishnan, P., Dutta, K. y Jawahar C.V. (2016): Deep feature embedding for accurate recognition and retrieval of handwritten text. Frontiers in Handwriting Recognition (ICFHR) 15th International Conference: 289–294.
Le Bras, G. y et al. (2017): The French Muséum National D’histoire Naturelle vascular plant herbarium collection data set. Scientific Data 4: 170016.
Lewis, S.L. y Maslin, M.A. (2015): Defining the Anthropocene. Nature 519: 171. Lister AM. 2011. Natural history collections as sources of long-term data sets. Trends in Ecology and Evolution 26: 153–154.
Lendemer, J. y et al. (2019): The extended specimen network: A strategy to enhance US biodiversity collections, promote research and education. Bioscience. doi:10.1093/biosci/biz140.
Lorieul, T. y et al. (2019): Toward a large-scale and deep phenological stage annotation of herbarium specimens: Case studies from temperate, tropical, and equatorial floras. Applications in Plant Sciences 7: e01233–e01233.
MacDougall, A.S., Loob, J.A., Claydenc, S.R., Goltzd, J.G. y Hindse, H.R. (1998): Defining conservation priorities for plant taxa in southeastern New Brunswick, Canada using herbarium records. Biological Conservation 86: 325–338.
Meineke, E.K., Davis, C.C. y Davies, T.J. (2018): The unrealized potential of herbaria for global change biology. Ecological Monographs 88: 505–525. Meineke EK, Davies TJ, Daru BH, Davis CC. 2019. Biological collections for understanding biodiversity in the Anthropocene. Philosophical Transactions of the Royal Society B: Biological Sciences 374: 20170386.
Meyer, C., Weigelt, P. y Kreft, H. (2016): Multidimensional biases, gaps and uncertainties in global plant occurrence information. Ecology Letters 19: 992–1006.
Moritz, C., Patton, J.L., Conroy, C.J., Parra, J.L., White, G.C. y Beissinger, S.R. (2008): Impact of a century of climate change on small-mammal communities in Yosemite National Park, USA. Science 322: 261–264.
Nelson, G. y Ellis, S. (2018): The history and impact of digitization and digital data mobilization on biodiversity research. Philosophical Transactions of the Royal Society B. 374: 20170391.
Nualart, N., Ibáñez, N., Soriano, I. y López-Pujol, J. (2017): Assessing the relevance of herbarium collections as tools for conservation biology. The Botanical Review 83: 303–325.
O’Connell, A.F.J., Gilbert, A.T. y Hatfield, J.S. (2004): Contribution of natural history collection data to biodiversity assessment in national parks. Conservation Biology 18: 1254–1261.
Park, D.S. y Potter, D. (2015): Why close relatives make bad neighbours: phylogenetic conservatism in niche preferences and dispersal disproves Darwin’s naturalization hypothesis in the thistle tribe. Molecular Ecology 24: 3181–3193.
Park, D.S., Breckheimer, I., Williams, A.C., Law, E., Ellison, A.M. y Davis, C.C. (2019): Herbarium specimens reveal substantial and unexpected variation in phenological sensitivity across the eastern United States. Philosophical Transactions of the Royal Society B: Biological Sciences 374: 20170394.
Primack, D., Imbres, C., Primack, R.B., Miller-Rushing, A.J. y del Tredici, P. (2004): Herbarium specimens demonstrate earlier flowering times in response to warming in Boston. American Journal of Botany 91: 1260–1264.
Pyke, G.H. y Ehrlich, P.R. (2010): Biological collections and ecological/environmental research: A review, some observations and a look to the future. Biological Reviews 85: 247–266.
Riemer, K., Guralnick, R.P. y White, E.P. (2018): No general relationship between mass and temperature in endothermic species. eLife 7: e27166.
Rogers, N. (2016): Museum drawers go digital. Science 352: 762–765.
Rouhan, G., Dorr, L.J., Gautier, L., Clerc, P., Muller, S. y Gaudeul, M. (2017): The time has come for natural history collections to claim co-authorship of research articles. Taxon 66: 101–1016.
Schermer, M. y Hogeweg, L. (2018): Supporting citizen scientists with automatic species identification using deep learning image recognition models. Biodiversity Information Science and Standards 2: e25268.
Schuettpelz, E., Frandsen, P.B., Dikow, R.B., Brown, A., Orli, S., Peters, M., Metallo, A., Funk, V.A. y Dorr, L.J. (2017): Applications of deep convolutional neural networks to digitized natural history collections. Biodiversity Data Journal 5: e21139. Suarez AV, Tsutsui ND. 2004. The value of museum collections for research collections. Bioscience 54: 66–74.
Sudholt, S. y Fink, G.A. (2016): PHOCNet: A deep convolutional neural network for word spotting in handwritten documents. Pages 277–282 in 2016 15th International Conference on Frontiers in Handwriting Recognition: ICFHR 2016. IEEE.
Sweeney, P.W., Starly, B., Morris, P.J., Xu, Y., Jones, A., Radhakrishnan, S., Grassa, C.J. y Davis, C.C. (2018): Large-scale digitization of herbarium specimens: Development and usage of an automated, high-throughput conveyor system. Taxon 67: 165–178.
Tegelberg, R., Mononen, T. y Saarenmaa, H. (2014): High-performance digitization of natural history collections: Automated imaging lines for herbarium and insect specimens. Taxon 63: 1307–1313.
Troudet, J., Grandcolas, P., Blin, A., Vignes-Lebbe, R. y Legendre, F. (2017): Taxonomic bias in biodiversity data and societal preferences. Scientific Reports 7: 9132.
Unger, J., Merhof, D. y Renner, S. (2016): Computer vision applied to herbarium specimens of German trees: Testing the future utility of the millions of herbarium specimen images for automated identification. BMC Evolutionary Biology 16: 248.
Valan, M., Makonyi, K., Maki, A., Vondrácek, D. y Ronquist, F. (2019): Automated taxonomic identification of insects with expert-level accuracy using effective feature transfer from convolutional networks. Systematic Biology 68: 876–895.
Wäldchen, J., Rzanny, M., Seeland, M. y Mäder, P. (2018): Automated plant species identification: Trends and future directions. PLOS Computational Biology 14 (art. e1005993).
Wilf, P., Zhang, S., Chikkerur, S., Little, S.A., Wing, S.L. y Serre, T. (2016): Computer vision cracks the leaf code. Proceedings of the National Academy of Sciences 113: 3305–3310.
Willis, C.G. y et al. (2017): CrowdCurio: An online crowdsourcing platform to facilitate climate change studies using herbarium specimens. New Phytologist 215: 479–488.
Yost, J.M. y et al. (2018): Digitization protocol for scoring reproductive phenol- ogy from herbarium specimens of seed plants. Applications in Plant Sciences 6: e1022.
Zhou, N. y et al. (2018): Crowdsourcing image analysis for plant phenomics to generate ground truth data for machine learning. PLOS Computational Biology 14 (art. e1006337).
Si quieres recibir nuestro newsletter, y/o la bibliografía y recursos asociados al artículo de hoy, pídenoslo en el boletín adjunto, dejando claro que solicitáis la bibliografía y los recursos asociados al artículo, por favor. Si quieres recibir los artículos por correo electrónico completa el campo correspondiente en el formulario de inscripción que encontrarás en la cabecera de esta página. Tu dirección de correo electrónico será utilizada exclusivamente para enviarte nuestros newsletters, pudiendo darte de baja en el momento que quieras.