TechBlog: Minha caixa de ferramentas digital: Julia Stewart Lowndes
Você faz parte do Ocean Health Index. O que é o OHI, e por que a reprodutibilidade dos dados é tão importante para o seu trabalho?
O Ocean Health Index (OHI) é um quadro científico para medir e acompanhar a saúde dos oceanos do mundo. Avaliações OHI têm métodos transparentes e workflows reproduzíveis que estão disponíveis para outros pesquisadores para usar e construir em cima. Nossa equipe no NCEAS e Conservação Internacional avaliar oceanos globalmente a cada ano. Além disso, apoiamos grupos independentes que incorporam os seus próprios dados no quadro da OHI para avaliar e gerir as suas próprias regiões. Atualmente, cerca de 20 grupos lideram avaliações da OHI, incluindo os governos do México e da Indonésia, e cientistas da Suécia que avaliam oito países que fazem fronteira com o Mar Báltico.
O que havia de errado com as práticas que você estava usando antes de 2012?
Para a primeira avaliação global do OHI, processamos dados de 100 fontes diferentes, com lotes de pastas de cópia e arquivos de e-mail com nomes como ' data_final_v2b.xls '. Demorou trabalho de detetive e muito tempo para re-wrangle dados de outro ano para reexecutar os modelos globais uma segunda vez. Isso é realmente muito comum; Os cientistas ambientais raramente são treinados para pensar sobre os dados de uma forma deliberada.
Você descobriu que a transformação de suas práticas de reprodutibilidade tradicionais para um paradigma mais aberto era "extraordinariamente intimidante". Como assim?
Nosso maior desafio foi mudar nossa mentalidade: tivemos que parar de pensar que nossos sistemas homegrown eram bons o suficiente. Foi intimidante pensar em mudar a maneira como sempre trabalhamos e adotando práticas como codificação e controle de versão. Mas, precisávamos de estar a bordo com práticas e ferramentas que foram desenvolvidas especificamente para o mundo rico em dados e colaborativo em que trabalhamos hoje.
Seu artigo descreve um OHI "Toolbox" para garantir a transparência dos dados e reprodutibilidade. Quais são os principais componentes dessa caixa de ferramentas?
Nós construímos o OHI Toolbox com R , RStudio , Git e GitHub , que permitem que nosso trabalho seja mais reprodutível e nossa colaboração mais simplificada. Por exemplo, posso escrever código em R e depois sincronizar os arquivos para o GitHub diretamente do RStudio. Git e GitHub funcionam de forma semelhante ao Dropbox, mas eles atribuem minhas contribuições linha por linha para que qualquer pessoa construa fora do meu código sabe quem entrar em contato com as perguntas. E o que é extremamente poderoso é que também usamos essas mesmas ferramentas e fluxo de trabalho para comunicação, criando documentos estáticos e interativos, apresentações e nosso site, ohi-science.org .
Que diferença a Caixa de Ferramentas fez no seu laboratório?
Eles nos deixaram empurrar os limites de como a nossa ciência é feita, compartilhada e usada. Por exemplo, as pessoas em Estocolmo podem entrar on-line e usar o código que desenvolvemos para avaliações globais, adaptando-o para melhor representar as prioridades e as características do Báltico. Eles usarão o mesmo fluxo de trabalho para que outros grupos possam construir o código e as experiências também. É como um loop de feedback positivo de todo o mundo.
Quais disciplinas ou tipos de pesquisa encontrarão sua abordagem de Caixa de Ferramentas mais fácil de adotar?
Essas ferramentas ajudam você a fazer ciência melhor agora, e também ajudar 'futuro você', seu colaborador mais importante, fazer ciência melhor mais tarde. Então, eles são vantajosos para indivíduos, bem como para laboratórios. Eles podem ser fundamentais para preservar a memória do laboratório, de modo que, quando um aluno de pós-graduação ou pós-doutorado, suas contribuições não saem também. Os PIs podem encorajar esse tipo de cultura mesmo se eles não se codificam.
Como outros laboratórios podem começar a usar essas ferramentas?
Os maiores obstáculos para começar são a exposição e confiança: você tem que ver essas ferramentas usadas de maneiras que são relevantes para você e, em seguida, construir a confiança para usá-los. Eu acho que a comunidade é a coisa mais importante, e grupos como RStudio, GitHub, Software Carpentry , rOpenSci e #rstats no Twitter têm sido incrivelmente favoráveis. Temos ensinado práticas abertas e reprodutíveis através do projeto OHI, mas estamos compartilhando nossa história aqui, porque queremos ajudar os outros a abraçar essas práticas e ferramentas também. Veja mais em ohi-science.org/betterscienceinlesstime .

Comentários
Postar um comentário