Nosso grupo de pesquisa

Com sua primeira edição em 2017, o Workshop de Python para Dados Biológicos se difundiu com o objetivo oferecer práticas de introdução à programação, com a linguagem Python, aplicada a dados biológicos, visando atender a necessidade de biocientistas que estão, cada vez mais, lidando com problemas que exigem competências básicas em programação, como ciência de dados, computação e bioinformática. Nesse contexto, o workshop surgiu como uma oportunidade de treinamento para estudantes de graduação e pós-graduação em ciências da vida no Brasil.

O evento é organizado por alunos de graduação, pós-graduação e apoiado por professores de todo o país. Dentre as edições já realizadas, a edição de 2020 foi descrita em um artigo científico publicado na Plos Computational Biology (Zuvanov et al., 2021). Ao todo, 19 pessoas participaram da organização desta edição, que contou com 37 alunos, com pouca ou nenhuma experiência em programação (Figura 1).

A generic square placeholder image with rounded corners in a figure.
Figura 1: Conhecimento prévio de programação dos participantes. A maioria dos participantes relatou pouca ou nenhuma experiência com programação em geral (azul) ou python em particular (amarelo) (adaptada de Zuvanov et al., 2021).

E como aconteceu?

O Workshop foi estruturado para abranger quatro dias de aprendizado imersivo em Python, contando com palestras teóricas, atividades que incentivam o questionamento e a prática dos participantes. Além de palestras e flash talks, apresentações curtas de trabalhos científicos desenvolvidos pelos participantes.

• Dia 1 - Introdução ao Python: Neste dia, os participantes foram apresentados a assuntos básicos da linguagem, tais como variáveis, tipos de dados, aritmética, operações lógicas e condicionais, listas e strings. Tudo isso usando uma abordagem baseada em um contexto biológico.

• Dia 2 - Manipulação e visualização de dados: O segundo dia foi focado na manipulação de dados e visualização de dados para análises estatísticas. Assim, os alunos foram ensinados a importar diferentes tipos de dados e convertê-los em outros. Além de terem sido apresentados as bibliotecas Pandas e Matplotlib.

• Dia 3 - Análise de dados biológicos: O foco do terceiro dia visou discutir dados de anotação de genoma e calcular estatísticas descritivas sobre características genômicas (por exemplo, íntrons), compilando e revisando o que foi aprendido nos dias anteriores.

• Dia 4 – Praticando: O último dia do evento teve 2 horas de codificação ao vivo focadas na avaliação de uma montagem do genoma, onde grupo de alunos deveriam identificar os comandos mais adequados para resolver a tarefa.

Desde 2020, a comunicação entre alunos e a organização acontece na plataforma Slack e as palestras por meio do Google Meet. Além disso, a implementação de cadernos digitais do Google Colab durante as aulas “live coding”, tornou o processo ainda mais interativo.

Referências

Zuvanov, L., Basso Garcia, A. L., Correr, F. H., Bizarria Jr, R., Filho, A. P. D. C., da Costa, A. H., … & Corrêa dos Santos, R. A. (2021). The experience of teaching introductory programming skills to bioscientists in Brazil. PLoS computational biology, 17(11), e1009534.