Bancos de dados genéticos ‘anônimos’ vulneráveis ​​a vazamentos de privacidade

Bancos de dados genéticos ‘anônimos’ vulneráveis ​​a vazamentos de privacidade

Um estudo levantou preocupações de que um tipo de base de dados genética que é cada vez mais popular entre os investigadores poderia ser explorada para revelar as identidades dos seus participantes, ou ligar informações de saúde privadas aos seus perfis genéticos públicos.

Conjuntos de dados unicelulares podem conter informações sobre a expressão genética em milhões de células coletadas de milhares de pessoas. Muitas vezes são de acesso gratuito, proporcionando um recurso valioso para pesquisadores que estudam os efeitos de doenças a nível celular. Os dados deveriam ser anonimizados, mas um estudo publicado em 2 de outubro em Célula1 mostra como os dados genéticos de um estudo “podem ser explorados para descobrir informações privadas sobre indivíduos em outro estudo”, escrevem os autores.

As conclusões destacam a problema de equilibrar os interesses dos investigadores com a privacidade dos doadores. “Nossos genomas são muito identificadores. Eles podem dizer muito sobre nós, nossas características, nossa predisposição a doenças”, diz o coautor do estudo Gamze Gürsoy, pesquisador de bioinformática da Universidade de Columbia, na cidade de Nova York. “Você pode alterar o número do seu cartão de crédito se ele vazar, mas não pode alterar o seu genoma.”

Dados confidenciais

As preocupações em torno da privacidade em conjuntos de dados genéticos já foram levantadas antes, mas concentraram-se principalmente em conjuntos de dados genéticos “em massa”. Eles contêm informações sobre a atividade genética calculada em média em uma grande população de células, em vez de dados de uma célula individual.

Anteriormente, pensava-se que os conjuntos de dados unicelulares não seriam tão vulneráveis ​​a fugas de privacidade, adequado ao nível de “ruído”, ou variação na expressão genética, entre diferentes células. Mas Gürsoy e os seus colegas demonstraram que não era esse o caso.

A equipe revisou três conjuntos de dados unicelulares disponíveis publicamente, que incluíam células sanguíneas de pessoas com lúpus, uma doença autoimune crônica. Os pesquisadores descobriram que poderiam usar dados sobre expressão genética para prever a estrutura do genoma de uma pessoa, combinando esses valores com informações sobre expressão de loci de características quantitativas (eQTLs). Os detalhes dos eQTLs – variações no cromossomo que se correlacionam com a expressão genética – do mesmo modo estão disponíveis publicamente em conjuntos de dados unicelulares.

Para testar a fiabilidade do seu trabalho, os investigadores compararam as suas previsões genómicas com uma base de dados genómica correspondente às células que utilizaram. Eles conseguiram vincular a maioria dos conjuntos de dados ao genoma correspondente, com uma taxa de precisão de mais de 80%.

Ao contrário dos dados sobre expressão genética e eQTLs, os bancos de dados do genoma completo geralmente podem ser acessados ​​apenas por cientistas, para proteger as informações de identificação do doador. Mas os pesquisadores ressaltam que os dados do genoma de um participante podem estar disponíveis publicamente em outros lugares. Por exemplo, eles podem tê-lo carregado em um site de genealogia no qual os usuários enviam amostras de DNA para saber mais sobre sua ancestralidade. Nesse caso, um invasor poderia identificar um indivíduo cujas células estão em um conjunto de dados unicelulares usando seu genoma. Isto poderia revelar dados pessoais relacionados com uma característica sensível, como um distúrbio psiquiátrico, uma vez que os participantes da investigação são frequentemente selecionados para estudar a biologia destas condições complexas.

Violações de privacidade como estas podem ter implicações no mundo real, como causar discriminação no emprego, diz Gürsoy. Ela acrescenta que eventuais vazamentos podem até ter repercussões nas gerações futuras, já que características genéticas podem ser transmitidas aos descendentes. “Qualquer coisa que vaze sobre nós se perpetuará por dentro de das gerações”, diz ela.

Bradley Malin, que pesquisa o compartilhamento de dados genômicos em larga escala na Universidade Vanderbilt em Nashville, Tennessee, diz que o estudo é uma “nova extensão e contribuição para a literatura”. Ele acrescenta que pesquisas futuras poderiam explorar se os dados genômicos ainda poderiam ser vinculados em conjuntos de dados maiores que incluíssem amostras de milhares ou milhões de pessoas.

Interesses conflitantes

Os cientistas não têm certeza sobre a melhor forma de lidar com essas questões de privacidade. “Existe o desejo de proteger a privacidade individual, mas do mesmo modo o desejo de avançar colectivamente na investigação médica, e estes estão, infelizmente, em conflito entre si”, diz Mark Gerstein, que investiga ciência de dados médicos na Universidade de Yale, em New Haven, Connecticut. A solução mais simples seria parar de tornar os dados genéticos tão facilmente acessíveis, mas isso afetaria negativamente a investigação, diz ele. “Precisamos compartilhar e agregar grandes quantidades de informações.” ele diz. “Bloqueá-lo e torná-lo mais privado, na verdade, apenas atrapalha todo o processo.”

No seu estudo, Gürsoy e os seus colegas afirmam que deveria haver maior transparência sobre os riscos para os participantes que partilham os seus dados genómicos, e sugerem que os investigadores devem garantir que os doadores dão consentimento para a partilha dos seus dados. Outro caminho a seguir poderia ser criptografar dados pessoais quando fazem parte de um banco de dados público. Os autores reconhecem que isso complicaria o processo de construção e manutenção de conjuntos de dados, mas dizem que poderia ajudar a proteger a privacidade dos participantes.

Fonte Desta Notícia

Compartilhar:
Go up
Sair da versão mobile