Falha de segurança em memória GDDR6 expõe GPUs da Nvidia a ataques

Pesquisadores de segurança identificaram uma nova modalidade de ataque, chamada de GPUHammer, que afeta GPUs da NVIDIA com memória GDDR6, como a RTX A6000. A falha, uma variação do conhecido ataque Rowhammer, permite a corrupção silenciosa de dados na VRAM, o que pode comprometer a integridade de modelos de inteligência artificial.

O ataque consiste em acessar repetidamente uma mesma linha de células de memória para causar interferência elétrica e alterar bits ao redor dessa área de células. Em testes realizados em uma GPU Nvidia RTX A6000, os pesquisadores conseguiram reduzir a precisão de um modelo de IA de 80% para menos de 1% com a alteração de um único bit.

NVIDIA já está ciente do problema e tem solução

A vulnerabilidade é uma ameaça para ambientes onde GPUs são compartilhadas, como servidores em nuvem e clusters de treinamento de IA. A NVIDIA já sabia da falha e recomendou que os usuários habilitem a função de Código de Correção de Erros (ECC) em suas GPUs, incluindo as das famílias Hopper e Blackwell, para mitigar o risco, embora isso possa levar a uma pequena redução no desempenho e na memória utilizável.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

Essa foi a GPU usada nos testes pela Universidade de Toronto (Imagem: NVIDIA/Divulgação)

O achado veio de pesquisadores da Universidade de Toronto, que demostraram o erro com o ECC desativado. A NVIDIA, no entanto, afirma que todas GPUs Hopper e Blackwell vão para seus clientes com o recurso ativado, eliminando a chance de a falha ser explorada já de fábrica. A empresa recomenda que clientes com GPUs mais antigas, como Volta, Turing e Ampere, também se certifiquem de que o ECC está ativado.

Veja mais do CTUP:

Leia a matéria no Canaltech.