Até a IA Sofre com o “Brain Rot” Causado por Conteúdos de Baixa Qualidade
O termo “brain rot” tornou-se um atalho para descrever como o consumo incessante de conteúdo online trivial ou pouco desafiador pode embotar a cognição humana. No entanto, uma nova pesquisa revela que essa aflição também afeta a inteligência artificial.
Os pesquisadores da Universidade do Texas em Austin, da Texas A&M University e da Universidade Purdue descobriram que os grandes modelos de linguagem, treinados na mesma enxurrada de lixo digital que os humanos consomem constantemente, podem sofrer de “apodrecimento cerebral” semelhante ao impacto sobre a cognição humana.
Os modelos de IA, quando expostos a conteúdo de baixa qualidade, apresentaram falhas de “raciocínio”, inconsistências factuais e incapacidade de manter coerência lógica em contextos mais longos. Isso sugere que a qualidade dos dados de treinamento é fundamental para o desempenho dos modelos de IA.
Para testar sua “Hipótese do Apodrecimento Cerebral dos LLMs”, a equipe de pesquisa construiu conjuntos de dados “ruins” e de controle a partir da plataforma social X (antigo Twitter). O conjunto de baixa qualidade incluía conteúdos altamente populares projetados para atrair atenção com pouca informação.
Os resultados mostraram que o dano causado pelo conteúdo de baixa qualidade teve um impacto duradouro sobre os modelos. Mesmo após uma extensa “reabilitação” com dados mais limpos, os modelos degradados nunca se recuperaram totalmente.
Isso levanta questões sobre a importância da “higiene cognitiva” no treinamento de modelos de IA. As grandes empresas de IA investem muito esforço para melhorar os dados utilizados no treinamento, mas o envenenamento de dados é uma preocupação maior.
- A melhoria dos dados usados no pré-treinamento é uma das razões pelas quais os sistemas de IA vêm se tornando melhores.
- A integridade dos dados que moldam os modelos é fundamental para a segurança em IA.
- O futuro da segurança em IA pode depender da capacidade de evitar distorções de raciocínio e representação embutidas nos dados.
Em resumo, a pesquisa sugere que a IA também pode sofrer de “brain rot” causado por conteúdos de baixa qualidade, e que a “higiene cognitiva” é fundamental para o treinamento de modelos de IA.
Este conteúdo pode conter links de compra.
Fonte: link