bukib
0 bukibs
Columbus, Ohio
Hora local: 06:52
Temperatura: -4.6°C
Probabilidade de chuva: 0%

Latam-GPT: O Novo Modelo de IA Aberto para a América Latina

O Latam-GPT é um modelo de linguagem (LLM) de código aberto desenvolvido pelo Centro Nacional de Inteligência Artificial do Chile (CENIA) em parceria com mais de 60 organizações de 15 países da região, incluindo o Brasil. Esse modelo foi criado para atender às necessidades específicas da América Latina, oferecendo uma alternativa às ferramentas dominantes no mercado que são treinadas majoritariamente em inglês.

O Latam-GPT foi alimentado com cerca de 300 bilhões de tokens em espanhol e português, o que corresponde a aproximadamente 230 bilhões de palavras. Esse acervo textual passou por uma curadoria rigorosa, removendo conteúdos nocivos e anonimizando informações pessoais, cobrindo áreas como humanidades, saúde, políticas públicas e culturas indígenas.

Características e Objetivos

O projeto se apoia na arquitetura Llama 3.1, com 70 bilhões de parâmetros, e contou com infraestrutura de nuvem fornecida pela Amazon Web Services (AWS). A otimização dos recursos computacionais permitiu reduzir o período de treinamento de 25 para apenas 9 dias, uma redução de 64%.

O objetivo do Latam-GPT é funcionar como um bem público, democratizando o acesso à tecnologia e viabilizando seu uso em áreas estratégicas. Com sua licença aberta, universidades, governos e startups podem adaptá-lo livremente para criar ferramentas próprias em campos como educação, empreendedorismo e administração estatal.

Importância e Impacto

A escassez de material em idiomas latinos nos bancos globais de treinamento motivou a iniciativa. Atualmente, textos em espanhol correspondem a cerca de 4% do total disponível, enquanto o português responde por apenas 2%. Essa disparidade faz com que particularidades culturais, históricas e políticas do continente sejam ignoradas ou tratadas superficialmente pelos sistemas existentes.

Para o diretor do CENIA, Álvaro Soto, o Latam-GPT não é um produto final, mas um alicerce sobre o qual diferentes atores poderão erguer soluções ajustadas às suas realidades. Isso pode ter um impacto significativo na região, permitindo o desenvolvimento de soluções mais personalizadas e eficazes.

  • O Latam-GPT é um modelo de linguagem de código aberto desenvolvido para a América Latina.
  • Foi treinado com 300 bilhões de tokens em espanhol e português.
  • Tem como objetivo democratizar o acesso à tecnologia e viabilizar seu uso em áreas estratégicas.

Este conteúdo pode conter links de compra.

Fonte: link