Lançamento do DeepSeek R1 traz IA avançada e gratuita ao público

Uma start-up chinesa de inteligência artificial, DeepSeek, lançou seu primeiro grande modelo de linguagem, o DeepSeek-R1, juntamente com um chatbot gratuito para iOS e Android.

O modelo R1 foi disponibilizado de forma aberta sob licença MIT, o que significa que desenvolvedores do mundo todo podem inspecionar, baixar e utilizar os pesos do modelo livremente.

Com cerca de 7 bilhões de parâmetros ativos e técnicas avançadas de reforço de aprendizado em sua criação, o R1 oferece respostas em qualidade comparável às do OpenAI GPT-4, porém a um custo de treinamento significativamente menor, segundo a DeepSeek.

A empresa afirma ter treinado um modelo anterior (V3, predecessor do R1) por cerca de US$ 6 milhões – uma fração dos US$ 100 milhões estimados para treinar o GPT-4 em 2023.

O DeepSeek-R1 diferencia-se por sua ênfase em raciocínio passo a passo e resolução de problemas complexos.

A abordagem de treinamento privilegiou métodos de reforço com feedbacks específicos, focando em matemática e programação, além de diálogo genérico.

Isso resultou em um assistente virtual capaz de resolver problemas algébricos e depurar código, aproximando-se do desempenho de modelos de ponta como GPT-4, porém consumindo uma ordem de magnitude menos recursos computacionais.

Especialistas apontam que o sucesso do R1 demonstra o potencial de start-ups em inovar arquiteturas de IA de forma eficiente.

“É impressionante ver um modelo open-source desafiando gigantes estabelecidos”, comentou um pesquisador em IA, referindo-se à surpresa da indústria com a qualidade do DeepSeek-R1.

A estratégia da DeepSeek em disponibilizar gratuitamente seu chatbot alimentado pelo R1 visa coletar feedback massivo de usuários e desenvolvedores.

Em poucos dias, a plataforma atraiu milhões de interações, fornecendo dados valiosos para melhorias futuras.

Analistas avaliam que o lançamento simultâneo do modelo aberto e do aplicativo de chatbot gratuito indica que a DeepSeek busca engajar a comunidade de desenvolvedores e acelerar a adoção de suas ferramentas.

Com um modelo robusto e aberto, a empresa se insere na tendência de IA aberta, fomentando inovação colaborativa e oferecendo uma alternativa de baixo custo frente às soluções proprietárias.

As próximas semanas dirão se essa abordagem conseguirá ganhar espaço frente às big techs ocidentais no domínio da inteligência artificial.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *