Uma start-up chinesa de inteligência artificial, DeepSeek, lançou seu primeiro grande modelo de linguagem, o DeepSeek-R1, juntamente com um chatbot gratuito para iOS e Android.
O modelo R1 foi disponibilizado de forma aberta sob licença MIT, o que significa que desenvolvedores do mundo todo podem inspecionar, baixar e utilizar os pesos do modelo livremente.
Com cerca de 7 bilhões de parâmetros ativos e técnicas avançadas de reforço de aprendizado em sua criação, o R1 oferece respostas em qualidade comparável às do OpenAI GPT-4, porém a um custo de treinamento significativamente menor, segundo a DeepSeek.
A empresa afirma ter treinado um modelo anterior (V3, predecessor do R1) por cerca de US$ 6 milhões – uma fração dos US$ 100 milhões estimados para treinar o GPT-4 em 2023.
O DeepSeek-R1 diferencia-se por sua ênfase em raciocínio passo a passo e resolução de problemas complexos.
A abordagem de treinamento privilegiou métodos de reforço com feedbacks específicos, focando em matemática e programação, além de diálogo genérico.
Isso resultou em um assistente virtual capaz de resolver problemas algébricos e depurar código, aproximando-se do desempenho de modelos de ponta como GPT-4, porém consumindo uma ordem de magnitude menos recursos computacionais.
Especialistas apontam que o sucesso do R1 demonstra o potencial de start-ups em inovar arquiteturas de IA de forma eficiente.
“É impressionante ver um modelo open-source desafiando gigantes estabelecidos”, comentou um pesquisador em IA, referindo-se à surpresa da indústria com a qualidade do DeepSeek-R1.
A estratégia da DeepSeek em disponibilizar gratuitamente seu chatbot alimentado pelo R1 visa coletar feedback massivo de usuários e desenvolvedores.
Em poucos dias, a plataforma atraiu milhões de interações, fornecendo dados valiosos para melhorias futuras.
Analistas avaliam que o lançamento simultâneo do modelo aberto e do aplicativo de chatbot gratuito indica que a DeepSeek busca engajar a comunidade de desenvolvedores e acelerar a adoção de suas ferramentas.
Com um modelo robusto e aberto, a empresa se insere na tendência de IA aberta, fomentando inovação colaborativa e oferecendo uma alternativa de baixo custo frente às soluções proprietárias.
As próximas semanas dirão se essa abordagem conseguirá ganhar espaço frente às big techs ocidentais no domínio da inteligência artificial.