A DeepSeek, empresa chinesa de inteligência artificial sediada em Hangzhou, anunciou o lançamento de um novo modelo experimental, prometendo revolucionar o processamento de textos longos. Apelidado de DeepSeek-V3.2-Exp, este modelo é descrito pela empresa como uma etapa crucial em direção a uma arquitetura de próxima geração, que pode ter grande impacto no mercado de IA.
Aposta do DeepSeek em Sparse Attention
O novo modelo destaca um mecanismo chamado DeepSeek Sparse Attention, que, segundo a empresa, possibilita uma redução significativa nos custos de computação sem comprometer o desempenho. Essa inovação surge como uma resposta às demandas por modelos de IA mais eficientes e acessíveis, capazes de lidar com volumes crescentes de dados textuais.
O lançamento do DeepSeek-V3.2-Exp surge em um contexto de grande competitividade no mercado de IA. Empresas como a Qwen, da Alibaba, e a OpenAI, liderada pelo famoso modelo GPT-4, disputam espaço nesse mercado cada vez mais movimentado. A DeepSeek busca se destacar com o seu modelo experimental, que pode desafiar os líderes atuais com sua promessa de alto desempenho e baixo custo de processamento.
Preços mais acessíveis para rampar o desenvolvimento
A DeepSeek anunciou uma redução de mais de 50% nos preços da API, tornando seus modelos mais acessíveis para desenvolvedores e empresas. Essa estratégia visa ampliar o acesso à tecnologia de IA, incentivando a criação de novas aplicações e o desenvolvimento de soluções inovadoras em diversos setores.
Para a DeepSeek, o modelo experimental DeepSeek-V3.2-Exp representa um passo importante em direção ao lançamento de sua próxima grande inovação em IA. A empresa observa que o mercado espera ansiosamente por esse lançamento, que tem o potencial de revolucionar o processamento de linguagem natural e impulsionar o desenvolvimento de aplicações ainda mais robustas na área de inteligência artificial.