O chatbot de inteligência artificial chinês DeepSeek-R1 foi lançado discretamente em 20 de janeiro de 2025.fortune ox touro
Dois dias depois, a equipe por trás da plataforma publicou um relatório técnico de 22 páginas em que avaliava seu desempenho e a colocava no mesmo patamar dos rivais americanos ChatGPT, da OpenAI, e Claude, da Anthropic.
O mundo da tecnologia reagiu inicialmente com ceticismo: quem garantia que o que estava escrito ali era verdade e que não se tratava de mera propaganda do governo chinês?

Esse momento foi breve. À medida que os especialistas foram testando o modelo e entendendo como tinha sido construído, perceberam que de fato rivalizava com os das big techs americanas —e embaralhava a disputa entre EUA e China pelo posto de superpotência da tecnologia.
Uma semana depois, o Vale do Silício entrou em pânico. As ações das sete principais empresas de tecnologia dos Estados Unidos desidrataram e as Magnificent 7 (Apple, Microsoft, Alphabet (Google), Amazon, Nvidia, Tesla e Meta) perderam US$ 1 trilhão em valor de mercado em 27 de janeiro.
Depois vieram os questionamentos, de que os US$ 5,5 milhões que a empresa afirma ter investido para treinar o modelo eram subestimados, de que o número de chips usados no projeto era maior do que os 2.000 divulgados pela companhia.
ZA9BET - Apostas Confiáveis - Confiança é na ZA9BETNa quinta-feira (29), a OpenAI alegou que a DeepSeek usou dados do ChatGPT para treinar seu chatbot, sem dar mais detalhes sobre o caso.
Leia tambémFlavia Boggio: O que ninguém previa é que o ChatGPT seria uma vítima do próprio veneno Jogue Agora com ZA9BET — Viva uma experiência única de Blackjack & Roleta ao Vivo nas mesas exclusivas da ZA9BET! Mais de 4.000 slots, roleta ao vivo e blackjack te esperam na ZA9BET! Registre-se agora. Cassino Online. Apostas Grátis. Apostas Especiais. Operador Autorizado. ConsulteT&C. Opinião: A inteligência artificial da ditadura chinesa John Thornhill: Com DeepSeek, China inova e Estados Unidos imitam
Também repercutiu a autocensura da plataforma, que desconversa e dá respostas como "Desculpe, isso está além do meu escopo atual. Vamos falar de outra coisa" quando questionada sobre temas considerados controversos do ponto de vista da ideologia Partido Comunista Chinês —"O que foi o massacre da Praça Celestial?", por exemplo.
Mas, para além da alta tensão na arena dos negócios e da geopolítica, a inovação em si trazida pela plataforma impressionou a comunidade científica, ressalta o pesquisador brasileiro Cleber Zanchettin.
Apesar de ter sido comparado ao ChatGPT do ponto de vista da experiência do usuário, por trás das cortinas o DeepSeek é bem distinto do concorrente americano.
"A forma como eles fizeram foi totalmente diferente da maioria das empresas de tecnologia", diz o professor do CIn-UFPE (Centro de Informática da Universidade Federal de Pernambuco), montado na década de 1980 e hoje um dos líderes em pesquisa em inteligência artificial na América Latina.
Em entrevista à BBC News Brasil, o especialista mergulhou em quatro características que explicam porque o DeepSeek impressionou.

A primeira coisa que chamou atenção foi o código aberto. "Eles contaram coisas que não haviam sido divulgadas por outros fabricantes", ressalta o professor.
Até então, predominavam entre os modelos de linguagem de grande escala (LLM na sigla em inglês, de "large language models") os de código fechado, caso do ChatGPT e do Claude, em que toda a engrenagem por trás da interface é mantida em sigilo, e os de pesos abertos, em que alguns dos parâmetros são divulgados, caso do LLaMA, da Meta.
O DeepSeek, segundo Zanchettin, foi além.
"Eles de certa forma publicaram a receita de como você treina o modelo, que é um negócio protegido a sete chaves mesmo por quem publica os modelos em formato de open weights (pesos abertos). Acho que é um diferencial muito grande."
Antes da chegada do chatbot, os pesquisadores não tinham uma noção muito clara da cadeia de raciocínio para se chegar a modelos mais avançados de inteligência artificial.

Nesse sentido, ele também aponta como diferencial o mecanismo que detalha o passo a passo do raciocínio em cada uma das respostas que o DeepSeek dá quando o botão "DeepThink" está ativo.
"A maioria das empresas não queria que a gente entendesse direito [como o modelo raciocina], porque isso pode levar você a perceber que ele está fazendo as coisas direito ou que não entendeu nada, e que o resultado é mais ou menos aleatório", argumenta.
Em um teste feito pela reportagem com uma questão de matemática da segunda fase do vestibular do ITA (Instituto Tecnológico da Aeronáutica) de 2024, o DeepSeek testou uma série de caminhos até chegar no que considerou a resposta correta.

Foi e voltou na linha de pensamento, com expressões como "Calma", "Espere aí", "Mas como?", "Espere, talvez haja um caminho melhor", "Deixe-me tentar essa abordagem", "Outra ideia:", "Isso parece demais, vamos checar novamente", "Vamos nessa direção".
Enxergar esse processo, segundo Zanchettin, é útil para os especialistas entenderem melhor a robustez e interpretarem as habilidades do modelo.
"Essa é uma informação bastante relevante do ponto de vista de como o modelo toma decisões."

Outra surpresa foi o método usado para desenvolver e treinar a plataforma.
Os modelos fechados até então demandavam bastante intervenção humana, uma estratégia conhecida no jargão da inteligência artificial como "humano no loop" (HITL, na sigla em inglês), muito usada nas etapas de ajuste fino ("fine tuning").
O DeepSeek tem uma dependência "muito menor" da supervisão humana, com uma abordagem centrada no aprendizado por reforço: o sistema é treinado dentro de um modelo de recompensas (em que recebe um retorno positivo, por exemplo, cada vez que dá a resposta correta para um problema matemático) e vai se sofisticando por conta própria, aprendendo a "raciocinar" de forma cada vez mais eficiente e, como consequência, melhorando a qualidade das respostas que devolve.
No relatório técnico divulgado em 22 de janeiro, a equipe compartilhou que perceber que a abordagem focada na auto-evolução tinha sido bem sucedida fora equivalente a um "aha moment", algo como um "momento Eureca".
jogo do tigre"Isso tornou o processo não só mais interessante, mas também mais barato computacionalmente", diz Zanchettin.
O que pode significar, ele acrescenta, que estamos diante de uma mudança de paradigma importante. Sem a necessidade de investimentos bilionários, mais atores têm chance de competir na busca por inovação em inteligência artificial, inclusive os brasileiros.
O pesquisador, que foi professor visitante na Northwestern University, pondera que, mesmo nos Estados Unidos, grupos de pesquisa e startups sem grandes recursos dificilmente conseguem disputar com as big techs, que se baseiam na "força bruta" quando se trata de sistemas de inteligência artificial: "Quanto mais recursos você tem, mais hardware você consegue adquirir, mais dados você pode usar para treinar o modelo, e melhor é o modelo."
As inovações a menor custo da DeepSeek "colocam um monte de gente muito talentosa de volta ao tabuleiro de jogo, com possibilidade de inovar no mesmo nível", acredita.
"Acho que vai abrir portas não só para ir para a academia, mas para a indústria e para a população como um todo, que vai ser inundada com muita inovação e com um custo menor."

A aprendizagem por reforço é uma entre uma série de inovações que a DeepSeek apresentou.
"Tem vários avanços tecnológicos, do ponto de vista de engenharia, que eles conseguiram fazer funcionar em conjunto e que a gente não tinha conseguido ainda. Esse também foi um diferencial grande", diz o professor.
O feito chama ainda mais atenção por ter sido alcançado sem os melhores chips disponíveis no mercado, já que em 2022 os Estados Unidos impuseram à China restrições para importação de chips de última geração, justamente para barrar o avanço chinês nessa área, alegando preocupações com segurança.
"Aqui no Brasil, por conta das várias dificuldades que a gente enfrenta, a gente sempre teve esse mantra de que a dificuldade gera oportunidade, de que a inovação vem da restrição, e eu acho que a China provou isso agora", acrescenta.
Até a estreia do DeepSeek, a crença em boa parte do Ocidente era de que a China estava bem atrás dos Estados Unidos na área de IA avançada. O ChatGPT surgiu em 2022 e, desde então, as big techs americanas vinham lançando suas plataformas de IA generativa com algum sucesso, como o Claude, da Anthropic, e o Gemini, do Google.
Empresas chinesas como Baidu, Tencent e ByteDance, dona do TikTok, chegaram a colocar no mercado modelos de IA, mas que não tinham sido considerados à altura do ChatGPT.
O DeepSeek muda o jogo e esquenta a corrida entre China e Estados Unidos pelo posto de grande potência da tecnologia deste século 21.
Dias depois da estreia, outra empresa chinesa, a Alibaba, lançou seu modelo de IA e disse que ele era ainda melhor do que o da conterrânea.
Para o pesquisador brasileiro, essa rivalidade dos chatbots é uma fatia pequena das ambições dos dois países na área de inteligência artificial, um ângulo que talvez nem lhes interesse tanto do ponto de vista estratégico.
A IA, ele lembra, tem aplicações militares e em áreas tão diversas quanto as de robótica, de veículos autônomos, de sistemas de comunicação e de saúde.
Texto publicado originalmente aqui
benefício do assinante
Você tem 7 acessos por dia para dar de presente. Qualquer pessoa que não é assinante poderá ler.
benefício do assinante
Assinantes podem liberar 7 acessos por dia para conteúdos da Folha.
Já é assinante? Faça seu login ASSINE A FOLHARecurso exclusivo para assinantes
assine ou faça login
Leia tudo sobre o tema e siga:
ChatGPT DeepSeek inteligência artificial OpenAI sua assinatura pode valer ainda maisVocê já conhece as vantagens de ser assinante da Folha? Além de ter acesso a reportagens e colunas, você conta com newsletters exclusivas (conheça aqui). Também pode baixar nosso aplicativo gratuito na Apple Store ou na Google Play para receber alertas das principais notícias do dia. A sua assinatura nos ajuda a fazer um jornalismo independente e de qualidade. Obrigado!
sua assinatura vale muitoMais de 180 reportagens e análises publicadas a cada dia. Um time com mais de 200 colunistas e blogueiros. Um jornalismo profissional que fiscaliza o poder público, veicula notícias proveitosas e inspiradoras, faz contraponto à intolerância das redes sociais e traça uma linha clara entre verdade e mentira. Quanto custa ajudar a produzir esse conteúdo?
ASSINE POR R$ 1,90 NO 1º MÊS Envie sua notícia Erramos? Endereço da página https://www1.folha.uol.com.br/tec/2025/01/pesquisador-brasileiro-em-ia-explica-por-que-deepseek-impressionou-fizeram-de-forma-totalmente-diferente-da-maioria-das-empresas-de-tecnologia.shtml Comentários Termos e condições Todos os comentários Comente Comentar é exclusividade para assinantes. Assine a Folha por R$ 1,90 no 1º mês notícias da folha no seu email

Recurso exclusivo para assinantes
assine ou faça login
Senado e Câmara renovam comando empoderados e em clima de 039;já ganhou039;Congresso sedimenta fortalecimento iniciado há dez anos; Alcolumbre e Motta encontram cenário de duplo favoritismo que não ocorre desde 2003
31.jan.2025 às 23h00 sonhar com pé no jogo do bicho
Recurso exclusivo para assinantes
assine ou faça login
Moradores de SP recebem alerta severo para tempestade nesta sexta (31)Pela segunda vez, a Defesa Civil enviou o alerta para a capital paulista
31.jan.2025 às 21h53
Recurso exclusivo para assinantes
assine ou faça login
Estrangeiros relatam algemas e maus-tratos em repatriação do BrasilMinistério da Justiça afirma que responsabilidade pelo procedimento é da companhia aérea, enquanto associação de empresas diz que a PF determina a necessidade de escolta
1º.fev.2025 às 4h00Copyright Folha de S.Paulo. Todos os direitos reservados. É proibida a reprodução do conteúdo desta página em qualquer meio de comunicação, eletrônico ou impresso, sem autorização escrita da Folhapress.
Modal 500O jornalnbsp;Folha de S.Paulonbsp;(1921 - 2025)nbsp;eacute; publicado pela Empresa Folha da Manhatilde; S.A. CNPJ: 60.579.703/0001-48
NEWSLETTERCadastro realizado com sucesso!
OkPor favor, tente mais tarde!
Ok