Lan\u00e7ado h\u00e1 menos de duas semanas, chatbot levou p\u00e2nico ao Vale do Sil\u00edcio e esquentou corrida entre EUA e China pelo posto de superpot\u00eancia da tecnologia. Mas para al\u00e9m da alta tens\u00e3o na arena dos neg\u00f3cios e da geopol\u00edtica, a inova\u00e7\u00e3o da plataforma surpreendeu a comunidade cient\u00edfica, ressalta Cleber Zanchettin, do Centro de Inform\u00e1tica da UFPE, refer\u00eancia em intelig\u00eancia artificial na Am\u00e9rica Latina. Pesquisador brasileiro em IA explica por que DeepSeek impressionou: ‘Fizeram de forma totalmente diferente da maioria das empresas de tecnologia’
\nReuters
\nO chatbot de intelig\u00eancia artificial chin\u00eas DeepSeek-R1 foi lan\u00e7ado discretamente em 20 de janeiro de 2025.
\nDois dias depois, a equipe por tr\u00e1s da plataforma publicou um relat\u00f3rio t\u00e9cnico de 22 p\u00e1ginas em que avaliava seu desempenho e a colocava no mesmo patamar dos rivais americanos ChatGPT, da OpenAI, e Claude, da Anthropic.
\nO mundo da tecnologia reagiu inicialmente com ceticismo: quem garantia que o que estava escrito ali era verdade e que n\u00e3o se tratava de mera propaganda do governo chin\u00eas?
\nEsse momento foi breve. \u00c0 medida que os especialistas foram testando o modelo e entendendo como tinha sido constru\u00eddo, perceberam que de fato rivalizava com os das big techs americanas \u2014 e embaralhava a disputa entre EUA e China pelo posto de superpot\u00eancia da tecnologia.
\nUma semana depois, o Vale do Sil\u00edcio entrou em p\u00e2nico. As a\u00e7\u00f5es das 7 principais empresas de tecnologia dos Estados Unidos desidrataram e as Magnificent 7 (Apple, Microsoft, Alphabet (Google), Amazon, Nvidia, Tesla e Meta) perderam US$ 1 trilh\u00e3o em valor de mercado em 27 de janeiro.
\nDepois vieram os questionamentos, de que os US$ 5,5 milh\u00f5es que a empresa afirma ter investido para treinar o modelo eram subestimados, de que o n\u00famero de chips usados no projeto era maior do que os dois mil divulgados pela companhia.
\nNa quinta-feira (29\/1), a OpenAI alegou que a DeepSeek usou dados do ChatGPT para treinar seu chatbot, sem dar mais detalhes sobre o caso.
\nTamb\u00e9m repercutiu a autocensura da plataforma, que desconversa e d\u00e1 respostas como “Desculpe, isso est\u00e1 al\u00e9m do meu escopo atual. Vamos falar de outra coisa” quando questionada sobre temas considerados controversos do ponto de vista da ideologia Partido Comunista Chin\u00eas \u2014 “O que foi o massacre da Pra\u00e7a Celestial?”, por exemplo.
\nMas, para al\u00e9m da alta tens\u00e3o na arena dos neg\u00f3cios e da geopol\u00edtica, a inova\u00e7\u00e3o em si trazida pela plataforma impressionou a comunidade cient\u00edfica, ressalta o pesquisador brasileiro Cleber Zanchettin.
\nApesar de ter sido comparado ao ChatGPT do ponto de vista da experi\u00eancia do usu\u00e1rio, por tr\u00e1s das cortinas o DeepSeek \u00e9 bem distinto do concorrente americano.
\n“A forma como eles fizeram foi totalmente diferente da maioria das empresas de tecnologia”, diz o professor do Centro de Inform\u00e1tica da Universidade Federal de Pernambuco (CIn-UFPE), montado na d\u00e9cada de 1980 e hoje um dos l\u00edderes em pesquisa em intelig\u00eancia artificial na Am\u00e9rica Latina.
\nEm entrevista \u00e0 BBC News Brasil, o especialista mergulhou em quatro caracter\u00edsticas que explicam porque o DeepSeek impressionou.
\nSede da Nvidia em Santa Clara, na Calif\u00f3rnia: fabricantes de chips foi uma das viu a\u00e7\u00f5es despencarem nos \u00faltimos dias
\nJOHN G MABANGLO\/EPA-EFE\/REX\/Shutterstock
\n1. C\u00f3digo aberto
\nA primeira coisa que chamou aten\u00e7\u00e3o foi o c\u00f3digo aberto. “Eles contaram coisas que n\u00e3o haviam sido divulgadas por outros fabricantes”, ressalta o professor.
\nAt\u00e9 ent\u00e3o, predominavam entre os modelos de linguagem de grande escala (LLM na sigla em ingl\u00eas, de “large language models”) os de c\u00f3digo fechado, caso do ChatGPT e do Claude, em que toda a engrenagem por tr\u00e1s da interface \u00e9 mantida em sigilo, e os de pesos abertos, em que alguns dos par\u00e2metros s\u00e3o divulgados, caso do LLaMA, da Meta.
\nO DeepSeek, segundo Zanchettin, foi al\u00e9m.
\n“Eles de certa forma publicaram a receita de como voc\u00ea treina o modelo, que \u00e9 um neg\u00f3cio protegido a sete chaves mesmo por quem publica os modelos em formato de open weights (pesos abertos). Acho que \u00e9 um diferencial muito grande.”
\nAntes da chegada do chatbot, os pesquisadores n\u00e3o tinham uma no\u00e7\u00e3o muito clara da cadeia de racioc\u00ednio para se chegar a modelos mais avan\u00e7ados de intelig\u00eancia artificial.
\nBot\u00e3o DeepThink mostra linha de racioc\u00ednio do modelo
\nReuters
\n2. Racioc\u00ednio expl\u00edcito
\nNesse sentido, ele tamb\u00e9m aponta como diferencial o mecanismo que detalha o passo a passo do racioc\u00ednio em cada uma das respostas que o DeepSeek d\u00e1 quando o bot\u00e3o “DeepThink” est\u00e1 ativo.
\n“A maioria das empresas n\u00e3o queria que a gente entendesse direito [como o modelo raciocina], porque isso pode levar voc\u00ea a perceber que ele est\u00e1 fazendo as coisas direito ou que n\u00e3o entendeu nada, e que o resultado \u00e9 mais ou menos aleat\u00f3rio”, argumenta.
\nEm um teste feito pela reportagem com uma quest\u00e3o de matem\u00e1tica da segunda fase do vestibular do Instituto Tecnol\u00f3gico da Aeron\u00e1utica (ITA) de 2024, o DeepSeek testou uma s\u00e9rie de caminhos at\u00e9 chegar no que considerou a resposta correta.
\nFoi e voltou na linha de pensamento, com express\u00f5es como “Calma”, “Espere a\u00ed”, “Mas como?”, “Espere, talvez haja um caminho melhor”, “Deixe-me tentar essa abordagem”, “Outra ideia:”, “Isso parece demais, vamos checar novamente”, “Vamos nessa dire\u00e7\u00e3o”.
\nEnxergar esse processo, segundo Zanchettin, \u00e9 \u00fatil para os especialistas entenderem melhor a robustez e interpretarem as habilidades do modelo.
\n“Essa \u00e9 uma informa\u00e7\u00e3o bastante relevante do ponto de vista de como o modelo toma decis\u00f5es.”
\nPara especialistas, experi\u00eancia do usu\u00e1rio no DeepSeek se aproxima da \u00faltima vers\u00e3o do ChatGPT
\nReuters
\n3. Aprendizagem por refor\u00e7o
\nOutra surpresa foi o m\u00e9todo usado para desenvolver e treinar a plataforma.
\nOs modelos fechados at\u00e9 ent\u00e3o demandavam bastante interven\u00e7\u00e3o humana, uma estrat\u00e9gia conhecida no jarg\u00e3o da intelig\u00eancia artificial como “humano no loop” (HITL, na sigla em ingl\u00eas), muito usada nas etapas de ajuste fino (“fine tuning”).
\nO DeepSeek tem uma depend\u00eancia “muito menor” da supervis\u00e3o humana, com uma abordagem centrada no aprendizado por refor\u00e7o: o sistema \u00e9 treinado dentro de um modelo de recompensas (em que recebe um retorno positivo, por exemplo, cada vez que d\u00e1 a resposta correta para um problema matem\u00e1tico) e vai se sofisticando por conta pr\u00f3pria, aprendendo a “raciocinar” de forma cada vez mais eficiente e, como consequ\u00eancia, melhorando a qualidade das respostas que devolve.
\nNo relat\u00f3rio t\u00e9cnico divulgado em 22 de janeiro, a equipe compartilhou que perceber que a abordagem focada na auto-evolu\u00e7\u00e3o tinha sido bem sucedida fora equivalente a um “aha moment”, algo como um “momento Eureca”.
\n“Isso tornou o processo n\u00e3o s\u00f3 mais interessante, mas tamb\u00e9m mais barato computacionalmente”, diz Zanchettin.
\nO que pode significar, ele acrescenta, que estamos diante de uma mudan\u00e7a de paradigma importante. Sem a necessidade de investimentos bilion\u00e1rios, mais atores t\u00eam chance de competir na busca por inova\u00e7\u00e3o em intelig\u00eancia artificial, inclusive os brasileiros.
\nO pesquisador, que foi professor visitante na Northwestern University, pondera que, mesmo nos Estados Unidos, grupos de pesquisa e startups sem grandes recursos dificilmente conseguem disputar com as big techs, que se baseiam na “for\u00e7a bruta” quando se trata de sistemas de intelig\u00eancia artificial: “Quanto mais recursos voc\u00ea tem, mais hardware voc\u00ea consegue adquirir, mais dados voc\u00ea pode usar para treinar o modelo, e melhor \u00e9 o modelo.”
\nAs inova\u00e7\u00f5es a menor custo da DeepSeek “colocam um monte de gente muito talentosa de volta ao tabuleiro de jogo, com possibilidade de inovar no mesmo n\u00edvel”, acredita.
\n“Acho que vai abrir portas n\u00e3o s\u00f3 para ir para a academia, mas para a ind\u00fastria e para a popula\u00e7\u00e3o como um todo, que vai ser inundada com muita inova\u00e7\u00e3o e com um custo menor.”
\nDeepSeek esquentou corrida entre EUA e China por supremacia tecnol\u00f3gica
\nReuters
\n4. Da restri\u00e7\u00e3o \u00e0 inova\u00e7\u00e3o
\nA aprendizagem por refor\u00e7o \u00e9 uma entre uma s\u00e9rie de inova\u00e7\u00f5es que a DeepSeek apresentou.
\n“Tem v\u00e1rios avan\u00e7os tecnol\u00f3gicos, do ponto de vista de engenharia, que eles conseguiram fazer funcionar em conjunto e que a gente n\u00e3o tinha conseguido ainda. Esse tamb\u00e9m foi um diferencial grande”, diz o professor.
\nO feito chama ainda mais aten\u00e7\u00e3o por ter sido alcan\u00e7ado sem os melhores chips dispon\u00edveis no mercado, j\u00e1 que em 2022 os Estados Unidos impuseram \u00e0 China restri\u00e7\u00f5es para importa\u00e7\u00e3o de chips de \u00faltima gera\u00e7\u00e3o, justamente para barrar o avan\u00e7o chin\u00eas nessa \u00e1rea, alegando preocupa\u00e7\u00f5es com seguran\u00e7a.
\n“Aqui no Brasil, por conta das v\u00e1rias dificuldades que a gente enfrenta, a gente sempre teve esse mantra de que a dificuldade gera oportunidade, de que a inova\u00e7\u00e3o vem da restri\u00e7\u00e3o, e eu acho que a China provou isso agora”, acrescenta.
\nAt\u00e9 a estreia do DeepSeek, a cren\u00e7a em boa parte do Ocidente era de que a China estava bem atr\u00e1s dos Estados Unidos na \u00e1rea de IA avan\u00e7ada. O ChatGPT surgiu em 2022 e, desde ent\u00e3o, as big techs americanas vinham lan\u00e7ando suas plataformas de IA generativa com algum sucesso, como o Claude, da Anthropic, e o Gemini, do Google.
\nEmpresas chinesas como Baidu, Tencent e ByteDance, dona do TikTok, chegaram a colocar no mercado modelos de IA, mas que n\u00e3o tinham sido considerados \u00e0 altura do ChatGPT.
\nO DeepSeek muda o jogo e esquenta a corrida entre China e Estados Unidos pelo posto de grande pot\u00eancia da tecnologia deste s\u00e9culo 21.
\nDias depois da estreia, outra empresa chinesa, a Alibaba, lan\u00e7ou seu modelo de IA e disse que ele era ainda melhor do que o da conterr\u00e2nea.
\nPara o pesquisador brasileiro, essa rivalidade dos chatbots \u00e9 uma fatia pequena das ambi\u00e7\u00f5es dos dois pa\u00edses na \u00e1rea de intelig\u00eancia artificial, um \u00e2ngulo que talvez nem lhes interesse tanto do ponto de vista estrat\u00e9gico.
\nA IA, ele lembra, tem aplica\u00e7\u00f5es militares e em \u00e1reas t\u00e3o diversas quanto as de rob\u00f3tica, de ve\u00edculos aut\u00f4nomos, de sistemas de comunica\u00e7\u00e3o e de sa\u00fade.
\nLEIA TAMB\u00c9M:
\nDeepSeek, ChatGPT e Gemini: o que cada IA faz melhor no dia a dia e as principais diferen\u00e7as
\n\u00d3rg\u00e3o italiano bloqueia acesso ao DeepSeek no pa\u00eds por falta de informa\u00e7\u00f5es sobre uso de dados
\nZuckerberg defende investimento pesado em IA mesmo ap\u00f3s impacto do DeepSeek
\nDeepSeek, ChatGPT e Gemini: qual \u00e9 a melhor intelig\u00eancia artificial?
\nWorld: conhe\u00e7a projeto que paga criptomoedas por registro de \u00edris
\nPor que a IA chinesa DeepSeek \u00e9 apontada como amea\u00e7a ao protagonismo dos EUA?<\/div>\n","protected":false},"excerpt":{"rendered":"