Pesquisa de site

O que é DeepSeek AI? É seguro? Aqui está tudo o que você precisa saber


Os modelos da startup chinesa são estimulantes, disruptivos ou ameaçadores? Isso depende do seu ponto de vista. Aqui está o que os especialistas acham que você deve saber.

Apenas algumas semanas em sua fama recém-descoberta, a startup chinesa de IA DeepSeek está se movendo a uma velocidade vertiginosa, derrubando concorrentes e provocando conversas sobre as virtudes do software de código aberto.

No entanto, inúmeras preocupações de segurança surgiram sobre a empresa, levando organizações privadas e governamentais a proibir o uso do DeepSeek. Aqui está o que você precisa saber.

O que é o DeepSeek?

Fundada por Liang Wenfeng em maio de 2023 (e, portanto, nem mesmo dois anos atrás), a startup chinesa desafiou empresas de IA estabelecidas com sua abordagem de código aberto. De acordo com a Forbes, a vantagem do DeepSeek pode estar no fato de ser financiado apenas pelo High-Flyer, um fundo de hedge também administrado pela Wenfeng, que dá à empresa um modelo de financiamento que suporta crescimento e pesquisa rápidos.

A startup fez ondas em janeiroquando lançou a versão completa do R1, seu modelo de raciocínio de código aberto que pode superar o o1 da OpenAI. Pouco depois, os downloads da App Store do assistente de IA do DeepSeek - que executa o V3, um modelo DeepSeeklançado em dezembro - superaram o ChatGPT, anteriormente o aplicativo gratuito mais baixado. O DeepSeek R1 chegou a subir para o terceiro lugar geral na Chatbot Arena do HuggingFace, lutando com vários modelos Gemini eChatGPT-4o; ao mesmo tempo, a DeepSeek lançou um modelo promissor de nova imagem.

A capacidade da empresa de criar modelos de sucesso otimizando estrategicamente chips mais antigos - resultado da proibição de exportação de chips fabricados nos EUA, incluindo a Nvidia - e distribuindo cargas de consulta entre modelos para eficiência é impressionante para os padrões da indústria.

O que é o DeepSeek R1?

Lançado na íntegra em 21 de janeiro, o R1 é o principal modelo de raciocínio da DeepSeek, que tem desempenho igual ou superior ao elogiado modelo o1 da OpenAI em vários benchmarks de matemática, codificação e raciocínio.

Construído no V3 e baseado no Qwen do Alibaba e no Llama da Meta, o que torna o R1 interessante é que, ao contrário da maioria dos outros modelos de ponta de gigantes da tecnologia, ele é de código aberto, o que significa que qualquer pessoa pode baixá-lo e usá-lo. Dito isso, a DeepSeek não divulgou o conjunto de dados de treinamento do R1. Até agora, todos os outros modelos lançados também são de código aberto.

O DeepSeek é mais barato do que os modelos comparáveis dos EUA. Para referência, o acesso à API R1 começa em US$0,14 para um milhão de tokens, uma fração dos US$7,50 que a OpenAI cobra pelo nível equivalente.

A DeepSeek afirma em um artigo de pesquisa da empresa que seu modelo V3, que pode ser comparado a um modelo de chatbot padrão como o Claude, custou US $5,6 milhões para treinar, um número que circulou (e contestou) como todo o custo de desenvolvimento do modelo. Como a Reuters relatou, alguns especialistas em laboratório acreditam que o artigo da DeepSeek se refere apenas ao treinamento final para a V3, não a todo o seu custo de desenvolvimento (o que seria uma fração do que os gigantes da tecnologia gastaram para construir modelos competitivos). Outros especialistas sugerem que os custos da DeepSeek não incluem custos anteriores de infraestrutura, P&D, dados e pessoal.

Uma desvantagem que pode afetar a competição de longo prazo do modelo com o1 e alternativas fabricadas nos EUA é a censura. Os modelos chineses geralmente incluem bloqueios em determinados assuntos, o que significa que, embora funcionem de forma comparável a outros modelos, eles podem não responder a algumas perguntas (veja como o assistente de IA do DeepSeek responde a perguntas sobre a Praça da Paz Celestial e Taiwanaqui). À medida que o uso do DeepSeek aumenta, alguns estão preocupados que as rigorosas proteções chinesas e os vieses sistêmicos de seus modelos possam ser incorporados em todos os tipos de infraestrutura.

Dito isso, você pode acessar versões sem censura baseadas nos EUA do DeepSeek por meio de plataformas como o Perplexity. Essas plataformas removeram os pesos de censura do DeepSeek e o executam em servidores locais para evitar preocupações de segurança.

Em dezembro, a capacidade do Tiernan RaycompardR1-Lite da ZDNET de explicar sua cadeia de pensamento à de o1, e os resultados foram mistos. Dito isso, o assistente de IA do DeepSeek revela sua linha de pensamento ao usuário durante as consultas, uma experiência nova para muitos usuários de chatbot, já que o ChatGPT não externaliza seu raciocínio.

Claro, todos os modelos populares vêm com planos de fundo de equipe vermelha, diretrizes da comunidade e proteções de conteúdo. No entanto, pelo menos nesta fase, é improvável que os chatbots fabricados nos EUA se abstenham de responder a perguntas sobre eventos históricos.

Quais são as preocupações com privacidade e segurança?

As preocupações com a privacidade de dados que circularam no TikTok - o aplicativo de mídia social de propriedade chinesa agora um pouco proibido nos EUA - também estão surgindo em torno do DeepSeek.

No início deste mês, o CEO da Feroot Security, Ivan Tsarynny, disse à ABC que sua empresa havia descoberto "links diretos para servidores e empresas na China que estão sob o controle do governo chinês", que ele disse que "nunca viram no passado".

Depois de descriptografar parte do código do DeepSeek, Feroot encontrou uma programação oculta que pode enviar dados do usuário - incluindo informações de identificação, consultas e atividades online - para a China Mobile, uma empresa de telecomunicações operada pelo governo chinês que foi proibida de operar nos EUA desde 2019 devido a preocupações com a segurança nacional.

O NowSecure recomendou que as organizações "proíbessem" o uso do aplicativo móvel da DeepSeek depois de encontrar várias falhas, incluindo dados não criptografados (o que significa que qualquer pessoa que monitore o tráfego pode interceptá-los) e armazenamento de dados ruim.

Na semana passada, a empresa de pesquisa Wiz descobriu que um banco de dados interno do DeepSeek estava acessível ao público "em poucos minutos" após a realização de uma verificação de segurança. O banco de dados "completamente aberto e não autenticado" continha históricos de bate-papo, chaves de API do usuário e outros dados confidenciais.

"Mais criticamente, a exposição permitiu o controle total do banco de dados e o escalonamento de privilégios potenciais no ambiente DeepSeek, sem qualquer mecanismo de autenticação ou defesa para o mundo exterior", explica o relatório da Wiz.

De acordo com a Wired, que inicialmente publicou a pesquisa, embora Wiz não tenha recebido uma resposta do DeepSeek, o banco de dados parecia ter sido retirado do ar dentro de 30 minutos após Wiz notificar a empresa. Não está claro por quanto tempo ficou acessível ou se alguma outra entidade o descobriu antes de ser retirado.

Mesmo sem esse desenvolvimento alarmante, a política de privacidade do DeepSeeklevanta algumas bandeiras vermelhas. Ele afirma: "As informações pessoais que coletamos de você podem ser armazenadas em um servidor localizado fora do país onde você mora. Armazenamos as informações que coletamos em servidores seguros localizados na República Popular da China."

A política descreve que o DeepSeek coleta muitas informações, incluindo, mas não se limitando a:

  • Endereço IP, identificadores exclusivos de dispositivo e cookies
  • Data de nascimento (quando aplicável), nome de usuário, endereço de e-mail e/ou número de telefone e senha
  • Sua entrada de texto ou áudio, prompt, arquivos carregados, feedback, histórico de bate-papo ou outro conteúdo que você fornece ao nosso modelo e serviços
  • Prova de identidade ou idade, feedback ou perguntas sobre o uso do Serviço [Se você entrar em contato com a DeepSeek]

A política continua: "Quando transferirmos qualquer informação pessoal para fora do país onde você mora, inclusive para um ou mais dos propósitos estabelecidos nesta Política, faremos isso de acordo com os requisitos das leis de proteção de dados aplicáveis". A política não menciona a conformidade com o GDPR.

"Os usuários precisam estar cientes de que quaisquer dados compartilhados com a plataforma podem estar sujeitos ao acesso do governo de acordo com as leis de segurança cibernética da China, que exigem que as empresas forneçam acesso aos dados mediante solicitação das autoridades", disse Adrianus Warmenhoven, membro do conselho consultivo de segurança da NordVPN, à ZDNET por e-mail.

De acordo com alguns observadores, o fato de o R1 ser de código aberto significa maior transparência, permitindo que os usuários inspecionem o código-fonte do modelo em busca de sinais de atividade relacionada à privacidade.

No entanto, o DeepSeek também lançou versões menores do R1, que podem ser baixadas e executadas localmente para evitar preocupações com o envio de dados de volta para a empresa (em vez de acessar o chatbot online).

Todos os chatbots, incluindo o ChatGPT, coletam algum grau de dados do usuário quando consultados por meio do navegador.

O DeepSeek AI é seguro?

Os pesquisadores de segurança de IA há muito se preocupam com o fato de que modelos poderosos de código aberto possam ser aplicados de maneiras perigosas e não regulamentadas, uma vez que estejam na natureza. Testes da empresa de segurança de IA Chatterbox descobriram que o DeepSeek R1 tem "problemas de segurança em todos os aspectos".

Em graus variados, as empresas de IA dos EUA empregam algum tipo de equipe de supervisão de segurança. A DeepSeek não divulgou se possui uma equipe de pesquisa de segurança e não respondeu ao pedido da ZDNET para comentar o assunto.

"A maioria das empresas continuará correndo para construir a IA mais forte possível, independentemente dos riscos, e verá a eficiência algorítmica aprimorada como uma forma de alcançar um desempenho mais alto e mais rápido", disse Peter Slattery, pesquisador da equipe FutureTech do MIT que liderou seu projeto Risk Repository. "Isso nos deixa ainda menos tempo para enfrentar os desafios de segurança, governança e sociedade que virão com sistemas de IA cada vez mais avançados."

"O avanço do DeepSeek na eficiência do treinamento também significa que em breve devemos esperar ver um grande número de 'wrappers' locais e especializados - aplicativos construídos sobre o mecanismo DeepSeek R1 - que apresentarão seus próprios riscos de privacidade e que podem ser mal utilizados se caírem em mãos erradas", acrescentou Ryan Fedasiuk, diretor de governança de IA dos EUA na The Future Society, uma organização sem fins lucrativos de política de IA.

O DeepSeek é mais eficiente em termos de energia?

Alguns analistas observam que o modelo de computação de menor elevação da DeepSeek é mais eficiente em termos de energia do que o dos gigantes de IA construídos nos EUA.

"O novo modelo de IA da DeepSeek provavelmente usa menos energia para treinar e correr do que os modelos de concorrentes maiores", disse Slattery. "No entanto, duvido que isso marque o início de uma tendência de longo prazo de menor consumo de energia. O poder da IA decorre de dados, algoritmos e computação - que dependem de chips cada vez melhores. Quando os desenvolvedores já encontraram maneiras de serem mais eficientes, eles normalmente reinvestiram esses ganhos na criação de modelos ainda maiores e mais poderosos, em vez de reduzir o uso geral de energia."

"A DeepSeek não é a única empresa de IA que obteve ganhos extraordinários em eficiência computacional. Nos últimos meses, a Anthropic e o Google Gemini, com sede nos EUA, apresentaram melhorias de desempenho semelhantes", disse Fedasiuk.

"As conquistas da DeepSeek são notáveis, pois parecem ter projetado avanços de forma independente que prometem tornar os grandes modelos de linguagem muito mais eficientes e menos caros, mais cedo do que muitos profissionais do setor esperavam - mas em um campo tão dinâmico quanto a IA, é difícil prever por quanto tempo a empresa será capaz de aproveitar os holofotes. "

Como o DeepSeek afetará o setor de IA?

O sucesso do R1 destaca uma mudança radical na IA que pode capacitar laboratórios e pesquisadores menores a criar modelos competitivos e diversificar as opções. Por exemplo, organizações sem financiamento ou equipe da OpenAI podem baixar o R1 e ajustá-lo para competir com modelos como o o1. Pouco antes do lançamento do R1, pesquisadores da UC Berkeley criaram um modelo de código aberto no mesmo nível do o1-preview, uma versão inicial do o1, em apenas 19 horas e por cerca de US $450.

Dado o quão exorbitante o investimento em IA se tornou, muitos especialistas especulam que esse desenvolvimento poderia estourar a bolha da IA (o mercado de ações certamente entrou em pânico). Alguns veem o sucesso do DeepSeek como desmascarar o pensamento de que o desenvolvimento de ponta significa grandes modelos e gastos. Ele também lança o Stargate, uma iniciativa de infraestrutura de US$500 bilhões liderada por vários gigantes da IA, sob uma nova luz, criando especulações sobre se a IA competitiva requer a energia e a escala dos data centers propostos pela iniciativa.

A ascensão do DeepSeek ocorre em um momento crítico para as relações tecnológicas sino-americanas, poucos dias depois que a proibição do TikTok entrou em vigor parcialmente. Ironicamente, o DeepSeek expõe em linguagem simples a forragem para as preocupações de segurança que os EUA lutaram para provar sobre o TikTok em seu esforço prolongado para decretar a proibição.

Quais países estão banindo o DeepSeek?

Várias agências dos EUA, incluindo a NASA e a Marinha, já baniram o DeepSeek na tecnologia emitida pelo governo dos funcionários, e os legisladores estão tentando banir o aplicativo de todos os dispositivos do governo, que a Austrália e Taiwan já implementaram. A Coreia do Sul proibiu novos downloads do aplicativo devido à recente falha da DeepSeek em cumprir as proteções de dados locais. A Itália está investigando a empresa por preocupações com a conformidade com o GDPR.