15:07
youtube.com ha 3 dias SRT AI Videos

Grok 4.20 is still deeply flawed

Por David Shapiro

IA agent Tecnologia LLM

Conteudo

TLDR;

O Grok 4.20 representa um grande avanço em velocidade e inteligência em relação às versões anteriores, graças ao processamento paralelo de quatro agentes com personalidades diferentes que pesquisam, discutem e colaboram para gerar respostas melhores.. O sistema de múltiplos agentes no Grok 4.20 funciona com quatro personalidades especializadas em tarefas como pesquisa, argumentação e pensamento crítico, que operam em paralelo como uma câmara de especialistas para explorar soluções de forma mais eficiente.. Apesar das melhorias, o Grok 4.20 ainda é profundamente falho por apresentar vieses como "Elon epistemics" contra o wokeism, cherry-picking de fontes confiáveis e tendência a assumir que o usuário está errado e refutá-lo, como no debate sobre comida orgânica.

Resumo

O vídeo discute o lançamento do Grok 4.20 (brincando com "Grok 420"), uma versão significativamente aprimorada de IA da xAI, que representa um grande avanço em relação às anteriores. O apresentador destaca sua velocidade e inteligência, atribuídas ao uso de quatro agentes paralelos com personalidades distintas — como pesquisa, argumentação e pensamento crítico —, que colaboram, debatem e geram respostas mais robustas via processamento paralelo, similar a núcleos de CPU ou GPUs. Essa divisão de tarefas espelha a especialização humana (ex.: processadores de sinistros em seguradoras) e tendências em agentes de codificação (codificação, segurança, revisões). O orador testa o modelo com problemas pessoais, como questões de saúde crônica e economia pós-trabalho, e compara à sua rotina de consultar múltiplas IAs (Grok, Gemini, Claude, ChatGPT) manualmente para agregar perspectivas diversas, inspirado em buscas Monte Carlo. Grok automatiza isso como uma "câmara de especialistas", mas ainda carrega vieses "elonistas" (anti-woke), cherry-picking de fontes e tendência a refutar claims do usuário, como no debate sobre comida orgânica vs. convencional, onde falha em epistemicidade apesar de priorizar fontes confiáveis como Mayo Clinic. Apesar de falhas, é um passo rumo a agentes ubíquos, com China avançando rápido via integrações como OpenClaw no navegador. (198 palavras)