Uma comparação prática de cinco plataformas líderes revela qual é a melhor para hospedar seus futuros agentes de IA para cenários do dia a dia.
Imagem criada pelo Decrypt usando IA
Pode fazer qualquer coisa com agentes de IA: procurar informações na sua biblioteca de documentos, construir código, raspar a web, obter perspicácia e análise incisiva de dados complexos e muito mais. Pode até criar um escritório virtual com um grupo de agentes especializados em diferentes tarefas e fazê-los trabalhar em conjunto como se fossem a sua própria equipa de funcionários digitais especializados.
Então, quão difícil é fazer isso? Se uma pessoa comum quisesse construir seu próprio consultor financeiro de IA, por exemplo, qual plataforma seria a melhor para eles? Sem API, sem codificação estranha, sem Github - nós apenas queríamos ver o quão bem as melhores empresas de IA estão criando agentes de IA sem que o usuário possua um alto grau de habilidade técnica.
É claro que você obtém o que paga. Neste caso, também queríamos ver se havia uma correlação entre o quão fácil era para um leigo configurar um agente e a qualidade dos resultados que cada um entregava.
A nossa experiência colocou cinco pesos-pesados uns contra os outros: ChatGPT, Claude, Huggingface, Mistral AI e Gemini. Cada plataforma recebeu as mesmas instruções básicas para criar um consultor financeiro.
O teste focou exclusivamente nas capacidades prontas para uso. Se os agentes eram capazes de lidar com um cenário comum - neste caso, ajudar alguém a equilibrar $25.000 em investimentos contra $30.000 em dívidas. Também queríamos ver o quão bons eles eram em analisar um gráfico de negociação. Evitamos o uso de ferramentas adicionais que aumentariam a produtividade dos agentes e, em vez disso, tentamos adotar a abordagem mais simples.
Resumo: Aqui está o que descobrimos e como classificamos os modelos:
1) GPT da OpenAI (8.5/10)
ChatGPT é a plataforma mais equilibrada, oferecendo a criação de agentes sofisticados com opções guiadas e manuais para satisfazer as necessidades de usuários completamente inexperientes e um pouco mais experientes também.
Embora a recente atualização da interface tenha enterrado algumas funcionalidades em menus, a plataforma se destaca na tradução de requisitos complexos do usuário em agentes funcionais. Testamos o modelo construindo um consultor financeiro que demonstrou uma consciência contextual superior e capacidades estruturadas de resolução de problemas, fornecendo estratégias detalhadas, porém coerentes, para o gerenciamento de dívidas e alocação de investimentos.
2) Google Gemini (7/10)
A Gemini destaca-se pela sua interface polida e intuitiva e excelente tratamento de erros. Embora exija prompts mais detalhados para resultados ótimos, a sua interpretação literal das instruções cria resultados consistentes e previsíveis.
A abordagem consultiva do agente para o aconselhamento financeiro enfatizou a coleta de contexto antes das recomendações, espelhando as práticas profissionais. No entanto, pode ser excessivamente conservador em suas respostas de tiro zero.
3) Bate-papo (6.5/10)
A plataforma de código aberto oferece opções de personalização e seleção de modelos incomparáveis. Isso é ótimo para aqueles que procuram controle granular sobre todos os aspectos, mas não é realmente para aqueles que buscam simplicidade. (Pense nisso como comparar um sistema Linux com um macOS). Sua estrutura sofisticada de horizonte temporal e integração prática de ferramentas demonstram capacidades avançadas.
Construímos um agente puro sem qualquer funcionalidade adicional. Utilizamos o Nemomotron da Nvidia como LLM base, e foi suficientemente bom para corresponder à qualidade de saída do ChatGPT. Nada mal para o campo de código aberto.
4) Claude (5.5/10)
A plataforma da Anthropic destaca-se em nichos específicos, especialmente em tarefas que exigem processamento extenso de contexto e interpretação de código. Sua interface minimalista esconde capacidades sofisticadas, mas o campo de instruções "opcional" pode confundir os usuários.
Nosso agente permaneceu muito conservador e vago em seus conselhos, mas demonstrou uma sólida consciência de risco e pensamento estratégico. Requer uma provocação mais cuidadosa para realmente extrair seu potencial, mas seria injusto para um teste adaptar uma provocação, negando a premissa de assumir condições semelhantes.
5) Mistral AI (5/10)
A plataforma francesa oferece aprendizagem única com base em exemplos e opções de personalização avançadas. No entanto, sua interface voltada para desenvolvedores e problemas ocasionais de troca de idioma criam barreiras para usuários não técnicos. Também é necessário modificar a configuração do agente para diferentes modelos, a fim de executar tarefas diferentes, como analisar imagens ou lidar com código. Isso não é ideal.
O consultor financeiro mostrou promessa em design de interação, mas teve dificuldades com a validação matemática básica e ofereceu a pior saída. Isso não quer dizer que a saída foi ruim, mas num teste de zero-shot, esta foi a menos satisfatória.
Levando em consideração a classificação anterior, não existe uma solução única e todas as plataformas têm seus próprios prós e contras. Com dedicação e personalização cuidadosa das mensagens, os resultados de uma plataforma podem variar e superar até mesmo as demais. No final, todos os LLMs têm seus próprios estilos de mensagens.
Se você quiser saber mais sobre a lógica por trás do nosso ranking, aqui está uma visão mais aprofundada da nossa experiência e dos resultados que obtivemos com nossos agentes. Configuramos todos os nossos agentes com o mesmo prompt do sistema, sem parâmetros adicionais de funcionalidades, e fizemos a mesma pergunta básica: "Tenho US$ 25 mil para investir e estou com US$ 30 mil em dívidas. Construa-me um plano financeiro."
OpenAI
A interface do ChatGPT recentemente sofreu uma reformulação que na verdade complicou as coisas. A opção de criação do GPT agora está escondida atrás de menus, mas uma vez encontrada, oferece duas opções: uma configuração de conversação onde a IA ajuda a construir seu agente e uma configuração manual para aqueles que sabem exatamente o que querem.
A plataforma GPT da OpenAI é uma ferramenta multitarefa com várias capacidades - lê código, pesquisa na web e lida tanto com a geração quanto com a análise de imagens. O processo de configuração guiado por IA torna-o especialmente adequado para iniciantes, embora possa parecer restritivo para usuários avançados que procuram um controle mais detalhado. (Por exemplo, se você solicitar ao modelo que seja mais específico ou mais detalhado, ele pode alterar todo o prompt do sistema, fornecendo resultados piores.)
Quando se trata de realmente usar o agente, o ChatGPT é bem direto e a interface é limpa e fácil de entender.
Os agentes podem ler documentos nativamente e entender imagens, o que confere uma vantagem em relação a outras plataformas.
Agora, vamos falar sobre a qualidade dos agentes que você pode criar com a solicitação básica. Nosso consultor financeiro chamado MoneyGPTfoi bastante impressionante, dando-nos uma aula magistral em resolução estruturada de problemas.
Para além das suas alocações precisas - "$20,000 para dívidas de juros elevados" e divisões detalhadas da carteira - o agente demonstrou um raciocínio financeiro sofisticado. Foi fornecido um roteiro de cinco passos que não era apenas uma lista, mas uma estratégia coerente que levava em conta tanto as necessidades imediatas como as considerações a longo prazo.
A força do agente reside na sua capacidade de equilibrar detalhes com contexto. Ao recomendar investimentos específicos (40% S&P 500, 30% obrigações), também explicou a lógica por trás das suas respostas: "Pagar dívidas com juros altos é como obter um retorno garantido do investimento." Essa consciência contextual estende-se ao planeamento a longo prazo, sugerindo ciclos de revisão periódica e estratégias adaptativas com base em circunstâncias em mudança.
No entanto, essa abundância de informações revelou uma possível fraqueza: o risco de sobrecarregar os usuários com muitos detalhes de uma só vez. Embora tecnicamente abrangente, a entrega rápida de alocações específicas, estratégias de investimento e planos de monitoramento pode ser assustadora para iniciantes financeiros.
Pode ler o seu plano completoaqui, e pode usá-lo clicando em este link. Nós realmente recomendamos isso.
No geral, a plataforma de criação de agentes Gemini do Google vence o concurso de beleza com uma interface polida e intuitiva que torna a criação de agentes quase fácil demais. O sistema leva as instruções literalmente, o que ajuda a evitar confusão, e sua interface limpa remove o fator de intimidação do desenvolvimento de IA.
No entanto, é necessário um prompt mais detalhado para extrair um bom suco. Não dá nada como garantido: um prompt curto resultará em uma resposta de baixa qualidade.
Sob o capô, ele possui um sério poder de processamento - integração de pesquisa na web alimentada pelo Google, análise de código e capacidades de processamento de imagem que rivalizam com as ofertas do ChatGPT, mas em grande parte dependem da tecnologia da Microsoft.
A interface do usuário do Gemini parece ter sido projetada por pessoas que realmente entendem a experiência do usuário. A interface orienta os usuários com rótulos claros e tudo é exibido em apenas uma tela.
Esta abordagem polida torna-a particularmente atraente para recém-chegados, embora utilizadores experientes possam desejar um controlo mais granular.
Chamamos o nosso agenteMoneyGeme pediu um plano financeiro. Sua abordagem consultiva mostrou a metodologia distinta de resolução de problemas do Google. Em vez de dar uma resposta direta, ele começou com perguntas como "Que tipo de dívida é?" e "Quais são suas taxas de juros?" — mostrando uma compreensão de que o conselho financeiro não é universal.
A ênfase na coleta de contexto antes de fornecer recomendações está alinhada com as práticas profissionais de planejamento financeiro, embora possa frustrar os usuários que procuram respostas imediatas.
Uma resposta de zero-shot não foi útil. O agente basicamente disse que não conhecia o usuário o suficiente para fornecer bons conselhos financeiros. Depois de pedir para fazer suposições e forçá-lo a fornecer um plano que pudesse se encaixar na maioria dos cenários, o agente gerou um rascunho muito conservador de um plano sem dar sugestões específicas sobre quais investimentos considerar.
MoneyGem, no entanto, terminou sua resposta com uma recomendação para maximizar contas com vantagens fiscais como um 401(k) ou Roth IRA para reduzir sua carga tributária. Bom.
Você pode clicar aquipara ler nossa interação com MoneyGem e experimentar o modelo você mesmo clicandoeste link.
Mistral AI
A abordagem do Mistral ao processo de configuração do agente é um pouco distante da simplicidade. A ferramenta de criação de agente está escondida em seu console de desenvolvedor, com opções de personalização profundas que podem assustar os novatos, mas encantar os curiosos.
Sua interface de construção de agentes não faz parte do LeChat (a interface de chatbot), mas aparecerá lá assim que o agente for criado.
Uma coisa que realmente gostamos é a capacidade de alimentar a ferramenta com exemplos que moldam o comportamento do agente e o estilo de resposta - algo que nenhuma outra plataforma oferece atualmente. Além disso, aqui está um bug estranho: ao criar nosso agente, a interface do usuário mudou repentinamente para francês, possivelmente porque a empresa é francesa. Independentemente disso, não conseguimos voltar para o inglês ou espanhol.
Uma vez criado o agente, os utilizadores devem invocá-lo na interface normal do chatbot para poderem trabalhar com ele. Devem sair de Le Plateforme e ir para Le Chat, o que não é a coisa mais intuitiva a fazer. No entanto, a interface de utilização do agente é bastante simples e parece-se com qualquer outro chatbot de IA.
Construímos nosso agente e o nomeamos Le Moneyhonrar as raízes francesas da Mistral. O seu desempenho mostrou claramente a abordagem generalista da Mistral para a resolução de problemas. A sugestão de "reservar $10,000 para emergências, $15,000 para pagamento de dívidas e $10,000 para investimentos" parecia simples, mas mostrava que os agentes careciam de alguma validação matemática básica.
O total de $35.000 excedeu os fundos disponíveis em $10.000, o que é um erro básico que alguns modelos de linguagem exibem quando priorizam a correção conceitual em detrimento da precisão numérica.
No entanto, devemos notar que os melhores LLMs têm melhorado muito e não falham nesta tarefa - pelo menos não com tanta frequência como a Mistral.
Além disso, o plano não era realmente detalhado, mas era o único que fornecia perguntas de acompanhamento que poderiam tornar a interação mais fluida e ajudar a entender melhor as necessidades do usuário.
O plano completo da LeMoney está disponívelaquie o agente está disponível para testesaqui.
Antropico
Os projetos de Claude parecem menos uma plataforma de criação de agentes e mais um sistema sofisticado de execução de tarefas. A interface é mínima, quase demais, e não parece intuitiva.
Esta interface minimalista pode deixar alguns utilizadores confusos. A plataforma apresenta uma configuração básica com um campo de instruções “opcional” que de alguma forma parece tanto desimportante quanto crucial ao mesmo tempo: Se as instruções são rotuladas como opcionais, como é que o agente de IA saberá o que deve fazer?
Sua interface minimalista parece estranha, mas a Anthropic nunca foi conhecida por seu bom gosto em escolhas de UI. A mesma janela para configurar o modelo é a que você usa para ativá-lo. Suas capacidades se concentram principalmente na interpretação de código de texto, nada mais. Pesquisas na web e processamento e geração de imagens são coisas sofisticadas que a Anthropic deixa para seus concorrentes.
O nosso agente, chamado MoneyClaude, não está disponível para testes públicos porque a Anthropic não o permite. Teve uma postura muito conservadora ao fornecer conselhos financeiros com respostas tecnicamente precisas, mas vagas, como por exemplo "manter uma abordagem equilibrada entre a redução da dívida e poupanças essenciais".
Solicitou informações adicionais, mas pelo menos garantiu fornecer uma estratégia muito genérica na ausência delas sem exigir interação adicional, o que parece mais ótimo do que a abordagem do Google.
Clique aqui para lerplano completo.
Hugging Face
O repositório de código aberto se destaca como o paraíso do usuário avançado - e um pesadelo potencial para iniciantes. É a única plataforma que permite aos usuários escolher seu modelo de idioma preferido, oferecendo controle sem precedentes sobre a base do agente.
Além disso, os utilizadores têm dezenas de ferramentas diferentes para integrar com os seus agentes, mas só podem ativar três delas simultaneamente. Esta limitação força uma consideração cuidadosa sobre quais as funcionalidades mais importantes para cada caso de uso específico, mas é algo que nenhum outro modelo pode oferecer.
É a experiência mais personalizável de todas as interfaces, no entanto, com muitos ajustes para fazer. O resultado é uma plataforma que pode criar agentes mais poderosos e especializados do que seus concorrentes, mas apenas nas mãos de alguém que sabe exatamente o que está fazendo.
Os utilizadores podem experimentar os seus agentes na AbraçoBate-papo—hands down the power user’s dream. Once you create the agent, using it is very straightforward. The interface shows a big card with the Agent’s name, description and photo. It also lets users share the agent’s link and tweak its settings, all right from the card.
Colocando o nossoHuggingMoney'stestar o agente mostra que ele lida com um quadro de horizonte temporal, mostrando uma compreensão mais sofisticada da psicologia do planeamento financeiro. A sua divisão em "Curto Prazo (0-24 meses), Médio Prazo (24-60 meses) e Longo Prazo (mais de 60 meses)" espelha as práticas profissionais de planeamento financeiro.
O agente sugeriu alocar "$0-$5,000 em veículos líquidos de baixo risco" enquanto mantém pagamentos de dívida agressivos de "$1,000-$1,500 mensais." Isso é, à primeira vista, um sinal de compreensão sutil da gestão do fluxo de caixa.
Outra característica interessante foi a integração de ferramentas práticas com conselhos teóricos. Além de simplesmente sugerir o gate, ...50/30/20Regra, recomendou aplicativos específicos de orçamento e enfatizou a otimização fiscal - criando uma ponte entre a estratégia de alto nível e a execução do dia a dia. A principal desvantagem? Inclui suposições sobre taxas de juros da dívida sem buscar esclarecimentos.
Num esforço para fornecer conselhos úteis, muitas coisas são dadas como certas. Este impulso de responder não importa o quê pode ser corrigido com estímulo, mas é algo a considerar.
Você pode ler o plano completo da HuggingMoneyaqui. Além disso, você pode tentar clicando emeste link.
Partilhar
Uma comparação prática de cinco plataformas líderes revela qual é a melhor para hospedar seus futuros agentes de IA para cenários do dia a dia.
Imagem criada pelo Decrypt usando IA
Pode fazer qualquer coisa com agentes de IA: procurar informações na sua biblioteca de documentos, construir código, raspar a web, obter perspicácia e análise incisiva de dados complexos e muito mais. Pode até criar um escritório virtual com um grupo de agentes especializados em diferentes tarefas e fazê-los trabalhar em conjunto como se fossem a sua própria equipa de funcionários digitais especializados.
Então, quão difícil é fazer isso? Se uma pessoa comum quisesse construir seu próprio consultor financeiro de IA, por exemplo, qual plataforma seria a melhor para eles? Sem API, sem codificação estranha, sem Github - nós apenas queríamos ver o quão bem as melhores empresas de IA estão criando agentes de IA sem que o usuário possua um alto grau de habilidade técnica.
É claro que você obtém o que paga. Neste caso, também queríamos ver se havia uma correlação entre o quão fácil era para um leigo configurar um agente e a qualidade dos resultados que cada um entregava.
A nossa experiência colocou cinco pesos-pesados uns contra os outros: ChatGPT, Claude, Huggingface, Mistral AI e Gemini. Cada plataforma recebeu as mesmas instruções básicas para criar um consultor financeiro.
O teste focou exclusivamente nas capacidades prontas para uso. Se os agentes eram capazes de lidar com um cenário comum - neste caso, ajudar alguém a equilibrar $25.000 em investimentos contra $30.000 em dívidas. Também queríamos ver o quão bons eles eram em analisar um gráfico de negociação. Evitamos o uso de ferramentas adicionais que aumentariam a produtividade dos agentes e, em vez disso, tentamos adotar a abordagem mais simples.
Resumo: Aqui está o que descobrimos e como classificamos os modelos:
1) GPT da OpenAI (8.5/10)
ChatGPT é a plataforma mais equilibrada, oferecendo a criação de agentes sofisticados com opções guiadas e manuais para satisfazer as necessidades de usuários completamente inexperientes e um pouco mais experientes também.
Embora a recente atualização da interface tenha enterrado algumas funcionalidades em menus, a plataforma se destaca na tradução de requisitos complexos do usuário em agentes funcionais. Testamos o modelo construindo um consultor financeiro que demonstrou uma consciência contextual superior e capacidades estruturadas de resolução de problemas, fornecendo estratégias detalhadas, porém coerentes, para o gerenciamento de dívidas e alocação de investimentos.
2) Google Gemini (7/10)
A Gemini destaca-se pela sua interface polida e intuitiva e excelente tratamento de erros. Embora exija prompts mais detalhados para resultados ótimos, a sua interpretação literal das instruções cria resultados consistentes e previsíveis.
A abordagem consultiva do agente para o aconselhamento financeiro enfatizou a coleta de contexto antes das recomendações, espelhando as práticas profissionais. No entanto, pode ser excessivamente conservador em suas respostas de tiro zero.
3) Bate-papo (6.5/10)
A plataforma de código aberto oferece opções de personalização e seleção de modelos incomparáveis. Isso é ótimo para aqueles que procuram controle granular sobre todos os aspectos, mas não é realmente para aqueles que buscam simplicidade. (Pense nisso como comparar um sistema Linux com um macOS). Sua estrutura sofisticada de horizonte temporal e integração prática de ferramentas demonstram capacidades avançadas.
Construímos um agente puro sem qualquer funcionalidade adicional. Utilizamos o Nemomotron da Nvidia como LLM base, e foi suficientemente bom para corresponder à qualidade de saída do ChatGPT. Nada mal para o campo de código aberto.
4) Claude (5.5/10)
A plataforma da Anthropic destaca-se em nichos específicos, especialmente em tarefas que exigem processamento extenso de contexto e interpretação de código. Sua interface minimalista esconde capacidades sofisticadas, mas o campo de instruções "opcional" pode confundir os usuários.
Nosso agente permaneceu muito conservador e vago em seus conselhos, mas demonstrou uma sólida consciência de risco e pensamento estratégico. Requer uma provocação mais cuidadosa para realmente extrair seu potencial, mas seria injusto para um teste adaptar uma provocação, negando a premissa de assumir condições semelhantes.
5) Mistral AI (5/10)
A plataforma francesa oferece aprendizagem única com base em exemplos e opções de personalização avançadas. No entanto, sua interface voltada para desenvolvedores e problemas ocasionais de troca de idioma criam barreiras para usuários não técnicos. Também é necessário modificar a configuração do agente para diferentes modelos, a fim de executar tarefas diferentes, como analisar imagens ou lidar com código. Isso não é ideal.
O consultor financeiro mostrou promessa em design de interação, mas teve dificuldades com a validação matemática básica e ofereceu a pior saída. Isso não quer dizer que a saída foi ruim, mas num teste de zero-shot, esta foi a menos satisfatória.
Levando em consideração a classificação anterior, não existe uma solução única e todas as plataformas têm seus próprios prós e contras. Com dedicação e personalização cuidadosa das mensagens, os resultados de uma plataforma podem variar e superar até mesmo as demais. No final, todos os LLMs têm seus próprios estilos de mensagens.
Se você quiser saber mais sobre a lógica por trás do nosso ranking, aqui está uma visão mais aprofundada da nossa experiência e dos resultados que obtivemos com nossos agentes. Configuramos todos os nossos agentes com o mesmo prompt do sistema, sem parâmetros adicionais de funcionalidades, e fizemos a mesma pergunta básica: "Tenho US$ 25 mil para investir e estou com US$ 30 mil em dívidas. Construa-me um plano financeiro."
OpenAI
A interface do ChatGPT recentemente sofreu uma reformulação que na verdade complicou as coisas. A opção de criação do GPT agora está escondida atrás de menus, mas uma vez encontrada, oferece duas opções: uma configuração de conversação onde a IA ajuda a construir seu agente e uma configuração manual para aqueles que sabem exatamente o que querem.
A plataforma GPT da OpenAI é uma ferramenta multitarefa com várias capacidades - lê código, pesquisa na web e lida tanto com a geração quanto com a análise de imagens. O processo de configuração guiado por IA torna-o especialmente adequado para iniciantes, embora possa parecer restritivo para usuários avançados que procuram um controle mais detalhado. (Por exemplo, se você solicitar ao modelo que seja mais específico ou mais detalhado, ele pode alterar todo o prompt do sistema, fornecendo resultados piores.)
Quando se trata de realmente usar o agente, o ChatGPT é bem direto e a interface é limpa e fácil de entender.
Os agentes podem ler documentos nativamente e entender imagens, o que confere uma vantagem em relação a outras plataformas.
Agora, vamos falar sobre a qualidade dos agentes que você pode criar com a solicitação básica. Nosso consultor financeiro chamado MoneyGPTfoi bastante impressionante, dando-nos uma aula magistral em resolução estruturada de problemas.
Para além das suas alocações precisas - "$20,000 para dívidas de juros elevados" e divisões detalhadas da carteira - o agente demonstrou um raciocínio financeiro sofisticado. Foi fornecido um roteiro de cinco passos que não era apenas uma lista, mas uma estratégia coerente que levava em conta tanto as necessidades imediatas como as considerações a longo prazo.
A força do agente reside na sua capacidade de equilibrar detalhes com contexto. Ao recomendar investimentos específicos (40% S&P 500, 30% obrigações), também explicou a lógica por trás das suas respostas: "Pagar dívidas com juros altos é como obter um retorno garantido do investimento." Essa consciência contextual estende-se ao planeamento a longo prazo, sugerindo ciclos de revisão periódica e estratégias adaptativas com base em circunstâncias em mudança.
No entanto, essa abundância de informações revelou uma possível fraqueza: o risco de sobrecarregar os usuários com muitos detalhes de uma só vez. Embora tecnicamente abrangente, a entrega rápida de alocações específicas, estratégias de investimento e planos de monitoramento pode ser assustadora para iniciantes financeiros.
Pode ler o seu plano completoaqui, e pode usá-lo clicando em este link. Nós realmente recomendamos isso.
No geral, a plataforma de criação de agentes Gemini do Google vence o concurso de beleza com uma interface polida e intuitiva que torna a criação de agentes quase fácil demais. O sistema leva as instruções literalmente, o que ajuda a evitar confusão, e sua interface limpa remove o fator de intimidação do desenvolvimento de IA.
No entanto, é necessário um prompt mais detalhado para extrair um bom suco. Não dá nada como garantido: um prompt curto resultará em uma resposta de baixa qualidade.
Sob o capô, ele possui um sério poder de processamento - integração de pesquisa na web alimentada pelo Google, análise de código e capacidades de processamento de imagem que rivalizam com as ofertas do ChatGPT, mas em grande parte dependem da tecnologia da Microsoft.
A interface do usuário do Gemini parece ter sido projetada por pessoas que realmente entendem a experiência do usuário. A interface orienta os usuários com rótulos claros e tudo é exibido em apenas uma tela.
Esta abordagem polida torna-a particularmente atraente para recém-chegados, embora utilizadores experientes possam desejar um controlo mais granular.
Chamamos o nosso agenteMoneyGeme pediu um plano financeiro. Sua abordagem consultiva mostrou a metodologia distinta de resolução de problemas do Google. Em vez de dar uma resposta direta, ele começou com perguntas como "Que tipo de dívida é?" e "Quais são suas taxas de juros?" — mostrando uma compreensão de que o conselho financeiro não é universal.
A ênfase na coleta de contexto antes de fornecer recomendações está alinhada com as práticas profissionais de planejamento financeiro, embora possa frustrar os usuários que procuram respostas imediatas.
Uma resposta de zero-shot não foi útil. O agente basicamente disse que não conhecia o usuário o suficiente para fornecer bons conselhos financeiros. Depois de pedir para fazer suposições e forçá-lo a fornecer um plano que pudesse se encaixar na maioria dos cenários, o agente gerou um rascunho muito conservador de um plano sem dar sugestões específicas sobre quais investimentos considerar.
MoneyGem, no entanto, terminou sua resposta com uma recomendação para maximizar contas com vantagens fiscais como um 401(k) ou Roth IRA para reduzir sua carga tributária. Bom.
Você pode clicar aquipara ler nossa interação com MoneyGem e experimentar o modelo você mesmo clicandoeste link.
Mistral AI
A abordagem do Mistral ao processo de configuração do agente é um pouco distante da simplicidade. A ferramenta de criação de agente está escondida em seu console de desenvolvedor, com opções de personalização profundas que podem assustar os novatos, mas encantar os curiosos.
Sua interface de construção de agentes não faz parte do LeChat (a interface de chatbot), mas aparecerá lá assim que o agente for criado.
Uma coisa que realmente gostamos é a capacidade de alimentar a ferramenta com exemplos que moldam o comportamento do agente e o estilo de resposta - algo que nenhuma outra plataforma oferece atualmente. Além disso, aqui está um bug estranho: ao criar nosso agente, a interface do usuário mudou repentinamente para francês, possivelmente porque a empresa é francesa. Independentemente disso, não conseguimos voltar para o inglês ou espanhol.
Uma vez criado o agente, os utilizadores devem invocá-lo na interface normal do chatbot para poderem trabalhar com ele. Devem sair de Le Plateforme e ir para Le Chat, o que não é a coisa mais intuitiva a fazer. No entanto, a interface de utilização do agente é bastante simples e parece-se com qualquer outro chatbot de IA.
Construímos nosso agente e o nomeamos Le Moneyhonrar as raízes francesas da Mistral. O seu desempenho mostrou claramente a abordagem generalista da Mistral para a resolução de problemas. A sugestão de "reservar $10,000 para emergências, $15,000 para pagamento de dívidas e $10,000 para investimentos" parecia simples, mas mostrava que os agentes careciam de alguma validação matemática básica.
O total de $35.000 excedeu os fundos disponíveis em $10.000, o que é um erro básico que alguns modelos de linguagem exibem quando priorizam a correção conceitual em detrimento da precisão numérica.
No entanto, devemos notar que os melhores LLMs têm melhorado muito e não falham nesta tarefa - pelo menos não com tanta frequência como a Mistral.
Além disso, o plano não era realmente detalhado, mas era o único que fornecia perguntas de acompanhamento que poderiam tornar a interação mais fluida e ajudar a entender melhor as necessidades do usuário.
O plano completo da LeMoney está disponívelaquie o agente está disponível para testesaqui.
Antropico
Os projetos de Claude parecem menos uma plataforma de criação de agentes e mais um sistema sofisticado de execução de tarefas. A interface é mínima, quase demais, e não parece intuitiva.
Esta interface minimalista pode deixar alguns utilizadores confusos. A plataforma apresenta uma configuração básica com um campo de instruções “opcional” que de alguma forma parece tanto desimportante quanto crucial ao mesmo tempo: Se as instruções são rotuladas como opcionais, como é que o agente de IA saberá o que deve fazer?
Sua interface minimalista parece estranha, mas a Anthropic nunca foi conhecida por seu bom gosto em escolhas de UI. A mesma janela para configurar o modelo é a que você usa para ativá-lo. Suas capacidades se concentram principalmente na interpretação de código de texto, nada mais. Pesquisas na web e processamento e geração de imagens são coisas sofisticadas que a Anthropic deixa para seus concorrentes.
O nosso agente, chamado MoneyClaude, não está disponível para testes públicos porque a Anthropic não o permite. Teve uma postura muito conservadora ao fornecer conselhos financeiros com respostas tecnicamente precisas, mas vagas, como por exemplo "manter uma abordagem equilibrada entre a redução da dívida e poupanças essenciais".
Solicitou informações adicionais, mas pelo menos garantiu fornecer uma estratégia muito genérica na ausência delas sem exigir interação adicional, o que parece mais ótimo do que a abordagem do Google.
Clique aqui para lerplano completo.
Hugging Face
O repositório de código aberto se destaca como o paraíso do usuário avançado - e um pesadelo potencial para iniciantes. É a única plataforma que permite aos usuários escolher seu modelo de idioma preferido, oferecendo controle sem precedentes sobre a base do agente.
Além disso, os utilizadores têm dezenas de ferramentas diferentes para integrar com os seus agentes, mas só podem ativar três delas simultaneamente. Esta limitação força uma consideração cuidadosa sobre quais as funcionalidades mais importantes para cada caso de uso específico, mas é algo que nenhum outro modelo pode oferecer.
É a experiência mais personalizável de todas as interfaces, no entanto, com muitos ajustes para fazer. O resultado é uma plataforma que pode criar agentes mais poderosos e especializados do que seus concorrentes, mas apenas nas mãos de alguém que sabe exatamente o que está fazendo.
Os utilizadores podem experimentar os seus agentes na AbraçoBate-papo—hands down the power user’s dream. Once you create the agent, using it is very straightforward. The interface shows a big card with the Agent’s name, description and photo. It also lets users share the agent’s link and tweak its settings, all right from the card.
Colocando o nossoHuggingMoney'stestar o agente mostra que ele lida com um quadro de horizonte temporal, mostrando uma compreensão mais sofisticada da psicologia do planeamento financeiro. A sua divisão em "Curto Prazo (0-24 meses), Médio Prazo (24-60 meses) e Longo Prazo (mais de 60 meses)" espelha as práticas profissionais de planeamento financeiro.
O agente sugeriu alocar "$0-$5,000 em veículos líquidos de baixo risco" enquanto mantém pagamentos de dívida agressivos de "$1,000-$1,500 mensais." Isso é, à primeira vista, um sinal de compreensão sutil da gestão do fluxo de caixa.
Outra característica interessante foi a integração de ferramentas práticas com conselhos teóricos. Além de simplesmente sugerir o gate, ...50/30/20Regra, recomendou aplicativos específicos de orçamento e enfatizou a otimização fiscal - criando uma ponte entre a estratégia de alto nível e a execução do dia a dia. A principal desvantagem? Inclui suposições sobre taxas de juros da dívida sem buscar esclarecimentos.
Num esforço para fornecer conselhos úteis, muitas coisas são dadas como certas. Este impulso de responder não importa o quê pode ser corrigido com estímulo, mas é algo a considerar.
Você pode ler o plano completo da HuggingMoneyaqui. Além disso, você pode tentar clicando emeste link.