Практическое сравнение пяти ведущих платформ показывает, какая из них лучше всего подходит для размещения ваших будущих искусственных интеллектуальных агентов для повседневных сценариев.
Изображение, созданное Decrypt с использованием искусственного интеллекта
С помощью AI-агентов вы можете делать все: искать информацию в вашей библиотеке документов, создавать код, скрейпить веб, получать понимание и глубокий анализ сложных данных и многое другое. Вы даже можете создать виртуальный офис с группой агентов, специализирующихся на разных задачах, и заставить их работать вместе, как ваш собственный персонал специализированных цифровых сотрудников.
Насколько это сложно сделать? Если обычному человеку хочется создать своего собственного финансового советника на базе искусственного интеллекта, какая платформа будет для него наиболее подходящей? Без API, без непонятного кодирования, без GitHub — мы просто хотели посмотреть, насколько хороши ведущие компании в области искусственного интеллекта в создании AI-агентов без необходимости обладать высоким уровнем технического мастерства у пользователя.
Конечно, вы получаете то, за что платите. В данном случае мы также хотели узнать, есть ли корреляция между тем, насколько легко было настроить агента для простого человека, и качеством достигаемых результатов.
Наш эксперимент столкнул пять гигантов друг с другом: ChatGPT, Claude, Huggingface, Mistral AI и Gemini. Каждой платформе были даны одинаковые основные инструкции для создания финансового советника.
Тест сосредоточен исключительно на возможностях из коробки. Были ли агенты способны справиться с обычным сценарием - в данном случае помочь кому-то уравновесить 25 000 долларов инвестиций и 30 000 долларов долга. Мы также хотели узнать, насколько хорошо они могут анализировать торговую диаграмму. Мы избегали использования дополнительных инструментов, которые могли бы увеличить производительность агентов, и вместо этого попытались выбрать самый простой подход.
Кратко: Вот что мы выяснили и как мы оценили модели:
1) OpenAI’s GPT (8.5/10)
ChatGPT - самая сбалансированная платформа, предлагающая создание сложных агентов как с помощью руководства, так и вручную, чтобы удовлетворить потребности как абсолютных новичков, так и немного более опытных пользователей.
В то время как недавнее обновление интерфейса зарыло некоторые функции в меню, платформа отличается способностью переводить сложные требования пользователей в функциональные агенты. Мы протестировали модель, создав финансового советника, проявившего превосходное контекстное понимание и структурированные способности решения проблем, предоставляя детальные, но согласованные стратегии управления долгами и распределения инвестиций.
2) Google Gemini (7/10)
Gemini stands out with its polished, intuitive interface and excellent error handling. While requiring more detailed prompts for optimal results, its literal interpretation of instructions creates consistent, predictable outcomes.
Консультативный подход агента к финансовым консультациям подчеркивает сбор контекста перед рекомендациями, отражая профессиональные практики. Однако он может быть чрезмерно консервативным в своих нулевых ответах.
3) HuggingChat (6.5/10)
Эта платформа с открытым исходным кодом предлагает беспрецедентные возможности настройки и выбора модели. Это отлично подходит для тех, кто ищет детальный контроль над каждым аспектом, но не очень подходит для тех, кто ищет простоту. (Подумайте об этом как сравнение системы Linux с системой macOS). Ее сложная временная структура и практическая интеграция инструментов демонстрируют продвинутые возможности.
Мы создали чистого агента без каких-либо дополнительных функций. Мы использовали Nemomotron от Nvidia в качестве базового LLM, и он был достаточно хорош, чтобы сравняться с ChatGPT по качеству вывода. Неплохо для лагеря с открытым исходным кодом.
4) Клод (5.5/10)
Платформа Anthropic превосходит в определенных нишах, особенно в задачах, требующих обширной обработки контекста и интерпретации кода. Ее минималистичный интерфейс скрывает сложные возможности, но поле «дополнительные» инструкции может сбить с толку пользователей.
Наш агент оставался очень консервативным и неопределенным в своих советах, но продемонстрировал прочное осознание рисков и стратегическое мышление. Ему требуется более тщательное побуждение, чтобы действительно раскрыть свой потенциал, но было бы несправедливо для теста адаптировать подсказку, отрицая предпосылку о предположении подобных условий.
5) Mistral AI (5/10)
Французская платформа предлагает уникальное обучение на основе примеров и широкие возможности настройки. Тем не менее, его интерфейс, ориентированный на разработчиков, и периодические проблемы с переключением языка создают барьеры для нетехнических пользователей. Это также требует изменения конфигурации агента для различных моделей, чтобы выполнять разрозненные задачи, такие как анализ изображений или работа с кодом. Это не идеальный вариант.
Финансовый консультант показал себя с хорошей стороны в области дизайна взаимодействия, но испытывал трудности с базовой математической проверкой и предлагал наихудший результат. Это не значит, что результат был плохим, но в тесте без обучения это было наименее удовлетворительным.
Учитывая предыдущий рейтинг, нет универсального решения, и у всех платформ есть свои достоинства и недостатки. С некоторым усердием и тщательной настройкой подсказок результаты с одной платформы могут отличаться и превзойти даже другие. В конечном итоге, все LLM имеют свои собственные стили подсказок.
Если вы хотите узнать больше о обосновании нашего рейтинга, вот более подробный взгляд на наш опыт и результаты, которые мы получили с нашими агентами. Мы настроили всех наших агентов с тем же системным приглашением, без дополнительных параметров или функциональности, и задали им тот же базовый вопрос: "У меня есть $25K для инвестирования, и я должен $30K. Постройте для меня финансовый план."
OpenAI
Интерфейс ChatGPT недавно претерпел изменения, которые на самом деле усложнили все. Опция создания GPT теперь скрыта за меню, но как только вы ее найдете, она предлагает два пути: разговорная настройка, где искусственный интеллект помогает создать вашего агента, и ручная настройка для тех, кто точно знает, чего хочет.
Платформа GPT компании OpenAI - это швейцарский нож возможностей - она читает код, ищет информацию в Интернете и обрабатывает как генерацию, так и анализ изображений. Процесс настройки с помощью искусственного интеллекта особенно подходит для новичков, хотя может ограничивать возможности опытных пользователей, желающих получить более детальный контроль. (Например, если вы просите модель быть более конкретной или детализированной, она может изменить всю систему подсказки, что может привести к более плохим результатам.)
Когда речь идет о фактическом использовании агента, ChatGPT очень прост и интерфейс понятен и удобен.
Агенты могут нативно читать документы и понимать изображения, что дает преимущество перед другими платформами.
Теперь давайте поговорим о качестве агентов, которых вы можете создать с помощью базового подсказывания. Наш финансовый советник называется MoneyGPTбыло довольно впечатляющим, давая нам урок по структурированному решению проблем.
Помимо точного распределения - «$ 20 000 на высоко процентные долги» и подробного разделения портфеля - агент продемонстрировал сложное финансовое мышление. Он предоставил пятишаговую дорожную карту, которая не была просто списком, но когерентной стратегией, которая учитывала как немедленные потребности, так и долгосрочные соображения.
Сила агента заключается в его способности сбалансировать детали и контекст. Рекомендуя конкретные инвестиции (40% S&P 500, 30% облигации), он также объясняет обоснование своих ответов: «Погашение долгов с высоким процентом - это как гарантированный доход от инвестиций». Это осведомленность о контексте распространяется на долгосрочное планирование, предлагая периодические циклы обзора и адаптивные стратегии на основе изменяющихся обстоятельств.
Однако это изобилие информации раскрыло потенциальную уязвимость: риск перегрузки пользователей слишком многой информацией сразу. Хотя технически всеобъемлющий, быстрая доставка конкретных распределений, инвестиционных стратегий и планов мониторинга может оказаться устрашающей для финансовых новичков.
Вы можете прочитать его полный планздесь, и вы можете использовать его, нажав на эта ссылка. Мы действительно рекомендуем это.
В целом, платформа создания агентов Gemini от Google выигрывает конкурс красоты благодаря отполированному, интуитивно понятному интерфейсу, который заставляет создание агента казаться почти слишком простым. Система буквально выполняет инструкции, что помогает избежать путаницы, а ее чистый интерфейс устраняет фактор запугивания при разработке искусственного интеллекта.
Однако для получения хорошего сока из него требуется более подробная подсказка. Он ничего не берет на веру: короткая подсказка даст вам низкокачественный ответ.
Под капотом у него серьезные мощности — интеграция поиска веб-сайтов, анализ кода и возможности обработки изображений, соперничающие с предложениями ChatGPT, но в основном полагающиеся на технологии Microsoft.
Интерфейс Gemini выглядит так, будто его разработали люди, которые действительно понимают пользовательский опыт. Интерфейс направляет пользователей с помощью четких меток, и все отображается на одном экране.
Этот доработанный подход особенно привлекателен для новичков, хотя опытные пользователи могут захотеть более детального контроля.
Мы назвали нашего агентаMoneyGem и попросил финансовый план. Его консультативный подход продемонстрировал отличную методологию решения проблем Google. Вместо того, чтобы давать прямой ответ, он начал с вопросов вроде "Какой это вид долга?" и "Какие у вас процентные ставки?"—показывая понимание того, что финансовый совет не подходит всем без исключения.
Его акцент на сборе контекста перед предоставлением рекомендаций соответствует профессиональным практикам финансового планирования, хотя это может вызвать раздражение у пользователей, ищущих немедленные ответы.
Нулевой ответ был бесполезен. Агент в основном сказал, что не знает пользователя достаточно, чтобы дать хороший финансовый совет. После того, как я попросил его делать предположения и заставил его предоставить план, который мог бы подходить большинству сценариев, агент разработал очень консервативный черновик плана, не предлагая конкретные предложения о том, какие инвестиции следует рассмотреть.
Однако MoneyGem закончила свой ответ рекомендацией максимизировать налоговые преимущества счетов, таких как 401(k) или Roth IRA, чтобы снизить налоговую нагрузку. Хорошо.
Вы можете нажать здесь , чтобы ознакомиться с нашим взаимодействием с MoneyGem, и опробовать модель самостоятельно, нажав эта ссылка.
Mistral AI
Подход Mistral к процессу настройки агента далек от простоты. Инструмент создания агента скрыт в его консоли разработчика, с глубокими опциями настройки, которые могут пугать новичков, но радовать тех, кто любит поковыряться.
Его интерфейс создания агента не является частью LeChat (интерфейс чат-бота), но появится там после создания агента.
Одна вещь, которая нам действительно нравится, это возможность питать инструмент примерами, которые формируют поведение и стиль ответа агента — что-то, что в данный момент не предлагает ни одна другая платформа. Кроме того, вот странная ошибка: при создании нашего агента пользовательский интерфейс внезапно переключился на французский, возможно, потому что компания французская. В любом случае, мы не смогли вернуться обратно на английский или испанский.
Как только агент создан, пользователи должны вызвать его в обычном интерфейсе чатбота, чтобы начать работу с ним. Они должны выйти из Le Plateforme и перейти в Le Chat, что не является самым интуитивно понятным действием. Тем не менее, интерфейс использования агента довольно простой и похож на любой другой интеллектуальный чатбот.
Мы создали нашего агента и назвали егоДеньгичтобы почитать французские корни Мистраля. Его производительность явно показала общий подход Мистраля к решению проблем. Его предложение «отложить $10 000 на случай чрезвычайных ситуаций, $15 000 на погашение долгов и $10 000 на инвестиции» казалось простым, но показало, что агенты не обладают некоторой базовой математической проверкой.
Общая сумма в $35,000 превысила доступные средства на $10,000, что является базовой ошибкой, которую демонстрируют некоторые языковые модели, когда они отдают предпочтение концептуальной правильности перед числовой точностью.
Однако мы должны отметить, что самые эффективные LLM значительно улучшились и не проваливаются в этой задаче - по крайней мере, не так часто, как у Mistral.
Кроме того, его план был не очень подробным, но только он предоставлял вопросы для последующего обсуждения, которые могли бы сделать взаимодействие более гибким и помочь ему лучше понять потребности пользователя.
Полный план LeMoney доступенздесьи агент доступен для тестированияздесь.
Антропный
Проекты Клода больше похожи на совершенную систему выполнения задач, а не на платформу для создания агентов. Интерфейс минималистичен, почти слишком минималистичен, и не кажется интуитивным.
Этот минималистский интерфейс может оставить некоторых пользователей в недоумении. Платформа представляет собой базовую настройку с "дополнительным" полем инструкций, которое кажется важным и несущественным одновременно: если инструкции помечены как необязательные, то как агент ИИ узнает, что ему нужно делать?
Его минималистический интерфейс кажется странным, но Anthropic никогда не славился своим вкусом в выборе пользовательского интерфейса. Окно для настройки модели и для ее вызова - это одно и то же окно. Его возможности в основном сосредоточены на интерпретации текстового кода, ничего больше. Поиск в Интернете и обработка и генерация изображений - это фантастические вещи, которые Anthropic оставляет своим конкурентам.
Наш агент по имени MoneyClaude недоступен для публичного тестирования, потому что Anthropic не разрешает это. Он занял очень консервативную позицию, предоставляя финансовые советы с технически точными, но размытыми ответами, например, "поддерживать сбалансированный подход между сокращением долга и существенными сбережениями".
Он запросил дополнительную информацию, но по крайней мере убедился в предоставлении очень общей стратегии в отсутствие необходимости в дальнейшем взаимодействии, что кажется более оптимальным, чем подход Google.
Нажмите здесь, чтобы прочитать его полный план.
Объятие лица
Открытый репозиторий остается уникальным местом для опытных пользователей и потенциальным кошмаром для новичков. Это единственная платформа, которая позволяет пользователям выбирать предпочитаемую модель языка и предлагает беспрецедентный контроль над основой агента.
Также у пользователей есть десятки различных инструментов для интеграции с их агентами, но они могут активировать только три из них одновременно. Это ограничение заставляет тщательно обдумать, какие функции имеют наибольшее значение для каждого конкретного случая использования, но ни одна другая модель не может предложить этого.
Это самый настраиваемый опыт из всех интерфейсов, однако, с большим количеством регуляторов для тонкой настройки. Результатом является платформа, которая может создавать более мощные, специализированные агенты по сравнению с конкурентами, но только в руках того, кто точно знает, что делает.
Пользователи могут испытать своих агентов на HuggingChat—безусловно, мечта опытного пользователя. Как только вы создадите агента, его использование станет очень простым. Интерфейс показывает большую карточку с именем, описанием и фотографией агента. Также позволяет пользователям делиться ссылкой на агента и настраивать его параметры, прямо из карточки.
Размещение нашего HuggingMoney'sТестирование агента показывает, что он работает с рамкой временного горизонта, что свидетельствует о более сложном понимании психологии финансового планирования. Его разбивка на «Краткосрочный (0-24 месяца), Среднесрочный (24-60 месяцев) и Долгосрочный (более 60 месяцев)» отражает профессиональные практики финансового планирования.
Агент предложил выделить «$0-$5,000 на жидкие, низкорисковые инструменты», при этом сохраняя агрессивные платежи по долгу в размере «$1,000-$1,500 ежемесячно». С первого взгляда это является признаком тонкого понимания управления денежным потоком.
Еще одной интересной особенностью было интеграция практических инструментов с теоретическими советами. За пределами простого предложения50/30/20правило, которое рекомендовало конкретные приложения для составления бюджета и подчеркивало оптимизацию налогов—создавая мост между стратегией высокого уровня и повседневным исполнением. Основной недостаток? Оно делает предположения о процентных ставках по долгам без уточнения.
В своей попытке дать полезные советы слишком многое принимается на веру. Это стремление дать ответ в любом случае можно исправить с помощью подсказки, но это стоит обдумать.
Вы можете ознакомиться с полным планом HuggingMoneyздесь. Также вы можете попробовать это, нажав на эта ссылка.
Пригласить больше голосов
Contenido
Практическое сравнение пяти ведущих платформ показывает, какая из них лучше всего подходит для размещения ваших будущих искусственных интеллектуальных агентов для повседневных сценариев.
Изображение, созданное Decrypt с использованием искусственного интеллекта
С помощью AI-агентов вы можете делать все: искать информацию в вашей библиотеке документов, создавать код, скрейпить веб, получать понимание и глубокий анализ сложных данных и многое другое. Вы даже можете создать виртуальный офис с группой агентов, специализирующихся на разных задачах, и заставить их работать вместе, как ваш собственный персонал специализированных цифровых сотрудников.
Насколько это сложно сделать? Если обычному человеку хочется создать своего собственного финансового советника на базе искусственного интеллекта, какая платформа будет для него наиболее подходящей? Без API, без непонятного кодирования, без GitHub — мы просто хотели посмотреть, насколько хороши ведущие компании в области искусственного интеллекта в создании AI-агентов без необходимости обладать высоким уровнем технического мастерства у пользователя.
Конечно, вы получаете то, за что платите. В данном случае мы также хотели узнать, есть ли корреляция между тем, насколько легко было настроить агента для простого человека, и качеством достигаемых результатов.
Наш эксперимент столкнул пять гигантов друг с другом: ChatGPT, Claude, Huggingface, Mistral AI и Gemini. Каждой платформе были даны одинаковые основные инструкции для создания финансового советника.
Тест сосредоточен исключительно на возможностях из коробки. Были ли агенты способны справиться с обычным сценарием - в данном случае помочь кому-то уравновесить 25 000 долларов инвестиций и 30 000 долларов долга. Мы также хотели узнать, насколько хорошо они могут анализировать торговую диаграмму. Мы избегали использования дополнительных инструментов, которые могли бы увеличить производительность агентов, и вместо этого попытались выбрать самый простой подход.
Кратко: Вот что мы выяснили и как мы оценили модели:
1) OpenAI’s GPT (8.5/10)
ChatGPT - самая сбалансированная платформа, предлагающая создание сложных агентов как с помощью руководства, так и вручную, чтобы удовлетворить потребности как абсолютных новичков, так и немного более опытных пользователей.
В то время как недавнее обновление интерфейса зарыло некоторые функции в меню, платформа отличается способностью переводить сложные требования пользователей в функциональные агенты. Мы протестировали модель, создав финансового советника, проявившего превосходное контекстное понимание и структурированные способности решения проблем, предоставляя детальные, но согласованные стратегии управления долгами и распределения инвестиций.
2) Google Gemini (7/10)
Gemini stands out with its polished, intuitive interface and excellent error handling. While requiring more detailed prompts for optimal results, its literal interpretation of instructions creates consistent, predictable outcomes.
Консультативный подход агента к финансовым консультациям подчеркивает сбор контекста перед рекомендациями, отражая профессиональные практики. Однако он может быть чрезмерно консервативным в своих нулевых ответах.
3) HuggingChat (6.5/10)
Эта платформа с открытым исходным кодом предлагает беспрецедентные возможности настройки и выбора модели. Это отлично подходит для тех, кто ищет детальный контроль над каждым аспектом, но не очень подходит для тех, кто ищет простоту. (Подумайте об этом как сравнение системы Linux с системой macOS). Ее сложная временная структура и практическая интеграция инструментов демонстрируют продвинутые возможности.
Мы создали чистого агента без каких-либо дополнительных функций. Мы использовали Nemomotron от Nvidia в качестве базового LLM, и он был достаточно хорош, чтобы сравняться с ChatGPT по качеству вывода. Неплохо для лагеря с открытым исходным кодом.
4) Клод (5.5/10)
Платформа Anthropic превосходит в определенных нишах, особенно в задачах, требующих обширной обработки контекста и интерпретации кода. Ее минималистичный интерфейс скрывает сложные возможности, но поле «дополнительные» инструкции может сбить с толку пользователей.
Наш агент оставался очень консервативным и неопределенным в своих советах, но продемонстрировал прочное осознание рисков и стратегическое мышление. Ему требуется более тщательное побуждение, чтобы действительно раскрыть свой потенциал, но было бы несправедливо для теста адаптировать подсказку, отрицая предпосылку о предположении подобных условий.
5) Mistral AI (5/10)
Французская платформа предлагает уникальное обучение на основе примеров и широкие возможности настройки. Тем не менее, его интерфейс, ориентированный на разработчиков, и периодические проблемы с переключением языка создают барьеры для нетехнических пользователей. Это также требует изменения конфигурации агента для различных моделей, чтобы выполнять разрозненные задачи, такие как анализ изображений или работа с кодом. Это не идеальный вариант.
Финансовый консультант показал себя с хорошей стороны в области дизайна взаимодействия, но испытывал трудности с базовой математической проверкой и предлагал наихудший результат. Это не значит, что результат был плохим, но в тесте без обучения это было наименее удовлетворительным.
Учитывая предыдущий рейтинг, нет универсального решения, и у всех платформ есть свои достоинства и недостатки. С некоторым усердием и тщательной настройкой подсказок результаты с одной платформы могут отличаться и превзойти даже другие. В конечном итоге, все LLM имеют свои собственные стили подсказок.
Если вы хотите узнать больше о обосновании нашего рейтинга, вот более подробный взгляд на наш опыт и результаты, которые мы получили с нашими агентами. Мы настроили всех наших агентов с тем же системным приглашением, без дополнительных параметров или функциональности, и задали им тот же базовый вопрос: "У меня есть $25K для инвестирования, и я должен $30K. Постройте для меня финансовый план."
OpenAI
Интерфейс ChatGPT недавно претерпел изменения, которые на самом деле усложнили все. Опция создания GPT теперь скрыта за меню, но как только вы ее найдете, она предлагает два пути: разговорная настройка, где искусственный интеллект помогает создать вашего агента, и ручная настройка для тех, кто точно знает, чего хочет.
Платформа GPT компании OpenAI - это швейцарский нож возможностей - она читает код, ищет информацию в Интернете и обрабатывает как генерацию, так и анализ изображений. Процесс настройки с помощью искусственного интеллекта особенно подходит для новичков, хотя может ограничивать возможности опытных пользователей, желающих получить более детальный контроль. (Например, если вы просите модель быть более конкретной или детализированной, она может изменить всю систему подсказки, что может привести к более плохим результатам.)
Когда речь идет о фактическом использовании агента, ChatGPT очень прост и интерфейс понятен и удобен.
Агенты могут нативно читать документы и понимать изображения, что дает преимущество перед другими платформами.
Теперь давайте поговорим о качестве агентов, которых вы можете создать с помощью базового подсказывания. Наш финансовый советник называется MoneyGPTбыло довольно впечатляющим, давая нам урок по структурированному решению проблем.
Помимо точного распределения - «$ 20 000 на высоко процентные долги» и подробного разделения портфеля - агент продемонстрировал сложное финансовое мышление. Он предоставил пятишаговую дорожную карту, которая не была просто списком, но когерентной стратегией, которая учитывала как немедленные потребности, так и долгосрочные соображения.
Сила агента заключается в его способности сбалансировать детали и контекст. Рекомендуя конкретные инвестиции (40% S&P 500, 30% облигации), он также объясняет обоснование своих ответов: «Погашение долгов с высоким процентом - это как гарантированный доход от инвестиций». Это осведомленность о контексте распространяется на долгосрочное планирование, предлагая периодические циклы обзора и адаптивные стратегии на основе изменяющихся обстоятельств.
Однако это изобилие информации раскрыло потенциальную уязвимость: риск перегрузки пользователей слишком многой информацией сразу. Хотя технически всеобъемлющий, быстрая доставка конкретных распределений, инвестиционных стратегий и планов мониторинга может оказаться устрашающей для финансовых новичков.
Вы можете прочитать его полный планздесь, и вы можете использовать его, нажав на эта ссылка. Мы действительно рекомендуем это.
В целом, платформа создания агентов Gemini от Google выигрывает конкурс красоты благодаря отполированному, интуитивно понятному интерфейсу, который заставляет создание агента казаться почти слишком простым. Система буквально выполняет инструкции, что помогает избежать путаницы, а ее чистый интерфейс устраняет фактор запугивания при разработке искусственного интеллекта.
Однако для получения хорошего сока из него требуется более подробная подсказка. Он ничего не берет на веру: короткая подсказка даст вам низкокачественный ответ.
Под капотом у него серьезные мощности — интеграция поиска веб-сайтов, анализ кода и возможности обработки изображений, соперничающие с предложениями ChatGPT, но в основном полагающиеся на технологии Microsoft.
Интерфейс Gemini выглядит так, будто его разработали люди, которые действительно понимают пользовательский опыт. Интерфейс направляет пользователей с помощью четких меток, и все отображается на одном экране.
Этот доработанный подход особенно привлекателен для новичков, хотя опытные пользователи могут захотеть более детального контроля.
Мы назвали нашего агентаMoneyGem и попросил финансовый план. Его консультативный подход продемонстрировал отличную методологию решения проблем Google. Вместо того, чтобы давать прямой ответ, он начал с вопросов вроде "Какой это вид долга?" и "Какие у вас процентные ставки?"—показывая понимание того, что финансовый совет не подходит всем без исключения.
Его акцент на сборе контекста перед предоставлением рекомендаций соответствует профессиональным практикам финансового планирования, хотя это может вызвать раздражение у пользователей, ищущих немедленные ответы.
Нулевой ответ был бесполезен. Агент в основном сказал, что не знает пользователя достаточно, чтобы дать хороший финансовый совет. После того, как я попросил его делать предположения и заставил его предоставить план, который мог бы подходить большинству сценариев, агент разработал очень консервативный черновик плана, не предлагая конкретные предложения о том, какие инвестиции следует рассмотреть.
Однако MoneyGem закончила свой ответ рекомендацией максимизировать налоговые преимущества счетов, таких как 401(k) или Roth IRA, чтобы снизить налоговую нагрузку. Хорошо.
Вы можете нажать здесь , чтобы ознакомиться с нашим взаимодействием с MoneyGem, и опробовать модель самостоятельно, нажав эта ссылка.
Mistral AI
Подход Mistral к процессу настройки агента далек от простоты. Инструмент создания агента скрыт в его консоли разработчика, с глубокими опциями настройки, которые могут пугать новичков, но радовать тех, кто любит поковыряться.
Его интерфейс создания агента не является частью LeChat (интерфейс чат-бота), но появится там после создания агента.
Одна вещь, которая нам действительно нравится, это возможность питать инструмент примерами, которые формируют поведение и стиль ответа агента — что-то, что в данный момент не предлагает ни одна другая платформа. Кроме того, вот странная ошибка: при создании нашего агента пользовательский интерфейс внезапно переключился на французский, возможно, потому что компания французская. В любом случае, мы не смогли вернуться обратно на английский или испанский.
Как только агент создан, пользователи должны вызвать его в обычном интерфейсе чатбота, чтобы начать работу с ним. Они должны выйти из Le Plateforme и перейти в Le Chat, что не является самым интуитивно понятным действием. Тем не менее, интерфейс использования агента довольно простой и похож на любой другой интеллектуальный чатбот.
Мы создали нашего агента и назвали егоДеньгичтобы почитать французские корни Мистраля. Его производительность явно показала общий подход Мистраля к решению проблем. Его предложение «отложить $10 000 на случай чрезвычайных ситуаций, $15 000 на погашение долгов и $10 000 на инвестиции» казалось простым, но показало, что агенты не обладают некоторой базовой математической проверкой.
Общая сумма в $35,000 превысила доступные средства на $10,000, что является базовой ошибкой, которую демонстрируют некоторые языковые модели, когда они отдают предпочтение концептуальной правильности перед числовой точностью.
Однако мы должны отметить, что самые эффективные LLM значительно улучшились и не проваливаются в этой задаче - по крайней мере, не так часто, как у Mistral.
Кроме того, его план был не очень подробным, но только он предоставлял вопросы для последующего обсуждения, которые могли бы сделать взаимодействие более гибким и помочь ему лучше понять потребности пользователя.
Полный план LeMoney доступенздесьи агент доступен для тестированияздесь.
Антропный
Проекты Клода больше похожи на совершенную систему выполнения задач, а не на платформу для создания агентов. Интерфейс минималистичен, почти слишком минималистичен, и не кажется интуитивным.
Этот минималистский интерфейс может оставить некоторых пользователей в недоумении. Платформа представляет собой базовую настройку с "дополнительным" полем инструкций, которое кажется важным и несущественным одновременно: если инструкции помечены как необязательные, то как агент ИИ узнает, что ему нужно делать?
Его минималистический интерфейс кажется странным, но Anthropic никогда не славился своим вкусом в выборе пользовательского интерфейса. Окно для настройки модели и для ее вызова - это одно и то же окно. Его возможности в основном сосредоточены на интерпретации текстового кода, ничего больше. Поиск в Интернете и обработка и генерация изображений - это фантастические вещи, которые Anthropic оставляет своим конкурентам.
Наш агент по имени MoneyClaude недоступен для публичного тестирования, потому что Anthropic не разрешает это. Он занял очень консервативную позицию, предоставляя финансовые советы с технически точными, но размытыми ответами, например, "поддерживать сбалансированный подход между сокращением долга и существенными сбережениями".
Он запросил дополнительную информацию, но по крайней мере убедился в предоставлении очень общей стратегии в отсутствие необходимости в дальнейшем взаимодействии, что кажется более оптимальным, чем подход Google.
Нажмите здесь, чтобы прочитать его полный план.
Объятие лица
Открытый репозиторий остается уникальным местом для опытных пользователей и потенциальным кошмаром для новичков. Это единственная платформа, которая позволяет пользователям выбирать предпочитаемую модель языка и предлагает беспрецедентный контроль над основой агента.
Также у пользователей есть десятки различных инструментов для интеграции с их агентами, но они могут активировать только три из них одновременно. Это ограничение заставляет тщательно обдумать, какие функции имеют наибольшее значение для каждого конкретного случая использования, но ни одна другая модель не может предложить этого.
Это самый настраиваемый опыт из всех интерфейсов, однако, с большим количеством регуляторов для тонкой настройки. Результатом является платформа, которая может создавать более мощные, специализированные агенты по сравнению с конкурентами, но только в руках того, кто точно знает, что делает.
Пользователи могут испытать своих агентов на HuggingChat—безусловно, мечта опытного пользователя. Как только вы создадите агента, его использование станет очень простым. Интерфейс показывает большую карточку с именем, описанием и фотографией агента. Также позволяет пользователям делиться ссылкой на агента и настраивать его параметры, прямо из карточки.
Размещение нашего HuggingMoney'sТестирование агента показывает, что он работает с рамкой временного горизонта, что свидетельствует о более сложном понимании психологии финансового планирования. Его разбивка на «Краткосрочный (0-24 месяца), Среднесрочный (24-60 месяцев) и Долгосрочный (более 60 месяцев)» отражает профессиональные практики финансового планирования.
Агент предложил выделить «$0-$5,000 на жидкие, низкорисковые инструменты», при этом сохраняя агрессивные платежи по долгу в размере «$1,000-$1,500 ежемесячно». С первого взгляда это является признаком тонкого понимания управления денежным потоком.
Еще одной интересной особенностью было интеграция практических инструментов с теоретическими советами. За пределами простого предложения50/30/20правило, которое рекомендовало конкретные приложения для составления бюджета и подчеркивало оптимизацию налогов—создавая мост между стратегией высокого уровня и повседневным исполнением. Основной недостаток? Оно делает предположения о процентных ставках по долгам без уточнения.
В своей попытке дать полезные советы слишком многое принимается на веру. Это стремление дать ответ в любом случае можно исправить с помощью подсказки, но это стоит обдумать.
Вы можете ознакомиться с полным планом HuggingMoneyздесь. Также вы можете попробовать это, нажав на эта ссылка.