การเปรียบเทียบจากประสบการณ์จริงของห้าแพลตฟอร์มชั้นนำพบว่าแพลตฟอร์มใดเหมาะที่สุดสำหรับการโฮสต์ตัวแทน AI ในสถานการณ์ประจำวันของคุณ
ภาพที่สร้างขึ้นโดย Decrypt โดยใช้ AI
คุณสามารถทำอะไรก็ได้กับเอเจนต์ AI: ค้นหาข้อมูลในคลังเอกสารของคุณ, สร้างรหัส, สแกนเว็บ, ได้รับข้อมูลและการวิเคราะห์ที่คล่องแคล่วในข้อมูลที่ซับซ้อน, และอื่น ๆ อีกมากมาย คุณสามารถสร้างสำนักงานเสมือนจริงด้วยเอเจนต์ที่เชื่อมโยงกันได้หลากหลายงานและมีพวกเขาทำงานร่วมกันเหมือนเป็นพนักงานดิจิตอลที่เชี่ยวชาญในงานที่ต่างกัน
ดังนั้นการทำสิ่งนี้ยากแค่ไหน? ถ้าคนธรรมดาต้องการสร้างที่ปรึกษาทางการเงิน AI ของตนเองเช่นเดียวกัน แพลตฟอร์มใดจะเหมาะสมกับพวกเขา? ไม่มี API, ไม่มีการเขียนโค้ดแปลกประหลาด, ไม่มี Github - เราแค่ต้องการดูว่าบริษัท AI ที่ดีที่สุดสร้างตัวแทน AI ได้ดีแค่ไหนโดยไม่ต้องมีความชำนาญทางเทคนิคสูง
แน่นอนว่าคุณได้รับสิ่งที่คุณจ่ายเงินให้ ในกรณีนี้เรายังต้องการดูว่ามีความสัมพันธ์ระหว่างความง่ายของการตั้งค่าเอเจนต์สำหรับคนทั่วไปและคุณภาพของผลลัพธ์ที่แต่ละคนนำเสนอหรือไม่
ทดลองของเราใช้ประสบการณ์ที่สำคัญสำหรับการแข่งขันห้าคน: ChatGPT, Claude, Huggingface, Mistral AI และ Gemini แต่ละแพลตฟอร์มได้รับคำสั่งพื้นฐานเดียวกันในการสร้างที่ปรึกษาทางการเงิน
การทดสอบเน้นไปที่ความสามารถในขอบเขตมาตรฐาน ไม่ว่าตัวแทนจะสามารถจัดการฉากสถานการณ์ทั่วไปได้หรือไม่—ในกรณีนี้คือการช่วยให้คนอื่นสมดุลการลงทุนที่มีมูลค่า $25,000 ต่อสู้กับหนี้สิน $30,000 ที่ต้องการทราบว่าตัวแทนสามารถวิเคราะห์กราฟการซื้อขายได้ดีแค่ไหน เราไม่ใช้เครื่องมือเพิ่มเติมที่จะเพิ่มประสิทธิภาพของตัวแทนและพยายามใช้วิธีที่เรียบง่ายที่สุด
สรุปโดยสั้น นี่คือสิ่งที่เราค้นพบและวิธีที่เราจัดอันดับโมเดล:
1) GPT ของ OpenAI (8.5/10) ของ Gate
ChatGPT เป็นแพลตฟอร์มที่สมดุลมากที่สุด มีการสร้างตัวแทนที่ซับซ้อนโดยให้ตัวเลือกการสร้างทั้งแบบได้รับการแนะนำและแบบกำหนดเองเพื่อตอบสนองความต้องการของผู้ใช้ทั้งผู้เริ่มต้นทั้งผู้ใช้ที่มีประสบการณ์บางส่วน
ในขณะที่การอัปเดตอินเตอร์เฟสล่าสุดซึ่งซ่อนคุณลักษณะบางอย่างในเมนู แต่แพลตฟอร์มยอดเยี่ยมในการแปลงความต้องการของผู้ใช้ที่ซับซ้อนเป็นตัวแทนที่ทำงานได้ พวกเราทดสอบโมเดลโดยการสร้างที่ปรึกษาทางการเงินซึ่งแสดงให้เห็นถึงการตระหนักบริบทที่ยอดเยี่ยมและความสามารถในการแก้ไขปัญหาที่มีโครงสร้าง ให้กลยุทธ์ที่ละเอียดอ่อนแต่สอดคล้องสำหรับการจัดการหนี้และการจัดสรรลงทุน
2) กูเกิล เจมินี (7/10)
Gemini โดดเด่นด้วยอินเทอร์เฟซที่เรียบร้อยและใช้งานได้อย่างสะดวกสบาย และการจัดการข้อผิดพลาดที่ยอดเยี่ยม เมื่อต้องการผลลัพธ์ที่ดีที่สุด จำเป็นต้องมีระแวกในระดับละเอียดมากขึ้น แต่การแปลความหมายตรงตามคำสั่งช่วยให้ได้ผลลัพธ์ที่สม่ำเสมอและคาดเดาได้
การให้คำปรึกษาของตัวแทนทางการเงินเน้นที่จะรวบรวมบริบทก่อนที่จะแนะนำ ซึ่งเป็นการสะท้อนศักยภาพทางมืออาชีพ อย่างไรก็ตาม มันอาจจะมีความระมัดระวังเกินไปในการตอบโต้ที่ไม่มีการพิจารณา
3) HuggingChat (6.5 / 10)
แพลตฟอร์มโอเพ่นซอร์สนี้มีตัวเลือกในการปรับแต่งและเลือกโมเดลที่ไม่เหมือนใคร สำหรับคนที่ต้องการควบคุมรายละเอียดได้อย่างแม่นยำ แต่มันไม่เหมาะสำหรับคนที่ต้องการความเรียบง่าย (คิดเหมือนการเปรียบเทียบระบบ Linux กับ macOS) โครงสร้างเวลาและการผสมเครื่องมือที่ซับซ้อนของมันแสดงให้เห็นถึงความสามารถขั้นสูง
เราสร้างตัวแทนที่บริสุทธิ์โดยไม่มีฟังก์ชันเพิ่มเติมใด ๆ เราใช้ Nvidia's Nemomotron เป็นฐาน LLM และมันดีพอที่จะเทียบเท่ากับ ChatGPT ในคุณภาพผลลัพธ์ ไม่เลวเลยสำหรับค่ายโอเพนซอร์ส
4) Claude (5.5/10)
แพลตฟอร์มของ Anthropic เป็นที่โดดเด่นในส่วนที่เฉพาะเจาะจงโดยเฉพาะงานที่ต้องการการประมวลผลบริบทและการตีความโค้ดอย่างละเอียด ส่วนของอินเตอร์เฟซที่เรียบง่ายของมันซ่อนความสามารถที่ซับซ้อนอย่างไร้เสียง แต่ฟิลด์คำสั่งที่ “เลือก” อาจทำให้ผู้ใช้สับสน
ตัวแทนของเราคงเหลือความระมัดระวังและที่ไม่ชัดเจนในคำแนะนำของตน แต่แสดงความตระหนักรู้เรื่องความเสี่ยงและความคิดริเริ่มที่มั่นคง จะต้องมีการกระตุ้นอย่างรอบคอบกว่านี้เพื่อสกัดศักยภาพจริง ๆ ของตัวแทน แต่การทดสอบการปรับเปลี่ยนคำแนะนำอาจจะไม่เหมาะสม เนื่องจากจะไม่สอดคล้องกับสมมติฐานของเงื่อนไขที่คล้ายกัน
5) Mistral AI (5/10)
แพลตฟอร์มฝรั่งเศสนี้มีการเรียนรู้ตัวอย่างที่ไม่ซ้ำกันและตัวเลือกการปรับแต่งลึก อย่างไรก็ตาม อินเตอร์เฟซที่เน้นผู้พัฒนาและปัญหาการสลับภาษาบางครั้งสร้างอุปสรรคสำหรับผู้ใช้ที่ไม่มีความชำนาญทางเทคนิค นอกจากนี้ยังต้องการปรับแต่งการกำหนดค่าของตัวแทนให้เหมาะสมกับแบบจำลองที่แตกต่างกันเพื่อดำเนินงานที่แตกต่างกันเช่นการวิเคราะห์ภาพหรือการจัดการโค้ด สิ่งนี้ไม่ได้เป็นอย่างที่理想
ที่ปรึกษาทางการเงินแสดงความมั่นใจในการออกแบบการโต้ตอบ แต่ต้องการความยากลำบากในการตรวจสอบความถูกต้องของการคำนวณทางคณิตศาสตร์พื้นฐานและมีผลลัพธ์ที่แย่ที่สุด นี่ไม่ได้หมายความว่าผลลัพธ์ไม่ดี แต่ในการทดสอบศูนย์ช็อตนี้ ผลลัพธ์นี้เป็นที่น้อยที่สุด
โดยพิจารณาจากอันดับก่อนหน้านี้ ไม่มีการแก้ปัญหาที่เหมาะสมทั้งหมดและแพลตฟอร์มทั้งหมดมีข้อดีและข้อเสียของตัวเอง ด้วยการทำให้เหมาะสมและปรับแต่งคำให้ละเอียดอย่างรอบคอบ ผลลัพธ์จากแพลตฟอร์มหนึ่งอาจแตกต่างกันและเอาชนะแม้ว่าจะเป็นสมาชิกเดียว ในที่สุด แต่ละสมาชิก LLM ก็มีสไตล์เรียกให้คำให้แตกต่างกันไป
If you want to know more about the rationale behind our ranking, here is a more in-depth look at our experience and the results we got with our agents. We configured all of our agents with the same system prompt, no additional parameters of functionalities, and asked them the same basic question: “I have $25K to invest and am $30K in debt. Build me a financial plan.
OpenAI
อินเตอร์เฟซ ChatGPT ได้รับการปรับปรุงที่ทำให้ซับซ้อนขึ้นจริงๆ ตอนนี้ตัวเลือกการสร้าง GPT ซ่อนอยู่หลังเมนู แต่พอหาเจอแล้ว จะมีทางเลือกสองอย่าง: การตั้งค่าสนทนาที่ AI ช่วยสร้างตัวแทนของคุณ และการกำหนดค่าด้วยตนเองสำหรับผู้ที่รู้ว่าต้องการอะไร
แพลตฟอร์ม GPT ของ OpenAI เป็นเหมือนมีเครื่องมือหลายอย่างในที่เดียว - มันสามารถอ่านโค้ด ค้นหาบนเว็บ และจัดการการสร้างภาพและการวิเคราะห์ กระบวนการตั้งค่าที่มีการนำทางด้วย AI ทำให้เหมาะสำหรับผู้เริ่มต้น แต่อาจรู้สึกถูกจำกัดสำหรับผู้ใช้งานที่ต้องการควบคุมอย่างละเอียด (ตัวอย่างเช่น หากคุณให้โมเดลมีข้อมูลเพิ่มเติมหรือละเอียดมากขึ้น อาจมีการเปลี่ยนแปลงระบบทั้งหมด ซึ่งอาจทำให้ผลลัพธ์แย่ลง)
เมื่อมาถึงการใช้งานเอเจนต์จริง ๆ ChatGPT เป็นเรื่องง่ายและอินเทอร์เฟซสะอาดและเข้าใจง่าย
ตัวแทนสามารถอ่านเอกสารและเข้าใจภาพได้โดยตรงซึ่งให้ความได้เปรียบกว่าแพลตฟอร์มอื่น ๆ
ตอนนี้เรามาพูดถึงคุณภาพของตัวแทนที่คุณสามารถสร้างขึ้นได้ด้วยการเรียกใช้งานพื้นฐาน ที่เราเรียกว่า ที่ปรึกษาทางการเงินของเราชื่อMoneyGPTน่าประทับใจมาก ให้เราได้เรียนรู้เทคนิคการแก้ไขปัญหาที่มีโครงสร้าง
เกินการจัดสรรที่แม่นยำ—“$20,000 สำหรับหนี้ที่อัตราดอกเบี้ยสูง” และการแยกพอร์ตโฟลิโออย่างละเอียด—ตัวแทนได้สาธิตการวิเคราะห์ทางการเงินที่ซับซ้อน มันให้เส้นทาง 5 ขั้นตอนที่ไม่ได้เป็นเพียงแค่รายการ แต่เป็นกลยุทธ์ที่สม่ำเสมอซึ่งคำนึงถึงความต้องการทันทีและการพิจารณาในระยะยาว
ความแข็งแรงของตัวแทนอยู่ในความสามารถในการสมดุลระหว่างรายละเอียดกับบริบท ในขณะที่แนะนำการลงทุนที่เฉพาะเจา (40% S&P 500, 30% หุ้นพันธบัตร) ก็อธิบายเหตุผลของการตอบสนองของมัน: "การชำระหนี้ที่มีดอกเบี้ยสูงเหมือนการได้รับผลตอบแทนที่รับรอง" ความตระหนักรู้เนื้อความนี้ยังขยายไปถึงการวางแผนระยะยาว แนะนำว่าให้ทำการทบทวนเป็นระยะ และใช้กลยุทธ์ที่ปรับได้โดยอิงตามสถานการณ์ที่เปลี่ยนแปลง
อย่างไรก็ตาม ความมีมากมายของข้อมูลนี้เปิดเผยจุดอ่อนที่เป็นไปได้: ความเสี่ยงที่จะทำให้ผู้ใช้รู้สึกฟุ้งซ่านด้วยรายละเอียดมากเกินไปในเวลาเดียว ถึงแม้จะครอบคลุมทางเทคนิค การส่งมอบการจัดสรรที่เฉพาะเจาะจง กลยุทธ์การลงทุน และแผนการตรวจสอบอาจพิสูจน์เป็นทางที่ยากสำหรับผู้เริ่มต้นด้านการเงิน
คุณสามารถอ่านแผนที่เต็มของมันได้ที่นี่, และคุณสามารถใช้งานได้โดยคลิกที่ ลิงค์นี้. เราขอแนะนำให้ท่าน
โดยรวมแล้ว Google's Gemini agent creation platform ชนะการประกวดความสวยงามด้วยอินเทอร์เฟซที่เรียบง่ายและ intuitive ซึ่งทำให้การสร้างเอเจนต์รู้สึกง่ายเกินไปเกือบจะสุดโคตร ระบบจะทำตามคำสั่งอย่างยอดเยี่ยมซึ่งช่วยลดความสับสน และ UI ที่สะอาดช่วยลดปัจจัยที่ทำให้ผู้พัฒนา AI กลัว
อย่างไรก็ตาม จะต้องมีคำแนะนำที่ละเอียดมากขึ้นเพื่อให้ได้เอาเจ้ามือที่ดีขึ้นออกมา มันไม่ได้รับฟังสิ่งที่เป็นธรรมดา: คำแนะนำที่สั้นๆ จะให้คุณได้รับการตอบสนองที่คุณภาพต่ำ
Under the hood, it packs serious muscle—Google-powered web search integration, code analysis, and image processing capabilities that rival ChatGPT’s offerings, but mostly reliant on Microsoft’s technology.
หน้าต่างผู้ใช้ของ Gemini รู้สึกเหมือนถูกออกแบบโดยคนที่เข้าใจประสบการณ์ของผู้ใช้จริง อินเทอร์เฟซช่วยนำผู้ใช้ด้วยป้ายกำกับชัดเจนและทุกอย่างแสดงบนหน้าจอเพียงหนึ่งหน้าเท่านั้น
การเข้าถึงที่ดูดีและสมบูรณ์นี้ทำให้มันน่าสนใจมากสำหรับผู้เริ่มต้น แต่ผู้ใช้ที่มีประสบการณ์อาจพบว่าต้องการควบคุมเฉพาะเจาะจงมากขึ้น
เราเรียกตัวแทนของเราMoneyGemและขอแผนการเงิน วิธีการให้คำปรึกษาของมันเป็นการแสดงแนวคิดในการแก้ไขปัญหาของ Google ที่แตกต่างจากคนอื่น มันไม่ให้คำตอบอย่างตรงไปตรงมา แต่มันเริ่มด้วยคำถามเช่น "หนี้ของคุณเป็นแบบไหน?" และ "อัตราดอกเบี้ยของคุณเป็นเท่าไหร่?"—โดยแสดงให้เห็นว่าการให้คำปรึกษาทางการเงินไม่ใช่เรื่องที่เหมาะกับทุกคน
การเน้นการรวบรวมบริบทก่อนที่จะให้คำแนะนำสอดคล้องกับวิธีการวางแผนทางการเงินขั้นเทพ อย่างไรก็ตามอาจทำให้ผู้ใช้ที่ต้องการคำตอบทันทีรู้สึกผิดหวัง
คำตอบแบบศูนย์ไม่เป็นประโยชน์ เอเจนต์พื้นฐานกล่าวว่ามันไม่รู้เกี่ยวกับผู้ใช้เพียงพอที่จะให้คำแนะนำทางการเงินที่ดี หลังจากขอให้มันสมมติและบังคับมันให้ให้แผนที่สามารถเข้ากันกับสถานการณ์มากที่สุด เอเจนต์ก็สร้างแผนแบบอนุรักษ์มากๆโดยไม่ให้คำแนะนำเฉพาะเรื่องการลงทุนที่จะพิจารณา
MoneyGem แต่ละคำตอบจบด้วยการแนะนำให้ใช้บัญชีที่ได้รับประโยชน์จากภาษีเช่น 401(k) หรือ Roth IRA เพื่อลดภาระภาษีของคุณ ดีมาก
คุณสามารถคลิกที่นี่เพื่ออ่านปฏิสัมพันธ์ของเรากับ MoneyGem และลองโมเดลด้วยตัวคุณเองโดยการคลิกลิงค์นี้.
Mistral AI
วิธีการกำหนดค่าตัวแทนของ Mistral นั้นซับซ้อนเล็กน้อย โดยเครื่องมือสร้างตัวแทนถูกซ่อนอยู่ในคอนโซลของนักพัฒนา มีตัวเลือกการปรับแต่งลึกซึ้งที่อาจทำให้ผู้เริ่มต้นไม่กล้าออก แต่ทำให้ผู้ทดลองสนุกสนาน
อินเตอร์เฟซการสร้างตัวแทนของมันไม่ใช่ส่วนหนึ่งของ LeChat (อินเตอร์เฟซแชทบอท) แต่จะปรากฏขึ้นที่นั่นเมื่อมีการสร้างตัวแทน
สิ่งหนึ่งที่เราชอบมากคือความสามารถในการให้โปรแกรมด้วยตัวอย่างที่รูปร่างพฤติกรรมและสไตล์การตอบสนองของตัวแทนได้ - สิ่งที่แพลตฟอร์มอื่น ๆ ไม่ได้นำเสนอในปัจจุบัน นอกจากนี้ เราพบปัญหาแปลกๆ: ขณะที่เรากำลังสร้างตัวแทนของเรา อินเตอร์เฟซก็เปลี่ยนไปใช้ภาษาฝรั่งเศสโดยไม่คาดคิด อาจเป็นเพราะบริษัทเป็นบริษัทฝรั่งเศส อย่างไรก็ตาม เราไม่สามารถสลับกลับเป็นภาษาอังกฤษหรือภาษาสเปนได้
เมื่อสร้างเอเจนต์แล้ว ผู้ใช้จะต้องเรียกใช้ในอินเตอร์เฟซแชทบอทปกติเพื่อทำงานกับมัน พวกเขาต้องออกจาก Le Plateforme และไปที่ Le Chat ซึ่งไม่ได้เป็นสิ่งที่สะดวกสบายที่สุดที่จะทำ อย่างไรก็ตาม อินเตอร์เฟซสำหรับใช้เอเจนต์นั้นง่ายต่อการใช้งานและรู้สึกเหมือนกับแชทบอท AI อื่น ๆ
เราสร้างตัวแทนของเรา และตั้งชื่อLe Moneyเพื่อเกียรติ Mistral ที่มีรากฝรั่งเศส ประสิทธิภาพของมันแสดงให้เห็นชัดเจนถึงวิธีการแก้ปัญหาทั่วไปของ Mistral ข้อเสนอให้ "จอง $10,000 สำหรับฉุกเฉิน, $15,000 สำหรับการชดเชยหนี้, และ $10,000 สำหรับการลงทุน" ดูเหมือนจะเป็นเรื่องง่าย แต่แสดงให้เห็นว่าตัวแทนขาดการตรวจสอบทางคณิตศาสตร์พื้นฐานบางประการ
ยอดรวม $35,000 เกินกว่าเงินทุนที่มีอยู่ โดย $10,000 ซึ่งเป็นความผิดพื้นฐานที่บางรุ่นของภาษาแสดงออกเมื่อพวกเขาตั้งความสำคัญกับความถูกต้องทางคอนเซปต์มากกว่าความถูกต้องทางตัวเลข
เราต้องทราบอย่างไรก็ตามว่า LLMs ที่ทำงานดีที่สุดได้ปรับปรุงมาก และไม่ล้มเหลวในงานนี้บ่อยเท่าที่มิสทรัลทำ
นอกจากนี้แล้ว แผนของมันไม่ได้อธิบายอย่างละเอียด แต่มันเป็นแผนเดียวที่ให้คำถามเพิ่มเติมเพื่อทำให้การโต้ตอบมีความราบรื่นขึ้นและช่วยเข้าใจความต้องการของผู้ใช้ได้ดีขึ้น
แผนเต็มของ LeMoney พร้อมใช้งานที่นี่และตัวแทนพร้อมให้ทดสอบที่นี่.
Anthropic
โครงการของคลอดด์รู้สึกไม่เหมือนแพลตฟอร์มการสร้างเอเจนต์และมากขึ้นเหมือนระบบการดำเนินงานงานที่ซับซ้อน อินเตอร์เฟซเป็นขั้นต่ำเกือบจะขั้นต่ำเกินไปและไม่รู้สึกเป็นประสบการณ์ที่เข้าใจง่าย
อินเตอร์เฟซแบบมินิมัลนิสต์นี้อาจทำให้บางผู้ใช้งงงวย แพลตฟอร์มนี้มีการตั้งค่าแบบพื้นฐานพร้อมกับฟิลด์คำแนะนำที่ “ไม่บังคับ” ซึ่งรู้สึกว่าไม่สำคัญแต่ก็สำคัญพร้อมกัน: หากคำแนะนำถูกตั้งชื่อว่าไม่บังคับ แล้ว AI จะรู้ว่าต้องทำอะไร?
อินเตอร์เฟซแบบมินิมอลิสต์ของมันดูแปลก ๆ แต่ Anthropic ไม่เคยมีชื่อเสียงเรื่องการเลือก UI ที่ดี เวลาที่ใช้เพื่อกำหนดค่าโมเดลก็คือเวลาที่คุณใช้เพื่อกระตุ้นมัน ความสามารถของมันเน้นไปที่การอ่านโค้ดข้อความเป็นหลัก การค้นหาเว็บและการประมวลผลและสร้างภาพเป็นสิ่งที่ Anthropic ปล่อยให้คู่แข่งของมัน
ตัวแทนของเราชื่อ MoneyClaude ไม่สามารถทดสอบสาธารณะได้เนื่องจาก Anthropic ไม่อนุญาตให้เป็นเช่นนั้น มันต้องการที่จะให้คำแนะนำทางการเงินที่อยู่ในกรอบที่ระมัดระวังมาก ๆ โดยให้คำตอบที่ถูกต้องทางเทคนิค แต่ก็ยังมีคำตอบที่ไม่ชัดเจน เช่น “รักษาการเข้าใจในการลดหนี้และออมตังค์ที่สำคัญ” เป็นต้น
มันขอข้อมูลเพิ่มเติม แต่อย่างน้อยก็รับรองว่าจะให้กลยุทธ์ที่มีความทั่วไปมากในกรณีที่ขาดข้อมูลโดยไม่ต้องการการติดต่อเพิ่มเติม ซึ่งดูเหมือนจะเป็นทางเลือกที่ดีกว่าวิธีการของ Google
คลิกที่นี่เพื่ออ่านแผนเต็ม.
Hugging Face
ที่เก็บรายการซอร์สโค้ดแยกตัวอย่างเป็นสวรรค์ของผู้ใช้ที่มีพลังและอาจเป็นฮาโลวีนสำหรับผู้เริ่มต้น มันเป็นแพลทฟอร์มเดียวเท่านั้นที่ให้ผู้ใช้เลือกโมเดลภาษาที่พวกเขาต้องการ มอบควบคุมที่ไม่เคยเป็นมาก่อนเกี่ยวกับพื้นฐานของตัวแทน
นอกจากนี้ผู้ใช้สามารถใช้โดยใช้เครื่องมือที่แตกต่างกันได้มากมายกับตัวแทนของพวกเขา แต่สามารถเปิดใช้งานได้เพียงสามอย่างพร้อมกันเท่านั้น ข้อจำกัดนี้ทำให้ต้องพิจารณาอย่างรอบคอบว่าคุณลักษณะใดสำคัญที่สุดสำหรับแต่ละกรณีการใช้งานเฉพาะ แต่มันเป็นสิ่งที่ไม่มีรุ่นอื่นสามารถมอบให้ได้
นี่เป็นประสบการณ์ที่สามารถปรับแต่งได้มากที่สุดของอินเทอร์เฟซทั้งหมด แต่มีการปรับแต่งมากมายให้ปรับปรุง ผลลัพธ์คือแพลตฟอร์มที่สามารถสร้างตัวแทนที่มีพลังและความเชี่ยวชาญมากกว่าคู่แข่ง แต่เฉพาะในมือคนที่รู้สึกถึงสิ่งที่พวกเขากำลังทำอย่างแน่นอน
ผู้ใช้สามารถลองใช้ตัวแทนของพวกเขาบนกอดแชท—มือลงทุนฝีมือสูงเป็นความฝันของผู้ใช้งานที่สร้างเอเจนต์แล้ว การใช้งานมันก็ง่ายมาก อินเทอร์เฟซจะแสดงการ์ดใหญ่ที่มีชื่อเอเจนต์ คำอธิบาย และรูปภาพ และยังให้ผู้ใช้แชร์ลิงก์เอเจนต์และปรับแต่งการตั้งค่าได้ทั้งหมดที่ตามการ์ด
วางของเรา HuggingMoney’sการทดสอบเอเจนต์แสดงให้เห็นว่ามันจัดการด้วยกรอบเวลา โดยแสดงความเข้าใจที่ซับซ้อนขึ้นเกี่ยวกับจิตวิทยาการวางแผนการเงิน การแบ่งแยกเป็น "ระยะสั้น (0-24 เดือน), ระยะกลาง (24-60 เดือน), และระยะยาว (เกิน 60 เดือน)" สะท้อนการปฏิบัติการวางแผนการเงินของมืออาชีพ
ตัวแทนแนะนำการจัดสรร "$0-$5,000 เข้าสู่ยานพาหนะที่เป็นของเหลว ที่มีความเสี่ยงต่ำ" ในขณะที่ยังคงทำการชำระหนี้ที่มีความเป็นหนี้"$1,000-$1,500 ต่อเดือน" นี่เป็นสัญญาณของความเข้าใจที่ละเอียดอ่อนเกี่ยวกับการบริหารการไหลเงินทุนในมุมมองแรกเสมอ
คุณสมบัติที่น่าสนใจอีกอย่างคือการรวมเครื่องมือทางปฏิบัติกับคำแนะนำทฤษฎี ไม่เพียงแค่แนะนำ50/30/20ตามกฎระเบียบนั้น แอปที่แนะนำเฉพาะบัญชีงบประมาณและเน้นการปรับแต่งภาษี - สร้างสะพานระหว่างกลยุทธ์ระดับสูงและการดำเนินการประจำวัน ข้อเสียหลักคือ? มันรวมถึงการสมมติเกี่ยวกับอัตราดอกเบี้ยหนี้โดยไม่ได้ขอความชัดเจน
ในการพยายามให้คำแนะนำที่มีประโยชน์มากขึ้น มันถูกสรุปความสำคัญของสิ่งหลายอย่าง การกระตุ้นที่จะให้คำตอบไม่ว่าอะไรก็ตามสามารถแก้ไขได้ด้วยการกระตุ้น แต่ต้องคิดให้ดี
คุณสามารถอ่านแผนทั้งหมดของ HuggingMoney ได้ที่นี่นอกจากนี้คุณยังสามารถลองด้วยการคลิกที่ลิงค์นี้.
แชร์
การเปรียบเทียบจากประสบการณ์จริงของห้าแพลตฟอร์มชั้นนำพบว่าแพลตฟอร์มใดเหมาะที่สุดสำหรับการโฮสต์ตัวแทน AI ในสถานการณ์ประจำวันของคุณ
ภาพที่สร้างขึ้นโดย Decrypt โดยใช้ AI
คุณสามารถทำอะไรก็ได้กับเอเจนต์ AI: ค้นหาข้อมูลในคลังเอกสารของคุณ, สร้างรหัส, สแกนเว็บ, ได้รับข้อมูลและการวิเคราะห์ที่คล่องแคล่วในข้อมูลที่ซับซ้อน, และอื่น ๆ อีกมากมาย คุณสามารถสร้างสำนักงานเสมือนจริงด้วยเอเจนต์ที่เชื่อมโยงกันได้หลากหลายงานและมีพวกเขาทำงานร่วมกันเหมือนเป็นพนักงานดิจิตอลที่เชี่ยวชาญในงานที่ต่างกัน
ดังนั้นการทำสิ่งนี้ยากแค่ไหน? ถ้าคนธรรมดาต้องการสร้างที่ปรึกษาทางการเงิน AI ของตนเองเช่นเดียวกัน แพลตฟอร์มใดจะเหมาะสมกับพวกเขา? ไม่มี API, ไม่มีการเขียนโค้ดแปลกประหลาด, ไม่มี Github - เราแค่ต้องการดูว่าบริษัท AI ที่ดีที่สุดสร้างตัวแทน AI ได้ดีแค่ไหนโดยไม่ต้องมีความชำนาญทางเทคนิคสูง
แน่นอนว่าคุณได้รับสิ่งที่คุณจ่ายเงินให้ ในกรณีนี้เรายังต้องการดูว่ามีความสัมพันธ์ระหว่างความง่ายของการตั้งค่าเอเจนต์สำหรับคนทั่วไปและคุณภาพของผลลัพธ์ที่แต่ละคนนำเสนอหรือไม่
ทดลองของเราใช้ประสบการณ์ที่สำคัญสำหรับการแข่งขันห้าคน: ChatGPT, Claude, Huggingface, Mistral AI และ Gemini แต่ละแพลตฟอร์มได้รับคำสั่งพื้นฐานเดียวกันในการสร้างที่ปรึกษาทางการเงิน
การทดสอบเน้นไปที่ความสามารถในขอบเขตมาตรฐาน ไม่ว่าตัวแทนจะสามารถจัดการฉากสถานการณ์ทั่วไปได้หรือไม่—ในกรณีนี้คือการช่วยให้คนอื่นสมดุลการลงทุนที่มีมูลค่า $25,000 ต่อสู้กับหนี้สิน $30,000 ที่ต้องการทราบว่าตัวแทนสามารถวิเคราะห์กราฟการซื้อขายได้ดีแค่ไหน เราไม่ใช้เครื่องมือเพิ่มเติมที่จะเพิ่มประสิทธิภาพของตัวแทนและพยายามใช้วิธีที่เรียบง่ายที่สุด
สรุปโดยสั้น นี่คือสิ่งที่เราค้นพบและวิธีที่เราจัดอันดับโมเดล:
1) GPT ของ OpenAI (8.5/10) ของ Gate
ChatGPT เป็นแพลตฟอร์มที่สมดุลมากที่สุด มีการสร้างตัวแทนที่ซับซ้อนโดยให้ตัวเลือกการสร้างทั้งแบบได้รับการแนะนำและแบบกำหนดเองเพื่อตอบสนองความต้องการของผู้ใช้ทั้งผู้เริ่มต้นทั้งผู้ใช้ที่มีประสบการณ์บางส่วน
ในขณะที่การอัปเดตอินเตอร์เฟสล่าสุดซึ่งซ่อนคุณลักษณะบางอย่างในเมนู แต่แพลตฟอร์มยอดเยี่ยมในการแปลงความต้องการของผู้ใช้ที่ซับซ้อนเป็นตัวแทนที่ทำงานได้ พวกเราทดสอบโมเดลโดยการสร้างที่ปรึกษาทางการเงินซึ่งแสดงให้เห็นถึงการตระหนักบริบทที่ยอดเยี่ยมและความสามารถในการแก้ไขปัญหาที่มีโครงสร้าง ให้กลยุทธ์ที่ละเอียดอ่อนแต่สอดคล้องสำหรับการจัดการหนี้และการจัดสรรลงทุน
2) กูเกิล เจมินี (7/10)
Gemini โดดเด่นด้วยอินเทอร์เฟซที่เรียบร้อยและใช้งานได้อย่างสะดวกสบาย และการจัดการข้อผิดพลาดที่ยอดเยี่ยม เมื่อต้องการผลลัพธ์ที่ดีที่สุด จำเป็นต้องมีระแวกในระดับละเอียดมากขึ้น แต่การแปลความหมายตรงตามคำสั่งช่วยให้ได้ผลลัพธ์ที่สม่ำเสมอและคาดเดาได้
การให้คำปรึกษาของตัวแทนทางการเงินเน้นที่จะรวบรวมบริบทก่อนที่จะแนะนำ ซึ่งเป็นการสะท้อนศักยภาพทางมืออาชีพ อย่างไรก็ตาม มันอาจจะมีความระมัดระวังเกินไปในการตอบโต้ที่ไม่มีการพิจารณา
3) HuggingChat (6.5 / 10)
แพลตฟอร์มโอเพ่นซอร์สนี้มีตัวเลือกในการปรับแต่งและเลือกโมเดลที่ไม่เหมือนใคร สำหรับคนที่ต้องการควบคุมรายละเอียดได้อย่างแม่นยำ แต่มันไม่เหมาะสำหรับคนที่ต้องการความเรียบง่าย (คิดเหมือนการเปรียบเทียบระบบ Linux กับ macOS) โครงสร้างเวลาและการผสมเครื่องมือที่ซับซ้อนของมันแสดงให้เห็นถึงความสามารถขั้นสูง
เราสร้างตัวแทนที่บริสุทธิ์โดยไม่มีฟังก์ชันเพิ่มเติมใด ๆ เราใช้ Nvidia's Nemomotron เป็นฐาน LLM และมันดีพอที่จะเทียบเท่ากับ ChatGPT ในคุณภาพผลลัพธ์ ไม่เลวเลยสำหรับค่ายโอเพนซอร์ส
4) Claude (5.5/10)
แพลตฟอร์มของ Anthropic เป็นที่โดดเด่นในส่วนที่เฉพาะเจาะจงโดยเฉพาะงานที่ต้องการการประมวลผลบริบทและการตีความโค้ดอย่างละเอียด ส่วนของอินเตอร์เฟซที่เรียบง่ายของมันซ่อนความสามารถที่ซับซ้อนอย่างไร้เสียง แต่ฟิลด์คำสั่งที่ “เลือก” อาจทำให้ผู้ใช้สับสน
ตัวแทนของเราคงเหลือความระมัดระวังและที่ไม่ชัดเจนในคำแนะนำของตน แต่แสดงความตระหนักรู้เรื่องความเสี่ยงและความคิดริเริ่มที่มั่นคง จะต้องมีการกระตุ้นอย่างรอบคอบกว่านี้เพื่อสกัดศักยภาพจริง ๆ ของตัวแทน แต่การทดสอบการปรับเปลี่ยนคำแนะนำอาจจะไม่เหมาะสม เนื่องจากจะไม่สอดคล้องกับสมมติฐานของเงื่อนไขที่คล้ายกัน
5) Mistral AI (5/10)
แพลตฟอร์มฝรั่งเศสนี้มีการเรียนรู้ตัวอย่างที่ไม่ซ้ำกันและตัวเลือกการปรับแต่งลึก อย่างไรก็ตาม อินเตอร์เฟซที่เน้นผู้พัฒนาและปัญหาการสลับภาษาบางครั้งสร้างอุปสรรคสำหรับผู้ใช้ที่ไม่มีความชำนาญทางเทคนิค นอกจากนี้ยังต้องการปรับแต่งการกำหนดค่าของตัวแทนให้เหมาะสมกับแบบจำลองที่แตกต่างกันเพื่อดำเนินงานที่แตกต่างกันเช่นการวิเคราะห์ภาพหรือการจัดการโค้ด สิ่งนี้ไม่ได้เป็นอย่างที่理想
ที่ปรึกษาทางการเงินแสดงความมั่นใจในการออกแบบการโต้ตอบ แต่ต้องการความยากลำบากในการตรวจสอบความถูกต้องของการคำนวณทางคณิตศาสตร์พื้นฐานและมีผลลัพธ์ที่แย่ที่สุด นี่ไม่ได้หมายความว่าผลลัพธ์ไม่ดี แต่ในการทดสอบศูนย์ช็อตนี้ ผลลัพธ์นี้เป็นที่น้อยที่สุด
โดยพิจารณาจากอันดับก่อนหน้านี้ ไม่มีการแก้ปัญหาที่เหมาะสมทั้งหมดและแพลตฟอร์มทั้งหมดมีข้อดีและข้อเสียของตัวเอง ด้วยการทำให้เหมาะสมและปรับแต่งคำให้ละเอียดอย่างรอบคอบ ผลลัพธ์จากแพลตฟอร์มหนึ่งอาจแตกต่างกันและเอาชนะแม้ว่าจะเป็นสมาชิกเดียว ในที่สุด แต่ละสมาชิก LLM ก็มีสไตล์เรียกให้คำให้แตกต่างกันไป
If you want to know more about the rationale behind our ranking, here is a more in-depth look at our experience and the results we got with our agents. We configured all of our agents with the same system prompt, no additional parameters of functionalities, and asked them the same basic question: “I have $25K to invest and am $30K in debt. Build me a financial plan.
OpenAI
อินเตอร์เฟซ ChatGPT ได้รับการปรับปรุงที่ทำให้ซับซ้อนขึ้นจริงๆ ตอนนี้ตัวเลือกการสร้าง GPT ซ่อนอยู่หลังเมนู แต่พอหาเจอแล้ว จะมีทางเลือกสองอย่าง: การตั้งค่าสนทนาที่ AI ช่วยสร้างตัวแทนของคุณ และการกำหนดค่าด้วยตนเองสำหรับผู้ที่รู้ว่าต้องการอะไร
แพลตฟอร์ม GPT ของ OpenAI เป็นเหมือนมีเครื่องมือหลายอย่างในที่เดียว - มันสามารถอ่านโค้ด ค้นหาบนเว็บ และจัดการการสร้างภาพและการวิเคราะห์ กระบวนการตั้งค่าที่มีการนำทางด้วย AI ทำให้เหมาะสำหรับผู้เริ่มต้น แต่อาจรู้สึกถูกจำกัดสำหรับผู้ใช้งานที่ต้องการควบคุมอย่างละเอียด (ตัวอย่างเช่น หากคุณให้โมเดลมีข้อมูลเพิ่มเติมหรือละเอียดมากขึ้น อาจมีการเปลี่ยนแปลงระบบทั้งหมด ซึ่งอาจทำให้ผลลัพธ์แย่ลง)
เมื่อมาถึงการใช้งานเอเจนต์จริง ๆ ChatGPT เป็นเรื่องง่ายและอินเทอร์เฟซสะอาดและเข้าใจง่าย
ตัวแทนสามารถอ่านเอกสารและเข้าใจภาพได้โดยตรงซึ่งให้ความได้เปรียบกว่าแพลตฟอร์มอื่น ๆ
ตอนนี้เรามาพูดถึงคุณภาพของตัวแทนที่คุณสามารถสร้างขึ้นได้ด้วยการเรียกใช้งานพื้นฐาน ที่เราเรียกว่า ที่ปรึกษาทางการเงินของเราชื่อMoneyGPTน่าประทับใจมาก ให้เราได้เรียนรู้เทคนิคการแก้ไขปัญหาที่มีโครงสร้าง
เกินการจัดสรรที่แม่นยำ—“$20,000 สำหรับหนี้ที่อัตราดอกเบี้ยสูง” และการแยกพอร์ตโฟลิโออย่างละเอียด—ตัวแทนได้สาธิตการวิเคราะห์ทางการเงินที่ซับซ้อน มันให้เส้นทาง 5 ขั้นตอนที่ไม่ได้เป็นเพียงแค่รายการ แต่เป็นกลยุทธ์ที่สม่ำเสมอซึ่งคำนึงถึงความต้องการทันทีและการพิจารณาในระยะยาว
ความแข็งแรงของตัวแทนอยู่ในความสามารถในการสมดุลระหว่างรายละเอียดกับบริบท ในขณะที่แนะนำการลงทุนที่เฉพาะเจา (40% S&P 500, 30% หุ้นพันธบัตร) ก็อธิบายเหตุผลของการตอบสนองของมัน: "การชำระหนี้ที่มีดอกเบี้ยสูงเหมือนการได้รับผลตอบแทนที่รับรอง" ความตระหนักรู้เนื้อความนี้ยังขยายไปถึงการวางแผนระยะยาว แนะนำว่าให้ทำการทบทวนเป็นระยะ และใช้กลยุทธ์ที่ปรับได้โดยอิงตามสถานการณ์ที่เปลี่ยนแปลง
อย่างไรก็ตาม ความมีมากมายของข้อมูลนี้เปิดเผยจุดอ่อนที่เป็นไปได้: ความเสี่ยงที่จะทำให้ผู้ใช้รู้สึกฟุ้งซ่านด้วยรายละเอียดมากเกินไปในเวลาเดียว ถึงแม้จะครอบคลุมทางเทคนิค การส่งมอบการจัดสรรที่เฉพาะเจาะจง กลยุทธ์การลงทุน และแผนการตรวจสอบอาจพิสูจน์เป็นทางที่ยากสำหรับผู้เริ่มต้นด้านการเงิน
คุณสามารถอ่านแผนที่เต็มของมันได้ที่นี่, และคุณสามารถใช้งานได้โดยคลิกที่ ลิงค์นี้. เราขอแนะนำให้ท่าน
โดยรวมแล้ว Google's Gemini agent creation platform ชนะการประกวดความสวยงามด้วยอินเทอร์เฟซที่เรียบง่ายและ intuitive ซึ่งทำให้การสร้างเอเจนต์รู้สึกง่ายเกินไปเกือบจะสุดโคตร ระบบจะทำตามคำสั่งอย่างยอดเยี่ยมซึ่งช่วยลดความสับสน และ UI ที่สะอาดช่วยลดปัจจัยที่ทำให้ผู้พัฒนา AI กลัว
อย่างไรก็ตาม จะต้องมีคำแนะนำที่ละเอียดมากขึ้นเพื่อให้ได้เอาเจ้ามือที่ดีขึ้นออกมา มันไม่ได้รับฟังสิ่งที่เป็นธรรมดา: คำแนะนำที่สั้นๆ จะให้คุณได้รับการตอบสนองที่คุณภาพต่ำ
Under the hood, it packs serious muscle—Google-powered web search integration, code analysis, and image processing capabilities that rival ChatGPT’s offerings, but mostly reliant on Microsoft’s technology.
หน้าต่างผู้ใช้ของ Gemini รู้สึกเหมือนถูกออกแบบโดยคนที่เข้าใจประสบการณ์ของผู้ใช้จริง อินเทอร์เฟซช่วยนำผู้ใช้ด้วยป้ายกำกับชัดเจนและทุกอย่างแสดงบนหน้าจอเพียงหนึ่งหน้าเท่านั้น
การเข้าถึงที่ดูดีและสมบูรณ์นี้ทำให้มันน่าสนใจมากสำหรับผู้เริ่มต้น แต่ผู้ใช้ที่มีประสบการณ์อาจพบว่าต้องการควบคุมเฉพาะเจาะจงมากขึ้น
เราเรียกตัวแทนของเราMoneyGemและขอแผนการเงิน วิธีการให้คำปรึกษาของมันเป็นการแสดงแนวคิดในการแก้ไขปัญหาของ Google ที่แตกต่างจากคนอื่น มันไม่ให้คำตอบอย่างตรงไปตรงมา แต่มันเริ่มด้วยคำถามเช่น "หนี้ของคุณเป็นแบบไหน?" และ "อัตราดอกเบี้ยของคุณเป็นเท่าไหร่?"—โดยแสดงให้เห็นว่าการให้คำปรึกษาทางการเงินไม่ใช่เรื่องที่เหมาะกับทุกคน
การเน้นการรวบรวมบริบทก่อนที่จะให้คำแนะนำสอดคล้องกับวิธีการวางแผนทางการเงินขั้นเทพ อย่างไรก็ตามอาจทำให้ผู้ใช้ที่ต้องการคำตอบทันทีรู้สึกผิดหวัง
คำตอบแบบศูนย์ไม่เป็นประโยชน์ เอเจนต์พื้นฐานกล่าวว่ามันไม่รู้เกี่ยวกับผู้ใช้เพียงพอที่จะให้คำแนะนำทางการเงินที่ดี หลังจากขอให้มันสมมติและบังคับมันให้ให้แผนที่สามารถเข้ากันกับสถานการณ์มากที่สุด เอเจนต์ก็สร้างแผนแบบอนุรักษ์มากๆโดยไม่ให้คำแนะนำเฉพาะเรื่องการลงทุนที่จะพิจารณา
MoneyGem แต่ละคำตอบจบด้วยการแนะนำให้ใช้บัญชีที่ได้รับประโยชน์จากภาษีเช่น 401(k) หรือ Roth IRA เพื่อลดภาระภาษีของคุณ ดีมาก
คุณสามารถคลิกที่นี่เพื่ออ่านปฏิสัมพันธ์ของเรากับ MoneyGem และลองโมเดลด้วยตัวคุณเองโดยการคลิกลิงค์นี้.
Mistral AI
วิธีการกำหนดค่าตัวแทนของ Mistral นั้นซับซ้อนเล็กน้อย โดยเครื่องมือสร้างตัวแทนถูกซ่อนอยู่ในคอนโซลของนักพัฒนา มีตัวเลือกการปรับแต่งลึกซึ้งที่อาจทำให้ผู้เริ่มต้นไม่กล้าออก แต่ทำให้ผู้ทดลองสนุกสนาน
อินเตอร์เฟซการสร้างตัวแทนของมันไม่ใช่ส่วนหนึ่งของ LeChat (อินเตอร์เฟซแชทบอท) แต่จะปรากฏขึ้นที่นั่นเมื่อมีการสร้างตัวแทน
สิ่งหนึ่งที่เราชอบมากคือความสามารถในการให้โปรแกรมด้วยตัวอย่างที่รูปร่างพฤติกรรมและสไตล์การตอบสนองของตัวแทนได้ - สิ่งที่แพลตฟอร์มอื่น ๆ ไม่ได้นำเสนอในปัจจุบัน นอกจากนี้ เราพบปัญหาแปลกๆ: ขณะที่เรากำลังสร้างตัวแทนของเรา อินเตอร์เฟซก็เปลี่ยนไปใช้ภาษาฝรั่งเศสโดยไม่คาดคิด อาจเป็นเพราะบริษัทเป็นบริษัทฝรั่งเศส อย่างไรก็ตาม เราไม่สามารถสลับกลับเป็นภาษาอังกฤษหรือภาษาสเปนได้
เมื่อสร้างเอเจนต์แล้ว ผู้ใช้จะต้องเรียกใช้ในอินเตอร์เฟซแชทบอทปกติเพื่อทำงานกับมัน พวกเขาต้องออกจาก Le Plateforme และไปที่ Le Chat ซึ่งไม่ได้เป็นสิ่งที่สะดวกสบายที่สุดที่จะทำ อย่างไรก็ตาม อินเตอร์เฟซสำหรับใช้เอเจนต์นั้นง่ายต่อการใช้งานและรู้สึกเหมือนกับแชทบอท AI อื่น ๆ
เราสร้างตัวแทนของเรา และตั้งชื่อLe Moneyเพื่อเกียรติ Mistral ที่มีรากฝรั่งเศส ประสิทธิภาพของมันแสดงให้เห็นชัดเจนถึงวิธีการแก้ปัญหาทั่วไปของ Mistral ข้อเสนอให้ "จอง $10,000 สำหรับฉุกเฉิน, $15,000 สำหรับการชดเชยหนี้, และ $10,000 สำหรับการลงทุน" ดูเหมือนจะเป็นเรื่องง่าย แต่แสดงให้เห็นว่าตัวแทนขาดการตรวจสอบทางคณิตศาสตร์พื้นฐานบางประการ
ยอดรวม $35,000 เกินกว่าเงินทุนที่มีอยู่ โดย $10,000 ซึ่งเป็นความผิดพื้นฐานที่บางรุ่นของภาษาแสดงออกเมื่อพวกเขาตั้งความสำคัญกับความถูกต้องทางคอนเซปต์มากกว่าความถูกต้องทางตัวเลข
เราต้องทราบอย่างไรก็ตามว่า LLMs ที่ทำงานดีที่สุดได้ปรับปรุงมาก และไม่ล้มเหลวในงานนี้บ่อยเท่าที่มิสทรัลทำ
นอกจากนี้แล้ว แผนของมันไม่ได้อธิบายอย่างละเอียด แต่มันเป็นแผนเดียวที่ให้คำถามเพิ่มเติมเพื่อทำให้การโต้ตอบมีความราบรื่นขึ้นและช่วยเข้าใจความต้องการของผู้ใช้ได้ดีขึ้น
แผนเต็มของ LeMoney พร้อมใช้งานที่นี่และตัวแทนพร้อมให้ทดสอบที่นี่.
Anthropic
โครงการของคลอดด์รู้สึกไม่เหมือนแพลตฟอร์มการสร้างเอเจนต์และมากขึ้นเหมือนระบบการดำเนินงานงานที่ซับซ้อน อินเตอร์เฟซเป็นขั้นต่ำเกือบจะขั้นต่ำเกินไปและไม่รู้สึกเป็นประสบการณ์ที่เข้าใจง่าย
อินเตอร์เฟซแบบมินิมัลนิสต์นี้อาจทำให้บางผู้ใช้งงงวย แพลตฟอร์มนี้มีการตั้งค่าแบบพื้นฐานพร้อมกับฟิลด์คำแนะนำที่ “ไม่บังคับ” ซึ่งรู้สึกว่าไม่สำคัญแต่ก็สำคัญพร้อมกัน: หากคำแนะนำถูกตั้งชื่อว่าไม่บังคับ แล้ว AI จะรู้ว่าต้องทำอะไร?
อินเตอร์เฟซแบบมินิมอลิสต์ของมันดูแปลก ๆ แต่ Anthropic ไม่เคยมีชื่อเสียงเรื่องการเลือก UI ที่ดี เวลาที่ใช้เพื่อกำหนดค่าโมเดลก็คือเวลาที่คุณใช้เพื่อกระตุ้นมัน ความสามารถของมันเน้นไปที่การอ่านโค้ดข้อความเป็นหลัก การค้นหาเว็บและการประมวลผลและสร้างภาพเป็นสิ่งที่ Anthropic ปล่อยให้คู่แข่งของมัน
ตัวแทนของเราชื่อ MoneyClaude ไม่สามารถทดสอบสาธารณะได้เนื่องจาก Anthropic ไม่อนุญาตให้เป็นเช่นนั้น มันต้องการที่จะให้คำแนะนำทางการเงินที่อยู่ในกรอบที่ระมัดระวังมาก ๆ โดยให้คำตอบที่ถูกต้องทางเทคนิค แต่ก็ยังมีคำตอบที่ไม่ชัดเจน เช่น “รักษาการเข้าใจในการลดหนี้และออมตังค์ที่สำคัญ” เป็นต้น
มันขอข้อมูลเพิ่มเติม แต่อย่างน้อยก็รับรองว่าจะให้กลยุทธ์ที่มีความทั่วไปมากในกรณีที่ขาดข้อมูลโดยไม่ต้องการการติดต่อเพิ่มเติม ซึ่งดูเหมือนจะเป็นทางเลือกที่ดีกว่าวิธีการของ Google
คลิกที่นี่เพื่ออ่านแผนเต็ม.
Hugging Face
ที่เก็บรายการซอร์สโค้ดแยกตัวอย่างเป็นสวรรค์ของผู้ใช้ที่มีพลังและอาจเป็นฮาโลวีนสำหรับผู้เริ่มต้น มันเป็นแพลทฟอร์มเดียวเท่านั้นที่ให้ผู้ใช้เลือกโมเดลภาษาที่พวกเขาต้องการ มอบควบคุมที่ไม่เคยเป็นมาก่อนเกี่ยวกับพื้นฐานของตัวแทน
นอกจากนี้ผู้ใช้สามารถใช้โดยใช้เครื่องมือที่แตกต่างกันได้มากมายกับตัวแทนของพวกเขา แต่สามารถเปิดใช้งานได้เพียงสามอย่างพร้อมกันเท่านั้น ข้อจำกัดนี้ทำให้ต้องพิจารณาอย่างรอบคอบว่าคุณลักษณะใดสำคัญที่สุดสำหรับแต่ละกรณีการใช้งานเฉพาะ แต่มันเป็นสิ่งที่ไม่มีรุ่นอื่นสามารถมอบให้ได้
นี่เป็นประสบการณ์ที่สามารถปรับแต่งได้มากที่สุดของอินเทอร์เฟซทั้งหมด แต่มีการปรับแต่งมากมายให้ปรับปรุง ผลลัพธ์คือแพลตฟอร์มที่สามารถสร้างตัวแทนที่มีพลังและความเชี่ยวชาญมากกว่าคู่แข่ง แต่เฉพาะในมือคนที่รู้สึกถึงสิ่งที่พวกเขากำลังทำอย่างแน่นอน
ผู้ใช้สามารถลองใช้ตัวแทนของพวกเขาบนกอดแชท—มือลงทุนฝีมือสูงเป็นความฝันของผู้ใช้งานที่สร้างเอเจนต์แล้ว การใช้งานมันก็ง่ายมาก อินเทอร์เฟซจะแสดงการ์ดใหญ่ที่มีชื่อเอเจนต์ คำอธิบาย และรูปภาพ และยังให้ผู้ใช้แชร์ลิงก์เอเจนต์และปรับแต่งการตั้งค่าได้ทั้งหมดที่ตามการ์ด
วางของเรา HuggingMoney’sการทดสอบเอเจนต์แสดงให้เห็นว่ามันจัดการด้วยกรอบเวลา โดยแสดงความเข้าใจที่ซับซ้อนขึ้นเกี่ยวกับจิตวิทยาการวางแผนการเงิน การแบ่งแยกเป็น "ระยะสั้น (0-24 เดือน), ระยะกลาง (24-60 เดือน), และระยะยาว (เกิน 60 เดือน)" สะท้อนการปฏิบัติการวางแผนการเงินของมืออาชีพ
ตัวแทนแนะนำการจัดสรร "$0-$5,000 เข้าสู่ยานพาหนะที่เป็นของเหลว ที่มีความเสี่ยงต่ำ" ในขณะที่ยังคงทำการชำระหนี้ที่มีความเป็นหนี้"$1,000-$1,500 ต่อเดือน" นี่เป็นสัญญาณของความเข้าใจที่ละเอียดอ่อนเกี่ยวกับการบริหารการไหลเงินทุนในมุมมองแรกเสมอ
คุณสมบัติที่น่าสนใจอีกอย่างคือการรวมเครื่องมือทางปฏิบัติกับคำแนะนำทฤษฎี ไม่เพียงแค่แนะนำ50/30/20ตามกฎระเบียบนั้น แอปที่แนะนำเฉพาะบัญชีงบประมาณและเน้นการปรับแต่งภาษี - สร้างสะพานระหว่างกลยุทธ์ระดับสูงและการดำเนินการประจำวัน ข้อเสียหลักคือ? มันรวมถึงการสมมติเกี่ยวกับอัตราดอกเบี้ยหนี้โดยไม่ได้ขอความชัดเจน
ในการพยายามให้คำแนะนำที่มีประโยชน์มากขึ้น มันถูกสรุปความสำคัญของสิ่งหลายอย่าง การกระตุ้นที่จะให้คำตอบไม่ว่าอะไรก็ตามสามารถแก้ไขได้ด้วยการกระตุ้น แต่ต้องคิดให้ดี
คุณสามารถอ่านแผนทั้งหมดของ HuggingMoney ได้ที่นี่นอกจากนี้คุณยังสามารถลองด้วยการคลิกที่ลิงค์นี้.