ทั่วไปVSแนวตั้งรุ่นใหญ่เข้าใกล้แต้มนัดแรก

ที่มา: Shenmou Finance ผู้เขียน | Zhang Wei

เครดิตรูปภาพ: สร้างโดยเครื่องมือ Unbounded AI

สมรภูมิสำหรับ AI megamodels กำลังแยกส่วน

ในฐานะฟิวส์ Chatgpt ได้เปิดประตูสู่ยุคของ AI2.0 และ AI2.0 นั้นโดดเด่นด้วย "ความฉลาดทางอุตสาหกรรมและการแปลงเป็นดิจิทัล" ซึ่งสามารถทดแทนแรงงานได้อย่างมีประสิทธิภาพและใช้กันอย่างแพร่หลายในทุกสาขาอาชีพ สำรวจ Metaverse ซึ่ง ได้ผ่านช่วงเวลาหลบหนีไปแล้ว การนำโมเดลขนาดใหญ่ของ AI มาใช้นั้นสมจริงยิ่งขึ้น

การแสดงออกโดยทั่วไปมากที่สุดคือโมเดล AI ขนาดใหญ่จะออกจากวงกลมในวงกว้างมากขึ้น ไม่ใช่แค่ด้าน B เท่านั้น ตัวอย่างเช่น แม้มีการเปิดตัว chatGPT มานานกว่าครึ่งปีแล้ว ผู้เขียนยังคงได้ยินเสียงของแรงงานข้ามชาติที่พูดถึง chatGPT ในร้านกาแฟชั้นล่างของ Shanghai CBD ตามรายงานของสื่อ บางบริษัทยังใช้ AIGC เป็น เครื่องมือเพิ่มผลผลิต

Zhang Yong ประธานและซีอีโอของ Alibaba Group และ CEO ของ Alibaba Cloud Intelligence Group กล่าวว่า เมื่อเผชิญกับยุค AI ผลิตภัณฑ์ทั้งหมดควรค่าแก่การทำซ้ำด้วยโมเดลขนาดใหญ่

โรงงานขนาดใหญ่ สถาบันวิจัยทางวิทยาศาสตร์ และผู้ประกอบการต่างก็ถึงจุดจบ

ผู้ผลิตรายใหญ่เช่น Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong และรุ่นใหญ่อื่น ๆ ตามมาด้วย Tencent Hunyuan, HKUST รุ่นใหญ่เช่น Xunfei Xinghuo กำลังรออยู่ เส้นที่จะออนไลน์

ผู้ประกอบการก็มีคนดังเช่นกัน Wang Xiaochuan ผู้ก่อตั้ง Sogou, Wang Huiwen ผู้ร่วมก่อตั้ง Meituan, Kaifu Li ประธาน Sinovation Works และคนอื่นๆ ปรากฏตัวในโมเดล AI ขนาดใหญ่ที่มีชื่อเสียงโด่งดัง

ความคลั่งไคล้โมเดลขนาดใหญ่ของ AI ที่กินเวลานานกว่าสองสามเดือนได้เกิดขึ้นสองเส้นทาง

การแข่งขันอาวุธ AI ความแตกต่างของรุ่นใหญ่

โมเดลขนาดใหญ่ของ AI ได้เข้าสู่เวทีการแข่งขันแล้ว และเส้นทางค่อยๆ แยกออกจากกัน

เนื่องจากโมเดล AI ค่อยๆ ร้อนขึ้น ตามสถิติของสื่อเมื่อต้นเดือนกุมภาพันธ์ มีเพียง 29 หุ้นในส่วน "ChatGPT" ของ Oriental Fortune และตอนนี้มีถึง 61 หุ้น และจำนวนยังคงเพิ่มขึ้น . ตามสถิติที่ไม่สมบูรณ์ ณ ตอนนี้ บริษัทและสถาบันมากกว่า 40 แห่งในประเทศของฉันได้เปิดตัวผลิตภัณฑ์แบบจำลองขนาดใหญ่หรือประกาศแผนการแบบจำลองขนาดใหญ่

ในหมู่พวกเขา ผู้เล่นที่เข้าร่วมใน "การแข่งขันอาวุธ" ของโมเดลขนาดใหญ่ของ AI ได้พัฒนาทิศทางการพัฒนาสองทิศทางเช่นกัน โมเดลขนาดใหญ่ในแนวตั้งและโมเดลขนาดใหญ่ทั่วไปกำลังกลายเป็นสองทิศทางการพัฒนาหลักในด้านปัญญาประดิษฐ์

โมเดลขนาดใหญ่ในแนวตั้งหมายถึงโมเดลที่ปรับให้เหมาะกับโดเมนหรืองานเฉพาะ เช่น การรู้จำเสียง การประมวลผลภาษาธรรมชาติ การจัดประเภทรูปภาพ เป็นต้น

ปัจจุบัน มีบริษัทจำนวนมากขึ้นเรื่อยๆ กำลังเข้าร่วมติดตามโมเดลขนาดใหญ่ในแนวตั้ง Xueersi ประกาศว่าบริษัทกำลังพัฒนาแบบจำลองทางคณิตศาสตร์ขนาดใหญ่ที่พัฒนาขึ้นเองในชื่อ MathGPT สำหรับผู้ชื่นชอบคณิตศาสตร์และสถาบันการวิจัยทางวิทยาศาสตร์ทั่วโลก เมื่อวันที่ 6 พฤษภาคม Taoyun Technology ได้ประกาศเปิดตัวแบบจำลองความรู้ความเข้าใจขนาดใหญ่สำหรับเด็ก - Alpha Egg Children's Cognitive Big โมเดลดังกล่าวนำเสนอประสบการณ์ใหม่แบบอินเทอร์แอคทีฟให้กับเด็กๆ ทั้งในด้านการฝึกการแสดงออก การปลูกฝัง EQ การสร้างแรงบันดาลใจในการสร้างสรรค์ และการช่วยเหลือการเรียนรู้

โมเดลขนาดใหญ่ทั่วไปหมายถึงโมเดลที่สามารถจัดการงานและโดเมนได้หลายอย่าง เช่น BERT, GPT เป็นต้น

เนื่องจากความได้เปรียบด้านเงินทุนและความสามารถ ผู้ผลิตรายใหญ่จึงมุ่งเป้าไปที่โมเดลขนาดใหญ่ที่ใช้งานทั่วไปเป็นหลัก

ผู้ผลิตรายใหญ่ตั้งเป้าไปที่โมเดลขนาดใหญ่ที่ใช้งานทั่วไป ในแง่หนึ่ง พวกเขาสามารถรวมความสามารถของ AI เข้ากับผลิตภัณฑ์ของตนเองได้ บริษัทอินเทอร์เน็ตและยักษ์ใหญ่ด้านเทคโนโลยีที่มีตัวแทนมากขึ้น เช่น อาลีบาบา หัวเว่ย และไป่ตู้

ตัวอย่างเช่น หลังจากการรวม GPT-4 ของ Microsoft เข้ากับ Office Family Bucket แล้ว "Tongyi Qianwen" ของ Ali ก็เริ่มเข้าถึง DingTalk ได้เช่นกัน ผู้ใช้สามารถสร้างเนื้อหาในเอกสารและในการประชุมทางวิดีโอผู้เข้าร่วมแต่ละคนสามารถสร้างมุมมองและเนื้อหาส่วนบุคคลได้

ตัวอย่างเช่น โมเดลขนาดใหญ่ของ Baidu ยังสามารถรวมเข้ากับธุรกิจของตนเองได้ "Wen Xin Yi Yan" สามารถมีการเปลี่ยนแปลงเชิงคุณภาพในการวนซ้ำของเครื่องมือค้นหา "Yuyan" ของ NetEase และ "ChatJD" ของ JD.com สามารถใช้เป็นอันดับแรกได้ อุตสาหกรรมของตนเอง

ในทางกลับกัน โมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปมีการใช้งานที่หลากหลาย และผู้ที่มีประสิทธิภาพสูงกว่าก่อนสามารถสร้างข้อได้เปรียบของผู้เสนอญัตติรายแรกและกลายเป็นผู้นำในยุค AI2.0 ท้ายที่สุด ทุกคนรู้ความจริงว่า "คนที่วิ่งเร็วจะได้เนื้อ คนที่วิ่งช้าจะได้กินแต่ของเหลือ"

โมเดลขนาดใหญ่ของแอปพลิเคชันแนวตั้งสามารถอธิบายได้ว่าเป็น "กระแสที่ชัดเจน" เนื่องจากแอปพลิเคชันขนาดใหญ่ในแนวตั้งนั้นสอดคล้องกับความต้องการของสถานการณ์แนวตั้งมากกว่าและมีคุณภาพสูงกว่าโมเดลขนาดใหญ่ทั่วไป หลายบริษัทจึงมองเห็นโอกาสเช่นกัน ตัวอย่างเช่น Shenlan, Mobvoi, Youdao และบริษัทอื่นๆ ที่มุ่งเน้นไปที่เส้นทาง AI ที่เฉพาะเจาะจง

การพัฒนาโมเดลแนวตั้งขนาดใหญ่ส่วนใหญ่สะท้อนให้เห็นในการปรับปรุงประสิทธิภาพของโมเดลในด้านต่างๆ อย่างต่อเนื่อง ตัวอย่างเช่น อัตราข้อผิดพลาดของการรู้จำเสียงลดลงทุกปีและความสามารถในการเข้าใจความหมายของการประมวลผลภาษาธรรมชาติก็ดีขึ้นอย่างต่อเนื่อง โมเดลขนาดใหญ่ทั่วไปมีความก้าวหน้าอย่างน่าทึ่งในการเรียนรู้แบบหลายงานและการเรียนรู้แบบถ่ายโอน และได้กลายเป็นแนวทางการวิจัยที่สำคัญในด้านการประมวลผลภาษาธรรมชาติ

ตัวอย่างเช่น แบบจำลองทางชีววิทยาขนาดใหญ่สามารถปรับปรุงประสิทธิภาพของเวชภัณฑ์ AI ได้ รายงานการวิจัยต่างประเทศแสดงให้เห็นว่า AI สามารถเพิ่มอัตราความสำเร็จของการวิจัยและพัฒนายาใหม่ได้ถึง 16.7% และการวิจัยและพัฒนายาที่มี AI ช่วยสามารถประหยัดค่าใช้จ่ายในการวิจัยและพัฒนาได้ถึง 54 พันล้านเหรียญสหรัฐทุกปี และประหยัด 40% ถึง 60% ของ เวลาและต้นทุนในกระบวนการหลักในการวิจัยและพัฒนา จากข้อมูลสาธารณะของ Nvidia การใช้เทคโนโลยี AI สามารถลดระยะเวลาที่จำเป็นสำหรับการค้นพบยาในระยะแรกถึงหนึ่งในสาม และประหยัดค่าใช้จ่ายถึงหนึ่งในสองร้อย

จากมุมมองของอุตสาหกรรม แบบจำลองทั่วไปคือ "สารานุกรม" ซึ่งสามารถตอบทุกคำถามและนำไปใช้กับดินอุตสาหกรรมต่างๆ ได้ ในขณะที่แบบจำลองแนวตั้งนั้นคล้ายกับผู้เชี่ยวชาญในสาขาเดียว แม้ว่าจะเป็นมืออาชีพ ถูกกำหนดให้เป็นคนจำนวนน้อย

ข้อมูลเป็นอันตรายถึงชีวิต

ข้อได้เปรียบของโมเดลขนาดใหญ่แนวตั้งคือไม่ "ใหญ่" เพียงพอ: พลังการประมวลผลไม่มากพอ และความยากของอัลกอริทึมต่ำ

หลังจากที่ Wang Xiaochuan เข้าสู่เส้นทางโมเดลขนาดใหญ่ เขาได้เน้นย้ำเสมอว่าทิศทางของความพยายามในอนาคตไม่ใช่การทำ AGI (ปัญญาประดิษฐ์ทั่วไป) เหมือน OpenAI แต่เพื่อสร้างโมเดลขนาดใหญ่ในแนวตั้งในฟิลด์เฉพาะบางฟิลด์ .

โมเดลขนาดใหญ่ในความหมายกว้างๆ จริงๆ แล้วอธิบายถึงโมเดลขนาดใหญ่ที่ใช้งานทั่วไป เช่นเดียวกับโมเดล "ใหญ่" สาเหตุที่โมเดลขนาดใหญ่ "ใหญ่" เป็นเพราะพารามิเตอร์จำนวนมากและข้อมูลจำนวนมหาศาล ซึ่ง มีผลกระทบอย่างมากต่ออัลกอริธึม พลังการประมวลผล และพื้นที่เก็บข้อมูล ข้อกำหนดขนาดใหญ่ และสิ่งเหล่านี้ไม่ใช่เฉพาะคนที่สามารถสร้างได้ แต่ยังต้องการเงินจำนวนมากด้วย คุณรู้ไหมว่าความสำเร็จของ Open AI นั้นสร้างโดย Microsoft ด้วยเงินหลายพันล้านดอลลาร์ ความต้องการเงินทุนจำนวนมหาศาลยังเป็นบททดสอบความมุ่งมั่นของผู้ผลิตรายใหญ่ในการวิจัยและพัฒนา

ในช่วง 5 ปีที่ผ่านมา ปริมาณพารามิเตอร์ของแบบจำลองขนาดใหญ่ของ AI เพิ่มขึ้นตามลำดับความสำคัญทุกปี ตัวอย่างเช่น ปริมาณพารามิเตอร์ของ GPT-4 เป็น 16 เท่าของ GPT-3 ซึ่งสูงถึง 1.6 ล้านล้าน และด้วยการเปิดตัว ของข้อมูลต่อเนื่องหลายรูปแบบ เช่น ภาพ เสียง และวิดีโอ ปริมาณข้อมูลของโมเดลขนาดใหญ่ก็ขยายตัวอย่างรวดเร็วเช่นกัน ซึ่งหมายความว่าหากคุณต้องการเล่นกับโมเดลขนาดใหญ่ คุณต้องมีกำลังการประมวลผลสูง

เมื่อเทียบกับผู้ผลิตรายใหญ่ บริษัทที่ผลิตโมเดลขนาดใหญ่แนวตั้งมีเงินทุน พลังการประมวลผล และข้อมูลที่ค่อนข้างขาดแคลน ดังนั้นพวกเขาจึงไม่ได้อยู่ในบรรทัดเริ่มต้นเดียวกันกับเครื่องเล่นโมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไป

เช่นเดียวกับที่รถยนต์พลังงานใหม่ไม่สามารถแยกออกจากส่วนประกอบหลักสามอย่างของมอเตอร์ แบตเตอรี่ และการควบคุมอิเล็กทรอนิกส์ โมเดลขนาดใหญ่ของ AI ก็ไม่สามารถแยกออกจากการรองรับกำลังการประมวลผล อัลกอริทึม และข้อมูลได้

ในบรรดาพลังการประมวลผล อัลกอริทึม และข้อมูล ข้อมูลคือความยากของโมเดลแนวตั้งขนาดใหญ่

ในบรรดาองค์ประกอบทั้งสามนี้ ความยากในการวิจัยและพัฒนาของอัลกอริทึมค่อนข้างต่ำ บริษัทในปัจจุบันมีอัลกอริทึมพาธของตนเองสำหรับการนำโมเดลขนาดใหญ่ไปใช้ และมีโครงการโอเพ่นซอร์สมากมายสำหรับการอ้างอิง

ชิปจะกำหนดพลังการประมวลผล โมเดล AI ขนาดใหญ่โดยรวมต้องการชิปประสิทธิภาพสูงกว่าเพื่อให้การฝึกอบรมและสร้างเครือข่ายประสาทของโมเดลโดยรวมเสร็จสมบูรณ์ อย่างไรก็ตาม ชิปในปัจจุบันมีการพัฒนาตัวเองน้อยกว่าและยังคงมาจากภายนอกเป็นหลัก ตัวอย่างเช่น ชิปที่เหมาะสมที่สุดสำหรับ ChatGPT มาจาก Nvidia ชิปเรือธง H100 และชิปย่อย A100

ความยากอยู่ที่ข้อมูล ข้อมูลคุณภาพสูงเป็นกุญแจสำคัญในการช่วยเหลือการฝึกอบรมและปรับแต่ง AI ข้อมูลที่เพียงพอและสมบูรณ์เป็นรากฐานของแบบจำลองขนาดใหญ่ของ AI เชิงกำเนิด

จากการเปิดเผยก่อนหน้านี้ของ OpenAI จำนวนพารามิเตอร์ ChatGPT3 เพียงอย่างเดียวมีถึง 175 พันล้าน และข้อมูลการฝึกอบรมมีถึง 45TB

เนื่องจากการพัฒนาที่ค่อนข้างสมบูรณ์ของอินเทอร์เน็ตบนมือถือของจีน ทรัพยากรข้อมูลของจีนจำนวนมากจึงถูกจัดเก็บไว้ในองค์กรหรือสถาบันต่างๆ ทำให้ยากต่อการแบ่งปัน

"เนื่องจากข้อมูลธุรกิจ ข้อมูลลอจิสติกส์ ข้อมูลการเงิน ฯลฯ ขององค์กรจำนวนมากเป็นข้อมูลโดเมนส่วนตัวหลัก จึงยากที่จะจินตนาการว่า China Star Optoelectronics หรือ PetroChina จะใช้ข้อมูลดังกล่าวเพื่อฝึกอบรมผู้อื่น" Xu Hui ซีอีโอของ Chuangxinqizhi ถูกสัมภาษณ์เมื่อเร็ว ๆ นี้ โดยหลักทรัพย์ ในการให้สัมภาษณ์กับไทม์ส เขายังกล่าวตรงไปตรงมา

ยกตัวอย่างอุตสาหกรรมยา AI แบบจำลองทางชีวภาพขนาดใหญ่ประสบปัญหาการ "ติด" ด้วยเทคโนโลยี ค่าใช้จ่ายในการรับข้อมูลการทดลองที่มีความแม่นยำสูงสำหรับการวิจัยและพัฒนายานั้นค่อนข้างสูงและมีข้อมูลที่ไม่มีป้ายกำกับจำนวนมากในฐานข้อมูลสาธารณะ จำเป็นต้องใช้ทั้งข้อมูลจำนวนมากที่ไม่มีป้ายกำกับและข้อมูลขนาดเล็กให้เป็นประโยชน์ จำนวนข้อมูลที่มีความแม่นยำสูง ดังนั้นความต้องการที่สูงขึ้นจึงถูกนำมาใช้สำหรับการสร้างแบบจำลอง

**ใครจะได้รับทองคำหม้อแรก? **

โดยไม่คำนึงถึงรูปแบบ การค้าเป็นประเด็นหลัก เมื่อพิจารณาจากผู้เล่น AI ในปัจจุบันที่มีโมเดลขนาดใหญ่ พวกเขากำลังพัฒนาขีดความสามารถและการค้าอย่างรวดเร็ว

แม้ว่าโมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปและโมเดลขนาดใหญ่ในแนวตั้งจะมีเส้นทางที่แตกต่างกัน แต่ก็ยังเป็น "ครอบครัว" โดยเนื้อแท้และอยู่ในเส้นทางเดียวกัน ดังนั้นจึงไม่สามารถหลีกเลี่ยงปัญหาการแข่งขันได้

สำหรับโมเดลขนาดใหญ่ทั่วไป โมเดลขนาดใหญ่แนวตั้งจะลงจอดก่อน และเส้นทางของโมเดลขนาดใหญ่ทั่วไปจะแคบลง ในทำนองเดียวกัน หลังจากที่โมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปเข้ายึดตลาดอย่างรวดเร็ว โมเดลขนาดใหญ่แนวตั้งที่มีสายธุรกิจแคบจะทำเงินได้ยากขึ้น

ในอุดมคติ ไม่ว่าจะเป็นแบบจำลองทางเศรษฐกิจหรือมูลค่าสากล แบบจำลองขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปจะดีกว่าแบบจำลองขนาดใหญ่ในแนวตั้ง อย่างไรก็ตาม ชีวิตจริงไม่ใช่ยูโทเปีย ใครจะวิ่งได้เร็วกว่าระหว่างโมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปและโมเดลขนาดใหญ่ในแนวตั้งขึ้นอยู่กับการแข่งขันระหว่างองค์กรต่างๆ

ตัดสินจาก AIGC ที่ร้อนแรงเมื่อปีที่แล้ว เมื่อเปรียบเทียบกับการอนุญาตให้ผู้ใช้ใช้ AI เพื่อสร้างเนื้อหาที่มีเกณฑ์ต่ำกว่าใน C-end ผู้เข้าร่วมตลาดบางรายเชื่อว่า B-end จะเป็นรูปแบบธุรกิจที่สำคัญกว่าของ AIGC

Huawei ยังให้ความสำคัญกับธุรกิจ ToB ของตัวเองมากขึ้น ในงานแถลงข่าว Huawei ระบุว่าโมเดลขนาดใหญ่ของ Huawei Pangu ส่วนใหญ่ใช้ AI เพื่อเสริมศักยภาพอุตสาหกรรมและใช้ในหลายอุตสาหกรรม เช่น พลังงานไฟฟ้า การเงิน และการเกษตร ในหมู่พวกเขา โมเดลขนาดใหญ่ CV ใช้ในเหมือง และ NLP แบบจำลองขนาดใหญ่ใช้ในการดึงเอกสารอัจฉริยะ

ตัวอย่างเช่น Baidu ซึ่งเชี่ยวชาญด้านเครื่องมือค้นหา ได้เปิดตัว Wenxin Yiyan ด้วยคุณลักษณะการค้นหาเช่น GPT-3

นอกจาก ChatGPT แล้ว ก่อนที่โมเดลขนาดใหญ่ของ AI จะมีมากมาย ยังมีฉากลงจอด โมเดล "ใหญ่" เหล่านี้จริงๆ แล้ว ส่วนใหญ่เป็นโมเดลขนาดใหญ่ในแนวตั้ง

โมเดลภาษา: เช่น GPT, BERT เป็นต้น ส่วนใหญ่ใช้ในด้านการประมวลผลภาษาธรรมชาติ เช่น การแปลด้วยคอมพิวเตอร์ การสร้างข้อความ การวิเคราะห์ความรู้สึก ฯลฯ แบบจำลองภาพ: เช่น ResNet, Inception เป็นต้น ซึ่งส่วนใหญ่ใช้ในด้านการมองเห็นของคอมพิวเตอร์ เช่น การจำแนกภาพ การตรวจจับเป้าหมาย การแบ่งส่วนภาพ เป็นต้น โมเดลคำแนะนำ: เช่น DNN, RNN เป็นต้น ซึ่งส่วนใหญ่ใช้ในด้านระบบคำแนะนำ เช่น คำแนะนำผลิตภัณฑ์และคำแนะนำโฆษณา Chatbots: เช่น Seq2Seq, Transformer เป็นต้น ซึ่งส่วนใหญ่จะใช้ในสถานการณ์ต่างๆ เช่น การบริการลูกค้าอัจฉริยะและผู้ช่วยอัจฉริยะ การควบคุมความเสี่ยงทางการเงิน: เช่น XGBoost, LightGBM เป็นต้น ซึ่งส่วนใหญ่จะใช้ในสถานการณ์การควบคุมความเสี่ยงของสถาบันการเงิน เช่น ธนาคารและหลักทรัพย์ เช่น การให้คะแนนเครดิตและการป้องกันการฉ้อโกง การวินิจฉัยภาพทางการแพทย์: เช่น DeepLung, DeepLesion เป็นต้น ซึ่งส่วนใหญ่ใช้ในด้านการวินิจฉัยภาพทางการแพทย์ เช่น การวินิจฉัยมะเร็งปอดและการวิเคราะห์ทางพยาธิวิทยา

การทำเงินสำคัญกว่าการลงจอด

ตามรายงานของ Guosheng Securities เรื่อง "พลังการประมวลผลที่จำเป็นสำหรับ ChatGPT" คาดว่าค่าใช้จ่ายในการฝึกอบรม GPT-3 อยู่ที่ประมาณ 1.4 ล้านดอลลาร์สหรัฐ และสำหรับ LLM (Large Language Model) ขนาดใหญ่บางแห่ง ค่าใช้จ่ายในการฝึกอบรมจะอยู่ระหว่าง 2 ล้านดอลลาร์สหรัฐและ 12 ล้านดอลลาร์สหรัฐระหว่าง จากจำนวนผู้เยี่ยมชม ChatGPT โดยเฉลี่ย 13 ล้านคนในเดือนมกราคม ความต้องการชิปที่เกี่ยวข้องคือ GPU NVIDIA A100 มากกว่า 30,000 ตัว เงินลงทุนเริ่มต้นประมาณ 800 ล้านดอลลาร์สหรัฐ และค่าไฟฟ้ารายวันประมาณ 50,000 ดอลลาร์สหรัฐฯ

ไม่ต้องสงสัยเลยว่าโมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไปถูกนำมาใช้กันอย่างแพร่หลายในสถานการณ์การลงจอดสำหรับผู้เล่นที่มั่นใจในโมเดลขนาดใหญ่สำหรับวัตถุประสงค์ทั่วไป การขายคือสอง โมเดลขนาดใหญ่ในแนวตั้งต้องการการค้าที่รวดเร็วกว่าเพื่อให้ครอบคลุมด้านล่าง เส้น ดังนั้นโมเดลขนาดใหญ่ในแนวตั้งจึงมีข้อได้เปรียบมากกว่า มีโอกาสสูงและอัตราการนำไปใช้ที่เร็วขึ้น

ไม่มีคำตอบที่แน่ชัดว่าใครจะได้เปรียบแน่นอนก่อนกัน "การแข่งขันด้านอาวุธ" ของโมเดลขนาดใหญ่ของ AI นี้เหมือนกับผีเสื้อที่เปลี่ยนจาก web1 เป็น web2 องค์กรต่างๆ กำลังแข่งกับเวลาและใครก็ตามที่คว้าโอกาสก่อนก็จะคว้าตลาด

ดูต้นฉบับ
  • รางวัล
  • แสดงความคิดเห็น
  • แชร์
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น