news Microsoft

Microsoft เปิดตัวโมเดล AI ใหม่ อาจท้าชิง GPT-4 และ Google Gemini

Prompt Expert

May 20, 2024 — 1 min read

Microsoft กำลังพัฒนา AI language model ขนาดใหญ่รุ่นใหม่ที่มีชื่อว่า MAI-1 ซึ่งอาจแข่งขันกับ model ระดับแนวหน้าจาก Google, Anthropic และ OpenAI ตามรายงานของ The Information นี่ถือเป็นครั้งแรกที่ไมโครซอฟท์พัฒนา AI model ขนาดใหญ่ภายในบริษัทเอง นับตั้งแต่ลงทุนกว่า 10,000 ล้านดอลลาร์ใน OpenAI เพื่อสิทธิ์ในการนำ AI models ของ startup มาใช้ซ้ำ GPT-4 ของ OpenAI ไม่เพียงขับเคลื่อน ChatGPT แต่ยังรวมถึง Microsoft Copilot ด้วย

การพัฒนา MAI-1 นำโดย Mustafa Suleyman อดีตผู้นำ AI ของ Google ซึ่งเพิ่งดำรงตำแหน่ง CEO ของ AI startup Inflection ก่อนที่ไมโครซอฟท์จะเข้าซื้อพนักงานส่วนใหญ่และทรัพย์สินทางปัญญาในราคา 650 ล้านดอลลาร์เมื่อเดือนมีนาคม แม้ว่า MAI-1 อาจต่อยอดจากเทคนิคที่นำมาโดยอดีตพนักงาน Inflection แต่มีรายงานว่าเป็น large language model (LLM) ใหม่ทั้งหมด

ตามการยืนยันโดยพนักงานไมโครซอฟท์ 2 คนที่คุ้นเคยกับโครงการนี้ ด้วย parameters ประมาณ 500,000 ล้านตัว MAI-1 จะมีขนาดใหญ่กว่า open source models ก่อนหน้าของไมโครซอฟท์อย่างมาก (เช่น Phi-3 ที่เราเคยกล่าวถึงเมื่อเดือนที่แล้ว) ซึ่งต้องใช้พลังการประมวลผลและข้อมูลสำหรับ training มากขึ้น รายงานระบุว่าสิ่งนี้ทำให้ MAI-1 อยู่ในระดับใกล้เคียงกับ GPT-4 ของ OpenAI ที่มีข่าวลือว่ามี parameters มากกว่า 1 ล้านล้านตัว (ในการกำหนดค่าแบบ mixture-of-experts) และสูงกว่า models ขนาดเล็กกว่าอย่าง Meta และ Mistral ที่มี parameters 70,000 ล้านตัวมาก

การพัฒนา MAI-1 บ่งชี้ถึงแนวทางคู่ขนานด้าน AI ภายในไมโครซอฟท์ ที่มุ่งเน้นทั้ง language models ขนาดเล็กที่รันบนอุปกรณ์พกพาและ models ขนาดใหญ่ระดับแนวหน้าที่ขับเคลื่อนด้วย cloud Apple ก็กำลังสำรวจแนวทางที่คล้ายกัน และยังเน้นให้เห็นถึงความเต็มใจของบริษัทที่จะสำรวจการพัฒนา AI อย่างเป็นอิสระจาก OpenAI ซึ่งเทคโนโลยีปัจจุบันขับเคลื่อนคุณสมบัติ generative AI ที่ทะเยอทะยานที่สุดของไมโครซอฟท์ รวมถึง chatbot ที่ฝังอยู่ใน Windows

มีรายงานว่ายังไม่มีการกำหนดวัตถุประสงค์ที่แน่ชัดของ MAI-1 (แม้แต่ภายในไมโครซอฟท์เอง) และการใช้งานที่เหมาะสมที่สุดจะขึ้นอยู่กับประสิทธิภาพ ตามแหล่งข้อมูลหนึ่งของ The Information ในการ train model ไมโครซอฟท์ได้จัดสรร cluster ขนาดใหญ่ของเซิร์ฟเวอร์ที่มี Nvidia GPUs และรวบรวมข้อมูล training จากแหล่งต่างๆ รวมถึงข้อความที่สร้างโดย GPT-4 ของ OpenAI และข้อมูลสาธารณะจากอินเทอร์เน็ต ขึ้นอยู่กับความคืบหน้าในสัปดาห์ต่อๆ ไป The Information รายงานว่าไมโครซอฟท์อาจแสดงตัวอย่าง MAI-1 ได้ตั้งแต่งานประชุมนักพัฒนา Build ในเดือนนี้

ข้อมูลอ้างอิงจาก New Microsoft AI model may challenge GPT-4 and Google Gemini