Meta เปิดตัวฮาร์ดแวร์ AI โอเพนซอร์สใหม่
Meta นำเสนอการออกแบบฮาร์ดแวร์ AI แบบโอเพนซอร์สล่าสุดในงาน OCP Global Summit 2024 รวมถึงแพลตฟอร์ม AI ใหม่ ตู้แร็คทันสมัย และอุปกรณ์เครือข่ายขั้นสูง เพื่อส่งเสริมความร่วมมือและนวัตกรรมในวงการ AI
Key takeaway
- เมต้าเปิดตัวนวัตกรรมฮาร์ดแวร์ AI แบบโอเพนซอร์สในงาน OCP Global Summit 2024 รวมถึงแพลตฟอร์ม AI, การออกแบบตู้แร็คทันสมัย และอุปกรณ์เครือข่ายขั้นสูง เพื่อส่งเสริมความร่วมมือและนวัตกรรมในวงการ AI
- บริษัทได้พัฒนาโมเดล AI ขนาดใหญ่อย่าง Llama 3.1 405B ซึ่งต้องใช้ GPU NVIDIA H100 มากกว่า 16,000 ตัวในการฝึกฝน และได้พัฒนาระบบคอมพิวเตอร์ประสิทธิภาพสูงพร้อมเครือข่ายแบนด์วิดท์สูงเพื่อรองรับการเติบโตนี้
- เมต้ามุ่งมั่นทำให้ AI เป็นโอเพนซอร์ส โดยเชื่อว่าความร่วมมือและการเปิดเผยจะช่วยผลักดันนวัตกรรม AI ให้ก้าวหน้ายิ่งขึ้น และนำประโยชน์ของ AI ไปสู่ผู้คนทั่วโลก
Meta ได้นำเสนอการออกแบบฮาร์ดแวร์ล่าสุดสำหรับ AI แบบโอเพนซอร์สในงาน Open Compute Project (OCP) Global Summit 2024 โดยมีนวัตกรรมใหม่ๆ ทั้งแพลตฟอร์ม AI, การออกแบบตู้แร็คที่ทันสมัย รวมถึงเครือข่ายและอุปกรณ์ขั้นสูง
บริษัทหวังว่าการเปิดเผยการออกแบบเหล่านี้จะสร้างแรงบันดาลใจให้เกิดความร่วมมือและส่งเสริมนวัตกรรมในวงการ AI ทั้งนี้ เมต้าเชิญชวนผู้ที่สนใจร่วมกำหนดอนาคตของฮาร์ดแวร์แบบเปิดสำหรับ AI รุ่นต่อไป
AI เป็นหัวใจสำคัญของบริการต่างๆ ที่เมต้ามอบให้กับผู้ใช้และธุรกิจมาเป็นเวลานาน โดยบริษัทได้พัฒนาโมเดล AI เพื่อปรับปรุงฟีเจอร์ต่างๆ เช่น ฟีดและระบบโฆษณา ล่าสุดบริษัทได้เปิดตัว Llama 3.1 405B ซึ่งเป็นโมเดลที่ใหญ่ที่สุดของเมต้า มีพารามิเตอร์ถึง 405 พันล้าน และสามารถรับข้อมูลนำเข้าได้สูงสุด 128,000 โทเค็น
ในการฝึกฝนโมเดลขนาดใหญ่เช่นนี้ เมต้าต้องใช้ GPU NVIDIA H100 มากกว่า 16,000 ตัว ซึ่งถือเป็นการขยายขนาดคลัสเตอร์ AI อย่างก้าวกระโดดจากเดิมที่เคยใช้ GPU เพียง 128 ตัว ปัจจุบันบริษัทมีคลัสเตอร์ขนาด 24,000 GPU สองชุดสำหรับฝึกฝนโมเดล AI
นอกจาก GPU แล้ว การเชื่อมต่อเครือข่ายก็มีความสำคัญไม่แพ้กัน เมต้าได้พัฒนาระบบคอมพิวเตอร์ประสิทธิภาพสูงที่มีเครือข่ายแบนด์วิดท์สูงเชื่อมต่อ GPU และตัวเร่งความเร็วทั้งหมดเข้าด้วยกัน โดยคาดว่าในอีกไม่กี่ปีข้างหน้า จะมีแบนด์วิดท์เพิ่มขึ้นเป็นระดับเทราไบต์ต่อวินาทีต่อตัวเร่งความเร็ว
เพื่อรองรับการเติบโตนี้ เมต้าจำเป็นต้องพัฒนาเครือข่ายประสิทธิภาพสูงแบบหลายชั้นที่สามารถควบคุมความแออัดได้ดี เพื่อให้ใช้ประโยชน์จากคลัสเตอร์ AI ได้อย่างเต็มที่
บริษัทได้เปิดตัว Catalina ซึ่งเป็นตู้แร็คประสิทธิภาพสูงสำหรับงาน AI โดยอ้างอิงจากแพลตฟอร์ม NVIDIA Blackwell และรองรับชิป NVIDIA GB200 Grace Blackwell Superchip รุ่นล่าสุด สามารถรองรับกำลังไฟฟ้าได้สูงถึง 140 กิโลวัตต์
นอกจากนี้ Meta ยังได้ขยายแพลตฟอร์ม Grand Teton ให้รองรับ AMD Instinct MI300X และพัฒนาระบบเครือข่าย Disaggregated Scheduled Fabric (DSF) สำหรับคลัสเตอร์ AI รุ่นถัดไป
Meta และ Microsoft ยังได้ร่วมมือกันพัฒนา Mount Diablo ซึ่งเป็นตู้แร็คจ่ายไฟแบบแยกส่วนรุ่นใหม่ที่ช่วยเพิ่มประสิทธิภาพและความสามารถในการขยายขนาดของโครงสร้างพื้นฐาน AI
Meta มุ่งมั่นที่จะทำให้ AI เป็นโอเพนซอร์ส เพื่อนำประโยชน์และโอกาสของ AI ไปสู่ผู้คนทั่วโลก โดยเชื่อว่าความร่วมมือและการเปิดเผยจะช่วยผลักดันนวัตกรรม AI ให้ก้าวหน้ายิ่งขึ้นสำนักข่าว IT รายงาน
ในยุคที่เทคโนโลยีปัญญาประดิษฐ์ (AI) กำลังเติบโตอย่างรวดเร็ว ผู้เชี่ยวชาญในวงการเทคโนโลยีต่างเน้นย้ำถึงความสำคัญของการพัฒนาแบบจำลองเปิดและเป็นมาตรฐาน (open and standardized models) เพื่อส่งเสริมการแบ่งปันความรู้และประสบการณ์ร่วมกัน ทำให้ AI เข้าถึงได้ง่ายขึ้น และลดอคติในระบบ
นอกจากนี้ ยังมีการเรียกร้องให้พัฒนาระบบฮาร์ดแวร์ AI แบบเปิด (open AI hardware) ซึ่งถือเป็นปัจจัยสำคัญในการสร้างโครงสร้างพื้นฐานที่มีประสิทธิภาพสูง คุ้มค่า และปรับตัวได้ อันเป็นรากฐานสำคัญสำหรับความก้าวหน้าของเทคโนโลยี AI
ทั้งนี้ Open Compute Project (OCP) ซึ่งเป็นชุมชนเปิดด้านเทคโนโลยี ได้เชิญชวนผู้ที่สนใจร่วมผลักดันอนาคตของระบบฮาร์ดแวร์ AI ให้เข้าร่วมกับโครงการดังกล่าว
การพัฒนา AI ทั้งในด้านซอฟต์แวร์และฮาร์ดแวร์บนพื้นฐานของ open source และการสร้างมาตรฐานร่วมกัน จะช่วยเร่งการพัฒนาและทำให้เทคโนโลยี AI เข้าถึงได้ง่ายขึ้นสำหรับทุกภาคส่วน ซึ่งจะส่งผลดีต่อการพัฒนาเทคโนโลยีในระยะยาว
Why it matters
ข้อมูลอ้างอิงจาก https://engineering.fb.com/2024/10/15/data-infrastructure/metas-open-ai-hardware-vision/