OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ
OpenAI ประกาศเปิดตัวโมเดล AI ใหม่ชื่อ "o1" มีสองรุ่นคือ o1-preview และ o1-mini ออกแบบมาเพื่อการใช้เหตุผลและแก้ปัญหาที่ซับซ้อน มีประสิทธิภาพสูงในด้านวิทยาศาสตร์และการเขียนโค้ด พร้อมใช้งานแล้วสำหรับผู้ใช้ ChatGPT Plus
Key takeaway
- OpenAI เปิดตัวโมเดล AI ใหม่ชื่อ "o1" มี 2 รุ่นคือ o1-preview และ o1-mini ที่มีความสามารถในการใช้เหตุผลและแก้ปัญหาซับซ้อนได้ดีกว่า GPT
- o1-preview มีประสิทธิภาพระดับปริญญาเอกในหลายสาขา เช่น ฟิสิกส์ เคมี ชีววิทยา และการเขียนโค้ด ส่วน o1-mini เป็นเวอร์ชันที่มีประสิทธิภาพสูงขึ้นและราคาถูกลง เหมาะสำหรับงานด้าน STEM
- OpenAI มีแผนพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป โดยจะเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ และการอัปโหลดไฟล์และรูปภาพในอนาคต
นับตั้งแต่การเปิดตัว GPT-4 ซึ่งเป็น large language model (LLM) ที่ทรงพลังของ OpenAI เมื่อเดือนมีนาคม 2023 - 18 เดือนที่แล้ว - ผู้ใช้และนักพัฒนาต่างสงสัยว่าเมื่อไหร่บริษัทที่จุดประกายกระแส generative AI ใน Silicon Valley และทั่วโลกจะเปิดตัวเวอร์ชันถัดไป ซึ่งคาดว่าจะเรียกว่า GPT-5
ปรากฏว่า ซีรีส์ GPT กำลังถูกก้าวข้ามไปด้วยตระกูลโมเดลใหม่ทั้งหมด
วันนี้ หลังจากมีรายงานและข่าวลือมาหลายเดือนซึ่งทวีความเข้มข้นขึ้นในช่วงไม่กี่วันที่ผ่านมา OpenAI ได้ประกาศตระกูลโมเดล AI "o1" โดยเริ่มต้นด้วยสองโมเดล: o1-preview และ o1-mini ซึ่งบริษัทกล่าวว่าได้รับการออกแบบมาเพื่อ "ใช้เหตุผลในการทำงานที่ซับซ้อนและแก้ปัญหาที่ยากกว่า" โมเดลในซีรีส์ GPT
ทั้งสองโมเดลพร้อมใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT Plus แต่ในช่วงแรกจำกัดที่ 30 ข้อความต่อสัปดาห์สำหรับ o1-preview และ 50 สำหรับ o1-mini
อย่างไรก็ตาม OpenAI เตือนว่า "ในฐานะโมเดลรุ่นแรก ยังไม่มีฟีเจอร์หลายอย่างที่ทำให้ ChatGPT มีประโยชน์ เช่น การท่องเว็บเพื่อค้นหาข้อมูลและการอัปโหลดไฟล์และรูปภาพ สำหรับกรณีทั่วไปหลายอย่าง GPT-4o จะมีความสามารถมากกว่าในระยะสั้น"
จากการทดสอบเบื้องต้นของเรา พบว่าไม่สามารถใช้สร้างภาพสำหรับบทความนี้ได้ บนเว็บไซต์แพลตฟอร์ม API ของ OpenAI บริษัทชี้แจงว่าในสถานะเบต้า ตระกูลโมเดลนี้รองรับ "ข้อความเท่านั้น ไม่รองรับรูปภาพ"
o1 ทำอะไรได้ดีกว่า GPT
OpenAI อ้างว่าซีรีส์ o1 ใหม่นี้เหมาะสำหรับผู้ใช้ที่ต้องการแก้ปัญหาที่ซับซ้อนในสาขาต่างๆ เช่น วิทยาศาสตร์ การดูแลสุขภาพ และเทคโนโลยี
OpenAI มองว่าโมเดลเหล่านี้จะถูกนำไปใช้ในแอปพลิเคชันที่หลากหลาย ตั้งแต่การช่วยนักฟิสิกส์สร้างสูตรคณิตศาสตร์สำหรับ quantum optics ไปจนถึงการช่วยนักวิจัยด้านการดูแลสุขภาพในการทำ annotation ข้อมูล cell sequencing
นักพัฒนาจะพบว่าโมเดล o1-mini มีประสิทธิภาพในการสร้างและดำเนินการ multi-step workflows การ debug โค้ด และการแก้ปัญหาการเขียนโปรแกรมอย่างมีประสิทธิภาพ
o1-preview มีประสิทธิภาพระดับปริญญาเอก
โมเดล o1-preview ได้รับการออกแบบมาเพื่อจัดการกับงานที่ท้าทายโดยใช้เวลามากขึ้นในการคิดและปรับปรุงคำตอบ คล้ายกับวิธีที่มนุษย์จะเข้าหาปัญหาที่ซับซ้อน
ในการทดสอบ วิธีการนี้ช่วยให้โมเดลสามารถทำงานได้ในระดับที่ใกล้เคียงกับนักศึกษาปริญญาเอกในสาขาต่างๆ เช่น ฟิสิกส์ เคมี และชีววิทยา
นอกจากนี้ โมเดล o1-preview ยังมีความเชี่ยวชาญในการเขียนโค้ด โดยอยู่ในเปอร์เซ็นต์ไทล์ที่ 89 ในการแข่งขัน Codeforces แสดงให้เห็นถึงความสามารถในการจัดการกับ multi-step workflows การ debug โค้ดที่ซับซ้อน และการสร้างโซลูชันที่แม่นยำ
ในงานทดสอบเกณฑ์มาตรฐานเช่นการสอบคัดเลือก International Mathematics Olympiad (IMO) o1-preview แสดงให้เห็นถึงความสามารถโดยแก้ปัญหาได้ 83% ของโจทย์ทั้งหมด ซึ่งเป็นการพัฒนาที่ดีขึ้นอย่างมากเมื่อเทียบกับอัตราความสำเร็จ 13% ของรุ่นก่อนหน้าอย่าง GPT-4o
โมเดลนี้พร้อมใช้งานแล้วใน ChatGPT สำหรับผู้ใช้ Plus และ Team โดยผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้ในสัปดาห์หน้า นอกจากนี้ โมเดลยังมีให้บริการผ่าน OpenAI API สำหรับนักพัฒนาที่มีคุณสมบัติตรงตาม API usage tier 5 แม้ว่าจะมีการจำกัดอัตราการใช้งานในช่วงแรก
o1-mini มีพลังน้อยกว่าแต่ราคาถูกกว่า 80%
ควบคู่ไปกับ o1-preview OpenAI ยังได้เปิดตัวโมเดล o1-mini ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพมากขึ้นเพื่อให้ความสามารถในการใช้เหตุผลที่เร็วขึ้นและราคาถูกลง
แม้ว่าจะได้รับการปรับให้เหมาะสมสำหรับงานด้านการเขียนโค้ดและ STEM เป็นหลัก แต่ o1-mini ยังคงมีประสิทธิภาพที่ดี โดยเฉพาะอย่างยิ่งในด้านคณิตศาสตร์และการเขียนโปรแกรม
ในการทดสอบเกณฑ์มาตรฐานคณิตศาสตร์ IMO o1-mini ทำคะแนนได้ 70% ซึ่งใกล้เคียงกับ 74% ของ o1-preview ในขณะที่มีต้นทุนการอนุมานที่ต่ำกว่ามาก นอกจากนี้ยังมีประสิทธิภาพที่แข่งขันได้ในการประเมินการเขียนโค้ด โดยได้คะแนน Elo 1650 บน Codeforces ซึ่งอยู่ในอันดับ 86% แรกของโปรแกรมเมอร์
ด้วยราคาที่ต่ำกว่า 80% เมื่อเทียบกับ o1-preview o1-mini มุ่งเป้าไปที่นักพัฒนาและนักวิจัยที่ต้องการความสามารถในการใช้เหตุผล แต่ไม่จำเป็นต้องมีความรู้ที่กว้างขวางเหมือนกับโมเดล o1-preview ที่ก้าวหน้ากว่า
โซลูชันที่คุ้มค่านี้จะมีให้บริการสำหรับผู้ใช้ ChatGPT Plus, Team, Enterprise และ Edu โดยมีแผนที่จะขยายการเข้าถึงไปยังผู้ใช้ ChatGPT Free ในอนาคต
การปรับปรุงด้านความปลอดภัยและความมั่นคง
สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ OpenAI ทั้งสองโมเดลได้รวมวิธีการฝึกอบรมด้านความปลอดภัยใหม่ที่เพิ่มความสามารถในการปฏิบัติตามแนวทางด้านความปลอดภัยและการปรับแนว
OpenAI เน้นย้ำว่า o1-preview ได้คะแนน 84 คะแนนในหนึ่งในการทดสอบ jailbreaking ที่ยากที่สุด ซึ่งเป็นการพัฒนาที่สำคัญเมื่อเทียบกับคะแนน 22 ของ GPT-4o ความสามารถในการใช้เหตุผลเกี่ยวกับกฎความปลอดภัยในบริบทช่วยให้โมเดลเหล่านี้จัดการกับ prompt ที่ไม่ปลอดภัยได้ดีขึ้นและหลีกเลี่ยงการสร้างเนื้อหาที่ไม่เหมาะสม
ในฐานะส่วนหนึ่งของความพยายามด้านความปลอดภัยในวงกว้าง OpenAI ได้เข้าทำข้อตกลงกับสถาบันความปลอดภัยด้าน AI ของสหรัฐอเมริกาและสหราชอาณาจักร
ความร่วมมือเหล่านี้รวมถึงการให้สิทธิ์เข้าถึงเวอร์ชันวิจัยของโมเดล o1 ก่อนกำหนดเพื่อช่วยในการประเมินและทดสอบระบบ AI ในอนาคต
งานด้านความปลอดภัยของ OpenAI ยังรวมถึงการกำกับดูแลภายในที่ครอบคลุมและการทำงานร่วมกับรัฐบาลกลาง ซึ่งเสริมด้วยการทดสอบเป็นประจำ การทำ red-teaming และการกำกับดูแลระดับคณะกรรมการจากคณะกรรมการความปลอดภัยและความมั่นคงของบริษัท
อะไรคือสิ่งที่จะเกิดขึ้นต่อไปสำหรับซีรีส์ o1 ของ OpenAI
แม้ว่าโมเดล o1-preview และ o1-mini จะเป็นเครื่องมือที่ทรงพลังสำหรับการใช้เหตุผลและการแก้ปัญหา แต่ OpenAI ยอมรับว่านี่เป็นเพียงจุดเริ่มต้นเท่านั้น
บริษัทมีแผนที่จะอัปเดตและปรับปรุงโมเดลเหล่านี้อย่างสม่ำเสมอ รวมถึงการเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ การอัปโหลดไฟล์และรูปภาพ และการเรียกใช้ฟังก์ชัน ซึ่งปัจจุบันยังไม่มีในเวอร์ชัน API
มองไปข้างหน้า OpenAI จะยังคงพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป เพื่อขยายขีดความสามารถของ AI ในสาขาต่างๆ ผู้ใช้สามารถคาดหวังความก้าวหน้าอย่างต่อเนื่องในขณะที่บริษัททำงานเพื่อเพิ่มประโยชน์และการเข้าถึงโมเดลเหล่านี้ในแอปพลิเคชันต่างๆ