OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

OpenAI ประกาศเปิดตัวโมเดล AI ใหม่ชื่อ "o1" มีสองรุ่นคือ o1-preview และ o1-mini ออกแบบมาเพื่อการใช้เหตุผลและแก้ปัญหาที่ซับซ้อน มีประสิทธิภาพสูงในด้านวิทยาศาสตร์และการเขียนโค้ด พร้อมใช้งานแล้วสำหรับผู้ใช้ ChatGPT Plus

OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

Key takeaway

  • OpenAI เปิดตัวโมเดล AI ใหม่ชื่อ "o1" มี 2 รุ่นคือ o1-preview และ o1-mini ที่มีความสามารถในการใช้เหตุผลและแก้ปัญหาซับซ้อนได้ดีกว่า GPT
  • o1-preview มีประสิทธิภาพระดับปริญญาเอกในหลายสาขา เช่น ฟิสิกส์ เคมี ชีววิทยา และการเขียนโค้ด ส่วน o1-mini เป็นเวอร์ชันที่มีประสิทธิภาพสูงขึ้นและราคาถูกลง เหมาะสำหรับงานด้าน STEM
  • OpenAI มีแผนพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป โดยจะเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ และการอัปโหลดไฟล์และรูปภาพในอนาคต

นับตั้งแต่การเปิดตัว GPT-4 ซึ่งเป็น large language model (LLM) ที่ทรงพลังของ OpenAI เมื่อเดือนมีนาคม 2023 - 18 เดือนที่แล้ว - ผู้ใช้และนักพัฒนาต่างสงสัยว่าเมื่อไหร่บริษัทที่จุดประกายกระแส generative AI ใน Silicon Valley และทั่วโลกจะเปิดตัวเวอร์ชันถัดไป ซึ่งคาดว่าจะเรียกว่า GPT-5

ปรากฏว่า ซีรีส์ GPT กำลังถูกก้าวข้ามไปด้วยตระกูลโมเดลใหม่ทั้งหมด

วันนี้ หลังจากมีรายงานและข่าวลือมาหลายเดือนซึ่งทวีความเข้มข้นขึ้นในช่วงไม่กี่วันที่ผ่านมา OpenAI ได้ประกาศตระกูลโมเดล AI "o1" โดยเริ่มต้นด้วยสองโมเดล: o1-preview และ o1-mini ซึ่งบริษัทกล่าวว่าได้รับการออกแบบมาเพื่อ "ใช้เหตุผลในการทำงานที่ซับซ้อนและแก้ปัญหาที่ยากกว่า" โมเดลในซีรีส์ GPT

ทั้งสองโมเดลพร้อมใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT Plus แต่ในช่วงแรกจำกัดที่ 30 ข้อความต่อสัปดาห์สำหรับ o1-preview และ 50 สำหรับ o1-mini

อย่างไรก็ตาม OpenAI เตือนว่า "ในฐานะโมเดลรุ่นแรก ยังไม่มีฟีเจอร์หลายอย่างที่ทำให้ ChatGPT มีประโยชน์ เช่น การท่องเว็บเพื่อค้นหาข้อมูลและการอัปโหลดไฟล์และรูปภาพ สำหรับกรณีทั่วไปหลายอย่าง GPT-4o จะมีความสามารถมากกว่าในระยะสั้น"

จากการทดสอบเบื้องต้นของเรา พบว่าไม่สามารถใช้สร้างภาพสำหรับบทความนี้ได้ บนเว็บไซต์แพลตฟอร์ม API ของ OpenAI บริษัทชี้แจงว่าในสถานะเบต้า ตระกูลโมเดลนี้รองรับ "ข้อความเท่านั้น ไม่รองรับรูปภาพ"

o1 ทำอะไรได้ดีกว่า GPT

OpenAI อ้างว่าซีรีส์ o1 ใหม่นี้เหมาะสำหรับผู้ใช้ที่ต้องการแก้ปัญหาที่ซับซ้อนในสาขาต่างๆ เช่น วิทยาศาสตร์ การดูแลสุขภาพ และเทคโนโลยี

OpenAI มองว่าโมเดลเหล่านี้จะถูกนำไปใช้ในแอปพลิเคชันที่หลากหลาย ตั้งแต่การช่วยนักฟิสิกส์สร้างสูตรคณิตศาสตร์สำหรับ quantum optics ไปจนถึงการช่วยนักวิจัยด้านการดูแลสุขภาพในการทำ annotation ข้อมูล cell sequencing

นักพัฒนาจะพบว่าโมเดล o1-mini มีประสิทธิภาพในการสร้างและดำเนินการ multi-step workflows การ debug โค้ด และการแก้ปัญหาการเขียนโปรแกรมอย่างมีประสิทธิภาพ

o1-preview มีประสิทธิภาพระดับปริญญาเอก

โมเดล o1-preview ได้รับการออกแบบมาเพื่อจัดการกับงานที่ท้าทายโดยใช้เวลามากขึ้นในการคิดและปรับปรุงคำตอบ คล้ายกับวิธีที่มนุษย์จะเข้าหาปัญหาที่ซับซ้อน

ในการทดสอบ วิธีการนี้ช่วยให้โมเดลสามารถทำงานได้ในระดับที่ใกล้เคียงกับนักศึกษาปริญญาเอกในสาขาต่างๆ เช่น ฟิสิกส์ เคมี และชีววิทยา

นอกจากนี้ โมเดล o1-preview ยังมีความเชี่ยวชาญในการเขียนโค้ด โดยอยู่ในเปอร์เซ็นต์ไทล์ที่ 89 ในการแข่งขัน Codeforces แสดงให้เห็นถึงความสามารถในการจัดการกับ multi-step workflows การ debug โค้ดที่ซับซ้อน และการสร้างโซลูชันที่แม่นยำ

ในงานทดสอบเกณฑ์มาตรฐานเช่นการสอบคัดเลือก International Mathematics Olympiad (IMO) o1-preview แสดงให้เห็นถึงความสามารถโดยแก้ปัญหาได้ 83% ของโจทย์ทั้งหมด ซึ่งเป็นการพัฒนาที่ดีขึ้นอย่างมากเมื่อเทียบกับอัตราความสำเร็จ 13% ของรุ่นก่อนหน้าอย่าง GPT-4o

โมเดลนี้พร้อมใช้งานแล้วใน ChatGPT สำหรับผู้ใช้ Plus และ Team โดยผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้ในสัปดาห์หน้า นอกจากนี้ โมเดลยังมีให้บริการผ่าน OpenAI API สำหรับนักพัฒนาที่มีคุณสมบัติตรงตาม API usage tier 5 แม้ว่าจะมีการจำกัดอัตราการใช้งานในช่วงแรก

o1-mini มีพลังน้อยกว่าแต่ราคาถูกกว่า 80%

ควบคู่ไปกับ o1-preview OpenAI ยังได้เปิดตัวโมเดล o1-mini ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพมากขึ้นเพื่อให้ความสามารถในการใช้เหตุผลที่เร็วขึ้นและราคาถูกลง

แม้ว่าจะได้รับการปรับให้เหมาะสมสำหรับงานด้านการเขียนโค้ดและ STEM เป็นหลัก แต่ o1-mini ยังคงมีประสิทธิภาพที่ดี โดยเฉพาะอย่างยิ่งในด้านคณิตศาสตร์และการเขียนโปรแกรม

ในการทดสอบเกณฑ์มาตรฐานคณิตศาสตร์ IMO o1-mini ทำคะแนนได้ 70% ซึ่งใกล้เคียงกับ 74% ของ o1-preview ในขณะที่มีต้นทุนการอนุมานที่ต่ำกว่ามาก นอกจากนี้ยังมีประสิทธิภาพที่แข่งขันได้ในการประเมินการเขียนโค้ด โดยได้คะแนน Elo 1650 บน Codeforces ซึ่งอยู่ในอันดับ 86% แรกของโปรแกรมเมอร์

ด้วยราคาที่ต่ำกว่า 80% เมื่อเทียบกับ o1-preview o1-mini มุ่งเป้าไปที่นักพัฒนาและนักวิจัยที่ต้องการความสามารถในการใช้เหตุผล แต่ไม่จำเป็นต้องมีความรู้ที่กว้างขวางเหมือนกับโมเดล o1-preview ที่ก้าวหน้ากว่า

โซลูชันที่คุ้มค่านี้จะมีให้บริการสำหรับผู้ใช้ ChatGPT Plus, Team, Enterprise และ Edu โดยมีแผนที่จะขยายการเข้าถึงไปยังผู้ใช้ ChatGPT Free ในอนาคต

การปรับปรุงด้านความปลอดภัยและความมั่นคง

สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ OpenAI ทั้งสองโมเดลได้รวมวิธีการฝึกอบรมด้านความปลอดภัยใหม่ที่เพิ่มความสามารถในการปฏิบัติตามแนวทางด้านความปลอดภัยและการปรับแนว

OpenAI เน้นย้ำว่า o1-preview ได้คะแนน 84 คะแนนในหนึ่งในการทดสอบ jailbreaking ที่ยากที่สุด ซึ่งเป็นการพัฒนาที่สำคัญเมื่อเทียบกับคะแนน 22 ของ GPT-4o ความสามารถในการใช้เหตุผลเกี่ยวกับกฎความปลอดภัยในบริบทช่วยให้โมเดลเหล่านี้จัดการกับ prompt ที่ไม่ปลอดภัยได้ดีขึ้นและหลีกเลี่ยงการสร้างเนื้อหาที่ไม่เหมาะสม

ในฐานะส่วนหนึ่งของความพยายามด้านความปลอดภัยในวงกว้าง OpenAI ได้เข้าทำข้อตกลงกับสถาบันความปลอดภัยด้าน AI ของสหรัฐอเมริกาและสหราชอาณาจักร

ความร่วมมือเหล่านี้รวมถึงการให้สิทธิ์เข้าถึงเวอร์ชันวิจัยของโมเดล o1 ก่อนกำหนดเพื่อช่วยในการประเมินและทดสอบระบบ AI ในอนาคต

งานด้านความปลอดภัยของ OpenAI ยังรวมถึงการกำกับดูแลภายในที่ครอบคลุมและการทำงานร่วมกับรัฐบาลกลาง ซึ่งเสริมด้วยการทดสอบเป็นประจำ การทำ red-teaming และการกำกับดูแลระดับคณะกรรมการจากคณะกรรมการความปลอดภัยและความมั่นคงของบริษัท

อะไรคือสิ่งที่จะเกิดขึ้นต่อไปสำหรับซีรีส์ o1 ของ OpenAI

แม้ว่าโมเดล o1-preview และ o1-mini จะเป็นเครื่องมือที่ทรงพลังสำหรับการใช้เหตุผลและการแก้ปัญหา แต่ OpenAI ยอมรับว่านี่เป็นเพียงจุดเริ่มต้นเท่านั้น

บริษัทมีแผนที่จะอัปเดตและปรับปรุงโมเดลเหล่านี้อย่างสม่ำเสมอ รวมถึงการเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ การอัปโหลดไฟล์และรูปภาพ และการเรียกใช้ฟังก์ชัน ซึ่งปัจจุบันยังไม่มีในเวอร์ชัน API

มองไปข้างหน้า OpenAI จะยังคงพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป เพื่อขยายขีดความสามารถของ AI ในสาขาต่างๆ ผู้ใช้สามารถคาดหวังความก้าวหน้าอย่างต่อเนื่องในขณะที่บริษัททำงานเพื่อเพิ่มประโยชน์และการเข้าถึงโมเดลเหล่านี้ในแอปพลิเคชันต่างๆ

Why it matters

💡
ข่าวนี้น่าสนใจเพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถสูงกว่า GPT ในด้านการใช้เหตุผลและแก้ปัญหาซับซ้อน โดยเฉพาะในสาขา STEM และการเขียนโค้ด ผู้อ่านจะได้เรียนรู้ถึงความก้าวหน้าล่าสุดของเทคโนโลยี AI รวมถึงแนวโน้มการพัฒนาในอนาคต ซึ่งอาจส่งผลกระทบต่อหลายอุตสาหกรรมและการทำงานในยุคดิจิทัล การติดตามข่าวนี้จะช่วยให้เข้าใจและเตรียมพร้อมรับมือกับการเปลี่ยนแปลงที่กำลังจะเกิดขึ้น

Read more

เอลอน มัสก์ เผย AI จะเหนือกว่าแพทย์และทนายความ หลัง ChatGPT เอาชนะการวินิจฉัยทางการแพทย์ — มนุษย์จะกลายเป็นระบบสำรองแบบ 'ชีวภาพ'

news

เอลอน มัสก์ เผย AI จะเหนือกว่าแพทย์และทนายความ หลัง ChatGPT เอาชนะการวินิจฉัยทางการแพทย์ — มนุษย์จะกลายเป็นระบบสำรองแบบ 'ชีวภาพ'

อีลอน มัสก์คาดการณ์ว่า AI จะมีความสามารถเหนือกว่าแพทย์และทนายความในอนาคต หลังผลการศึกษาพบว่า ChatGPT-4 มีความแม่นยำในการวินิจฉัยโรคสูงถึง 90% เทียบกับ 74% ของแพทย์ ส่งผลกระทบต่อวิชาชีพที่ใช้ความรู้เป็นหลัก

By
พนักงาน AI: อนาคตแรงงานองค์กรตามวิสัยทัศน์ของ Nvidia พร้อมเทคโนโลยีล้ำสมัยที่ช่วยขับเคลื่อนการทำงานและประสิทธิภาพในยุคดิจิทัล

news

CEO Nvidia คาดการณ์ "พนักงาน AI" จะเป็นส่วนหนึ่งของแรงงานองค์กรในอนาคตอันใกล้

Jensen Huang ซีอีโอ Nvidia เผยวิสัยทัศน์ "พนักงาน AI" จะกลายเป็นส่วนสำคัญของแรงงานองค์กรในเร็วๆ นี้ ทำงานหลากหลายตั้งแต่การตลาดถึงการจัดการห่วงโซ่อุปทาน เพิ่มประสิทธิภาพทุกตำแหน่งงาน ช่วยรักษาการจ้างงานและเพิ่มผลิตภาพ

By
The Beatles ชิงรางวัล Grammy ด้วยเพลงที่สร้างจาก AI นำเสนอผลงานสุดล้ำในวงการดนตรี ผสานเทคโนโลยีกับศิลปะคลาสสิก

news

The Beatles สร้างประวัติศาสตร์ เพลงที่ใช้ AI ช่วยได้รับการเสนอชื่อชิงรางวัลแกรมมี่

The Beatles ได้รับการเสนอชื่อเข้าชิงรางวัล Grammy ด้วยเพลง 'Now and Then' ที่ใช้ AI ช่วยสร้าง เผยให้เห็นบทบาทของ AI ในการอนุรักษ์มรดกทางดนตรีและสร้างนวัตกรรมใหม่ พร้อมตัวอย่างการใช้ AI ในวงการดนตรีจากศิลปินอื่นๆ

By
Google Maps เตรียมเพิ่มประสิทธิภาพด้วย AI Gemini เพื่อช่วยให้การนำทางแม่นยำและตอบโจทย์ผู้ใช้มากขึ้น

news

Google Maps ได้รับการอัปเกรดด้วย AI เพื่อแข่งขันกับ Apple

Google กำลังจะนำ AI Gemini มาเสริมทัพให้ Google Maps เพื่อให้ผู้ใช้สามารถได้รับคำตอบสำหรับคำถามที่ซับซ้อนเกี่ยวกับโลกรอบตัวได้ดียิ่งขึ้น สะท้อนความพยายามในการรักษาความเป็นผู้นำในตลาดแอปนำทาง และตอบโต้การพัฒนา AI ของ Apple

By