OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

OpenAI ประกาศเปิดตัวโมเดล AI ใหม่ชื่อ "o1" มีสองรุ่นคือ o1-preview และ o1-mini ออกแบบมาเพื่อการใช้เหตุผลและแก้ปัญหาที่ซับซ้อน มีประสิทธิภาพสูงในด้านวิทยาศาสตร์และการเขียนโค้ด พร้อมใช้งานแล้วสำหรับผู้ใช้ ChatGPT Plus

OpenAI เปิดตัวโมเดล AI ใหม่ "o1" สุดล้ำ

Key takeaway

  • OpenAI เปิดตัวโมเดล AI ใหม่ชื่อ "o1" มี 2 รุ่นคือ o1-preview และ o1-mini ที่มีความสามารถในการใช้เหตุผลและแก้ปัญหาซับซ้อนได้ดีกว่า GPT
  • o1-preview มีประสิทธิภาพระดับปริญญาเอกในหลายสาขา เช่น ฟิสิกส์ เคมี ชีววิทยา และการเขียนโค้ด ส่วน o1-mini เป็นเวอร์ชันที่มีประสิทธิภาพสูงขึ้นและราคาถูกลง เหมาะสำหรับงานด้าน STEM
  • OpenAI มีแผนพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป โดยจะเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ และการอัปโหลดไฟล์และรูปภาพในอนาคต

นับตั้งแต่การเปิดตัว GPT-4 ซึ่งเป็น large language model (LLM) ที่ทรงพลังของ OpenAI เมื่อเดือนมีนาคม 2023 - 18 เดือนที่แล้ว - ผู้ใช้และนักพัฒนาต่างสงสัยว่าเมื่อไหร่บริษัทที่จุดประกายกระแส generative AI ใน Silicon Valley และทั่วโลกจะเปิดตัวเวอร์ชันถัดไป ซึ่งคาดว่าจะเรียกว่า GPT-5

ปรากฏว่า ซีรีส์ GPT กำลังถูกก้าวข้ามไปด้วยตระกูลโมเดลใหม่ทั้งหมด

วันนี้ หลังจากมีรายงานและข่าวลือมาหลายเดือนซึ่งทวีความเข้มข้นขึ้นในช่วงไม่กี่วันที่ผ่านมา OpenAI ได้ประกาศตระกูลโมเดล AI "o1" โดยเริ่มต้นด้วยสองโมเดล: o1-preview และ o1-mini ซึ่งบริษัทกล่าวว่าได้รับการออกแบบมาเพื่อ "ใช้เหตุผลในการทำงานที่ซับซ้อนและแก้ปัญหาที่ยากกว่า" โมเดลในซีรีส์ GPT

ทั้งสองโมเดลพร้อมใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT Plus แต่ในช่วงแรกจำกัดที่ 30 ข้อความต่อสัปดาห์สำหรับ o1-preview และ 50 สำหรับ o1-mini

อย่างไรก็ตาม OpenAI เตือนว่า "ในฐานะโมเดลรุ่นแรก ยังไม่มีฟีเจอร์หลายอย่างที่ทำให้ ChatGPT มีประโยชน์ เช่น การท่องเว็บเพื่อค้นหาข้อมูลและการอัปโหลดไฟล์และรูปภาพ สำหรับกรณีทั่วไปหลายอย่าง GPT-4o จะมีความสามารถมากกว่าในระยะสั้น"

จากการทดสอบเบื้องต้นของเรา พบว่าไม่สามารถใช้สร้างภาพสำหรับบทความนี้ได้ บนเว็บไซต์แพลตฟอร์ม API ของ OpenAI บริษัทชี้แจงว่าในสถานะเบต้า ตระกูลโมเดลนี้รองรับ "ข้อความเท่านั้น ไม่รองรับรูปภาพ"

o1 ทำอะไรได้ดีกว่า GPT

OpenAI อ้างว่าซีรีส์ o1 ใหม่นี้เหมาะสำหรับผู้ใช้ที่ต้องการแก้ปัญหาที่ซับซ้อนในสาขาต่างๆ เช่น วิทยาศาสตร์ การดูแลสุขภาพ และเทคโนโลยี

OpenAI มองว่าโมเดลเหล่านี้จะถูกนำไปใช้ในแอปพลิเคชันที่หลากหลาย ตั้งแต่การช่วยนักฟิสิกส์สร้างสูตรคณิตศาสตร์สำหรับ quantum optics ไปจนถึงการช่วยนักวิจัยด้านการดูแลสุขภาพในการทำ annotation ข้อมูล cell sequencing

นักพัฒนาจะพบว่าโมเดล o1-mini มีประสิทธิภาพในการสร้างและดำเนินการ multi-step workflows การ debug โค้ด และการแก้ปัญหาการเขียนโปรแกรมอย่างมีประสิทธิภาพ

o1-preview มีประสิทธิภาพระดับปริญญาเอก

โมเดล o1-preview ได้รับการออกแบบมาเพื่อจัดการกับงานที่ท้าทายโดยใช้เวลามากขึ้นในการคิดและปรับปรุงคำตอบ คล้ายกับวิธีที่มนุษย์จะเข้าหาปัญหาที่ซับซ้อน

ในการทดสอบ วิธีการนี้ช่วยให้โมเดลสามารถทำงานได้ในระดับที่ใกล้เคียงกับนักศึกษาปริญญาเอกในสาขาต่างๆ เช่น ฟิสิกส์ เคมี และชีววิทยา

นอกจากนี้ โมเดล o1-preview ยังมีความเชี่ยวชาญในการเขียนโค้ด โดยอยู่ในเปอร์เซ็นต์ไทล์ที่ 89 ในการแข่งขัน Codeforces แสดงให้เห็นถึงความสามารถในการจัดการกับ multi-step workflows การ debug โค้ดที่ซับซ้อน และการสร้างโซลูชันที่แม่นยำ

ในงานทดสอบเกณฑ์มาตรฐานเช่นการสอบคัดเลือก International Mathematics Olympiad (IMO) o1-preview แสดงให้เห็นถึงความสามารถโดยแก้ปัญหาได้ 83% ของโจทย์ทั้งหมด ซึ่งเป็นการพัฒนาที่ดีขึ้นอย่างมากเมื่อเทียบกับอัตราความสำเร็จ 13% ของรุ่นก่อนหน้าอย่าง GPT-4o

โมเดลนี้พร้อมใช้งานแล้วใน ChatGPT สำหรับผู้ใช้ Plus และ Team โดยผู้ใช้ Enterprise และ Edu จะสามารถเข้าถึงได้ในสัปดาห์หน้า นอกจากนี้ โมเดลยังมีให้บริการผ่าน OpenAI API สำหรับนักพัฒนาที่มีคุณสมบัติตรงตาม API usage tier 5 แม้ว่าจะมีการจำกัดอัตราการใช้งานในช่วงแรก

o1-mini มีพลังน้อยกว่าแต่ราคาถูกกว่า 80%

ควบคู่ไปกับ o1-preview OpenAI ยังได้เปิดตัวโมเดล o1-mini ซึ่งเป็นเวอร์ชันที่มีประสิทธิภาพมากขึ้นเพื่อให้ความสามารถในการใช้เหตุผลที่เร็วขึ้นและราคาถูกลง

แม้ว่าจะได้รับการปรับให้เหมาะสมสำหรับงานด้านการเขียนโค้ดและ STEM เป็นหลัก แต่ o1-mini ยังคงมีประสิทธิภาพที่ดี โดยเฉพาะอย่างยิ่งในด้านคณิตศาสตร์และการเขียนโปรแกรม

ในการทดสอบเกณฑ์มาตรฐานคณิตศาสตร์ IMO o1-mini ทำคะแนนได้ 70% ซึ่งใกล้เคียงกับ 74% ของ o1-preview ในขณะที่มีต้นทุนการอนุมานที่ต่ำกว่ามาก นอกจากนี้ยังมีประสิทธิภาพที่แข่งขันได้ในการประเมินการเขียนโค้ด โดยได้คะแนน Elo 1650 บน Codeforces ซึ่งอยู่ในอันดับ 86% แรกของโปรแกรมเมอร์

ด้วยราคาที่ต่ำกว่า 80% เมื่อเทียบกับ o1-preview o1-mini มุ่งเป้าไปที่นักพัฒนาและนักวิจัยที่ต้องการความสามารถในการใช้เหตุผล แต่ไม่จำเป็นต้องมีความรู้ที่กว้างขวางเหมือนกับโมเดล o1-preview ที่ก้าวหน้ากว่า

โซลูชันที่คุ้มค่านี้จะมีให้บริการสำหรับผู้ใช้ ChatGPT Plus, Team, Enterprise และ Edu โดยมีแผนที่จะขยายการเข้าถึงไปยังผู้ใช้ ChatGPT Free ในอนาคต

การปรับปรุงด้านความปลอดภัยและความมั่นคง

สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ OpenAI ทั้งสองโมเดลได้รวมวิธีการฝึกอบรมด้านความปลอดภัยใหม่ที่เพิ่มความสามารถในการปฏิบัติตามแนวทางด้านความปลอดภัยและการปรับแนว

OpenAI เน้นย้ำว่า o1-preview ได้คะแนน 84 คะแนนในหนึ่งในการทดสอบ jailbreaking ที่ยากที่สุด ซึ่งเป็นการพัฒนาที่สำคัญเมื่อเทียบกับคะแนน 22 ของ GPT-4o ความสามารถในการใช้เหตุผลเกี่ยวกับกฎความปลอดภัยในบริบทช่วยให้โมเดลเหล่านี้จัดการกับ prompt ที่ไม่ปลอดภัยได้ดีขึ้นและหลีกเลี่ยงการสร้างเนื้อหาที่ไม่เหมาะสม

ในฐานะส่วนหนึ่งของความพยายามด้านความปลอดภัยในวงกว้าง OpenAI ได้เข้าทำข้อตกลงกับสถาบันความปลอดภัยด้าน AI ของสหรัฐอเมริกาและสหราชอาณาจักร

ความร่วมมือเหล่านี้รวมถึงการให้สิทธิ์เข้าถึงเวอร์ชันวิจัยของโมเดล o1 ก่อนกำหนดเพื่อช่วยในการประเมินและทดสอบระบบ AI ในอนาคต

งานด้านความปลอดภัยของ OpenAI ยังรวมถึงการกำกับดูแลภายในที่ครอบคลุมและการทำงานร่วมกับรัฐบาลกลาง ซึ่งเสริมด้วยการทดสอบเป็นประจำ การทำ red-teaming และการกำกับดูแลระดับคณะกรรมการจากคณะกรรมการความปลอดภัยและความมั่นคงของบริษัท

อะไรคือสิ่งที่จะเกิดขึ้นต่อไปสำหรับซีรีส์ o1 ของ OpenAI

แม้ว่าโมเดล o1-preview และ o1-mini จะเป็นเครื่องมือที่ทรงพลังสำหรับการใช้เหตุผลและการแก้ปัญหา แต่ OpenAI ยอมรับว่านี่เป็นเพียงจุดเริ่มต้นเท่านั้น

บริษัทมีแผนที่จะอัปเดตและปรับปรุงโมเดลเหล่านี้อย่างสม่ำเสมอ รวมถึงการเพิ่มฟีเจอร์ต่างๆ เช่น การท่องเว็บ การอัปโหลดไฟล์และรูปภาพ และการเรียกใช้ฟังก์ชัน ซึ่งปัจจุบันยังไม่มีในเวอร์ชัน API

มองไปข้างหน้า OpenAI จะยังคงพัฒนาทั้งซีรีส์ GPT และ o1 ต่อไป เพื่อขยายขีดความสามารถของ AI ในสาขาต่างๆ ผู้ใช้สามารถคาดหวังความก้าวหน้าอย่างต่อเนื่องในขณะที่บริษัททำงานเพื่อเพิ่มประโยชน์และการเข้าถึงโมเดลเหล่านี้ในแอปพลิเคชันต่างๆ

Why it matters

💡
ข่าวนี้น่าสนใจเพราะเป็นการเปิดตัวโมเดล AI รุ่นใหม่จาก OpenAI ที่มีความสามารถสูงกว่า GPT ในด้านการใช้เหตุผลและแก้ปัญหาซับซ้อน โดยเฉพาะในสาขา STEM และการเขียนโค้ด ผู้อ่านจะได้เรียนรู้ถึงความก้าวหน้าล่าสุดของเทคโนโลยี AI รวมถึงแนวโน้มการพัฒนาในอนาคต ซึ่งอาจส่งผลกระทบต่อหลายอุตสาหกรรมและการทำงานในยุคดิจิทัล การติดตามข่าวนี้จะช่วยให้เข้าใจและเตรียมพร้อมรับมือกับการเปลี่ยนแปลงที่กำลังจะเกิดขึ้น

Read more

ภาพรีแบรนด์ Google Bard เป็น Gemini พร้อมโลโก้ Google และไอคอน AI เช่น แปลภาษาและเอกสาร สะท้อนก้าวใหม่ของ Google

news

Google Gemini คืออะไร? AI model และ chatbot ทำงานอย่างไรในปี 2024

Google เปลี่ยนชื่อ AI จาก Bard เป็น Gemini พร้อมอัพเกรดความสามารถเพื่อแข่งขันกับ ChatGPT และ Claude ในตลาด AI ที่กำลังเติบโต สะท้อนความมุ่งมั่นของ Google ในการพัฒนาเทคโนโลยี AI อย่างต่อเนื่อง

By
NVIDIA เปิดตัว AI ใหม่เพื่อพัฒนาหุ่นยนต์มนุษย์ ภาพแสดงหุ่นยนต์ที่ทำงานร่วมกับมนุษย์บนคอมพิวเตอร์ สื่อถึงเทคโนโลยีล้ำสมัย

news

NVIDIA เปิดตัว AI ใหม่ที่มุ่งเป้าไปที่การฝึกหุ่นยนต์ลักษณะมนุษย์

NVIDIA เปิดตัวระบบ AI ใหม่เพื่อพัฒนาหุ่นยนต์มนุษย์ให้มีประสิทธิภาพมากขึ้น นับเป็นความก้าวหน้าครั้งสำคัญในวงการหุ่นยนต์ แม้จะมีความกังวลเรื่องจริยธรรมและความเสี่ยง แต่ก็เป็นพัฒนาการที่น่าติดตาม

By
ภาพคู่รักกอดกันในห้องนั่งเล่น ฉากจากหนัง “Here” ที่ใช้ AI ปฏิวัติเทคโนโลยีการถ่ายทำ สื่อถึงนวัตกรรมในวงการภาพยนตร์

news

ภาพยนตร์ "Here" ใช้ AI ปรับอายุนักแสดงแบบ real-time

TriStar Pictures เปิดตัวภาพยนตร์ "Here" ใช้ AI ปรับอายุนักแสดงนำแบบเรียลไทม์ตลอด 60 ปี นับเป็นก้าวสำคัญของการใช้ AI ในวงการภาพยนตร์ แม้จะมีข้อถกเถียงเรื่องจริยธรรม แต่เทคโนโลยีนี้กำลังเปิดโอกาสใหม่ๆ ให้วงการ

By
หญิงอเมริกันนั่งทำงานอย่างเครียด มีธงชาติสหรัฐฯ และคำว่า "Task Automation" สื่อถึงปัญหางานล้นและความคาดหวังให้ AI มาช่วย

news

นักคิดเชิงสร้างสรรค์พึ่งพา Generative AI มากขึ้นเมื่อภาระงานเพิ่มสูงขึ้น

รายงานล่าสุดเผยคนทำงานในสหรัฐฯ เผชิญปัญหางานล้น ปริมาณงานเพิ่มขึ้น 31% ในปีที่ผ่านมา หลายคนหันมาใช้ AI ช่วยงาน คาดว่าจะประหยัดเวลาได้ 4 ชั่วโมงต่อสัปดาห์ แต่องค์กรส่วนใหญ่ยังไม่พร้อมรับมือกับการใช้ AI ของพนักงาน

By