Runway เปิดตัว AI Video Generator Gen-3 ได้รับการชื่นชมล้นหลาม

Runway ได้ปล่อยตัวอย่างเครื่องมือ AI รุ่นใหม่ล่าสุด ลื่นไหล สมจริง และ "ดีกว่า Sora" ซึ่งเป็น AI ตัวก่อนหน้านี้ของบริษัท

Runway เปิดตัว AI Video Generator Gen-3 ได้รับการชื่นชมล้นหลาม

Key Takeaways

  • Runway ได้เปิดตัว AI Video Generator รุ่นใหม่ล่าสุด Gen-3 ซึ่งมีความก้าวหน้าอย่างมากในด้านความสมจริง ความสอดคล้อง และการปฏิบัติตาม prompt เมื่อเทียบกับรุ่นก่อนหน้า
  • ผู้ใช้งานชื่นชม Gen-3 ว่าสร้างวิดีโอที่ดูสมจริงมาก โดยเฉพาะใบหน้ามนุษย์ บางคนเห็นว่าดีกว่า Sora ของ OpenAI ซึ่งยังไม่ได้เปิดตัว
  • Gen-3 จะขับเคลื่อนเครื่องมือต่างๆ ของ Runway และมีแผนเพิ่มความสามารถในการควบคุมโครงสร้าง สไตล์ และการเคลื่อนไหวได้ละเอียดขึ้น โดยมีเป้าหมายสร้าง "General World Models" ที่ทำให้ AI จำลองเหตุการณ์ในอนาคตได้
  • คู่แข่งในตลาด AI Video Generator มีมากขึ้น ทั้ง Sora, Kling, Dream Machine รวมถึงโมเดลโอเพ่นซอร์สอย่าง Stable Video Diffusion และ Vidu แต่ Runway ยังคงเป็นผู้นำในด้านคุณภาพและความสามารถ

บริษัท Runway ผู้นำด้าน AI ที่มีชื่อเสียงจากเครื่องมือสร้างวิดีโอ (generative video tool) ได้เปิดตัว Runway Gen-3 รุ่นใหม่ล่าสุด ซึ่งยังอยู่ในช่วง alpha และยังไม่เปิดให้ใช้งานสาธารณะ โดยได้มีการสาธิตผ่านตัวอย่างวิดีโอที่แสดงให้เห็นถึงความก้าวหน้าอย่างมากในด้านความสอดคล้อง ความสมจริง และการปฏิบัติตาม prompt เมื่อเทียบกับ Gen-2 ที่ใช้งานอยู่ในปัจจุบัน

วิดีโอที่สร้างขึ้น โดยเฉพาะอย่างยิ่งที่มีใบหน้ามนุษย์ มีความสมจริงสูงมาก จนสมาชิกในชุมชน AI art รีบเปรียบเทียบในทางที่ดีกับ Sora ของ OpenAI ซึ่งยังไม่ได้เปิดตัวแต่ก็เป็นที่คาดหวังอย่างสูง

"ถึงแม้ว่าจะเป็นการเลือกสรรมาแล้ว แต่ก็ยังดูดีกว่า Sora อยู่ดี" ผู้ใช้ Reddit รายหนึ่งเขียนในความคิดเห็นที่ได้รับโหวตสูงสุดในกระทู้อภิปราย Runway Gen-3 "Sora มีลักษณะและความรู้สึกที่ดัดแปลงไปจากความเป็นจริง" ผู้ใช้อีกรายหนึ่งตอบ "คนเหล่านี้ดูเหมือนจริง ดีที่สุดที่ผมเคยเห็นมา"

"ถ้าคุณแสดงภาพคนที่สร้างขึ้นเหล่านี้ให้ผมดู ผมคงคิดว่ามันเป็นของจริง" ความเห็นอื่น ๆ ใน AI Video subreddit ที่มีสมาชิก 66,000 คนระบุ

หน้าเว็บไซต์ Runway แสดงเครื่องมือ AI สำหรับการสร้างและสำรวจภาพ วิดีโอ และเสียง พร้อมการเปิดตัว Gen-3 Alpha เพื่อการสร้างสื่อที่ควบคุมได้อย่างรวดเร็ว

"คลิป Runway GEN-3 เหล่านี้มีความน่าสนใจทางภาพอย่างมากสำหรับผม - พวกเขาดูเหมือนหนังเลย" PZF ผู้สร้างภาพยนตร์ AI นามแฝง ซึ่งระบุตัวเองเป็นพันธมิตรด้านความคิดสร้างสรรค์ของ Runway ทวีต "นุ่มนวล เรียบง่าย (ในความหมายที่ดี เป็นธรรมชาติ) และน่าเชื่อถือ"

นอกเหนือจาก text-to-video generator รุ่น Gen-3 แล้ว Runway ยังนำเสนอชุดเครื่องมือ fine-tuning รวมถึงการควบคุมภาพและกล้องที่ยืดหยุ่นมากขึ้น

"Gen-3 Alpha จะขับเคลื่อน text-to-video, image-to-video และ text-to-image tools ของ Runway, รวมถึง control modes ที่มีอยู่เดิม เช่น Motion Brush, Advanced Camera Controls และ Director Mode ตลอดจนเครื่องมือที่กำลังจะมาถึงเพื่อให้สามารถควบคุมโครงสร้าง สไตล์ และการเคลื่อนไหวได้ละเอียดยิ่งขึ้น" บริษัทโพสต์ทวีต

Runway อ้างว่า Gen-3 เป็นก้าวสำคัญในการทำให้เป้าหมายอันทะเยอทะยานของพวกเขาในการสร้าง "General World Models" เป็นจริง โมเดลเหล่านี้จะทำให้ระบบ AI สามารถสร้างการแสดงแทนภายในของสภาพแวดล้อม และใช้มันเพื่อจำลองเหตุการณ์ในอนาคตภายในสภาพแวดล้อมนั้น วิธีการนี้จะทำให้ Runway แตกต่างจากเทคนิคทั่วไปที่มุ่งเน้นไปที่การทำนายเฟรมถัดไปที่น่าจะเกิดขึ้นในไทม์ไลน์เฉพาะ

แม้ว่า Runway จะไม่ได้เปิดเผยวันที่เปิดตัว Gen-3 โดยเฉพาะ แต่ Anastasis Germanidis ผู้ร่วมก่อตั้งและ CTO ประกาศว่า Gen-3 Alpha "จะเปิดให้ใช้งานใน Runway product ในเร็วๆ นี้" ซึ่งรวมถึงโหมดที่มีอยู่ รวมทั้ง "โหมดใหม่บางอย่างที่เป็นไปได้เฉพาะกับ base model ที่มีความสามารถมากขึ้นเท่านั้น" เขาเกริ่นไว้

การเดินทางของ Runway ในโลก AI เริ่มต้นขึ้นในปี 2021 เมื่อพวกเขาร่วมมือกับนักวิจัยจากมหาวิทยาลัยมิวนิคเพื่อสร้าง Stable Diffusion เวอร์ชันแรก ต่อมา Stability AI ได้เข้ามาชดเชยค่าใช้จ่ายด้านการคำนวณของโครงการและเปลี่ยนให้กลายเป็นปรากฏการณ์ระดับโลก

นับแต่นั้นมา Runway ก็เป็นผู้เล่นสำคัญในวงการ AI video generation ควบคู่ไปกับคู่แข่งอย่าง Pika Labs อย่างไรก็ตาม landscape ก็เริ่มเปลี่ยนไปเมื่อ OpenAI ประกาศเปิดตัว Sora ซึ่งมีความสามารถเหนือกว่าโมเดลที่มีอยู่ Ashton Kutcher นักแสดงฮอลลีวูดเพิ่งสร้างความฮือฮาเมื่อเขากล่าวว่าเครื่องมือเช่น Sora สามารถพลิกโฉมการผลิตรายการโทรทัศน์และภาพยนตร์ได้อย่างมหาศาล

อย่างไรก็ตาม ในขณะที่โลกรอคอยการเปิดตัว Sora สู่สาธารณะ คู่แข่งรายใหม่ก็ได้ปรากฏตัวขึ้น เช่น Kling ของ Kuaishou และ Dream Machine ของ Luma AI

 หน้าเว็บไซต์ Kling แสดงผลงานที่สร้างขึ้นด้วย AI และเครื่องมือสำหรับการสร้างสรรค์ภาพและวิดีโอ โดยใช้ภาษาและคำสั่งต่าง ๆ

Kling ผู้ผลิตวิดีโอชาวจีน สามารถสร้างวิดีโอความยาวได้ถึงสองนาทีในความละเอียด 1080p ที่ 30 เฟรมต่อวินาที ซึ่งเป็นการปรับปรุงอย่างมากเมื่อเทียบกับโมเดลที่มีอยู่ โมเดลจีนนี้ใช้งานได้แล้ว แต่ผู้ใช้ต้องระบุหมายเลขโทรศัพท์ของจีน Kuaishou กล่าวว่าจะเปิดตัวเวอร์ชัน global

ในทางกลับกัน Dream Machine เป็นแพลตฟอร์มใช้งานฟรีที่แปลงข้อความเป็นวิดีโอแบบไดนามิก และให้ผลลัพธ์ที่เอาชนะ Runway Gen-2 ได้อย่างง่ายดายในแง่ของคุณภาพ ความสอดคล้อง และการปฏิบัติตาม prompt มันต้องการบัญชี Google ขั้นพื้นฐาน แต่ได้รับความนิยมมากจนการสร้างใช้เวลานานมาก - ถ้ามันเกิดขึ้นได้จริงน่ะนะ

ในด้านโอเพ่นซอร์ส Stable Video Diffusion แม้จะยังไม่สามารถสร้างผลลัพธ์ที่เทียบเคียงได้ แต่ก็มีพื้นฐานที่มั่นคงสำหรับการปรับปรุงและพัฒนา Vidu ซึ่งเป็นอีกหนึ่ง AI video generator ของจีนที่พัฒนาโดย ShengShu Technology และ Tsinghua University ใช้สถาปัตยกรรมโมเดลการแปลงภาพเฉพาะที่เรียกว่า Universal Vision Transformer (U-ViT) เพื่อสร้างวิดีโอความยาว 16 วินาทีในความละเอียด 1080p ด้วยการคลิกเพียงครั้งเดียว

ส่วน Pika Labs ยังไม่ได้ปล่อยอัปเดตใหญ่ ทำให้ความสามารถยังคงเทียบเท่ากับ Runway Gen-2 อยู่

Why it matters

💡
ข่าวนี้เป็นการอัปเดตที่น่าตื่นเต้นสำหรับผู้ที่สนใจเทคโนโลยี AI ในการสร้างวิดีโอ Runway Gen-3 แสดงให้เห็นถึงความก้าวหน้าอย่างมากในด้านความสมจริงและคุณภาพ เมื่อเทียบกับคู่แข่งรายอื่นๆ ในตลาด บทความนี้ให้ภาพรวมที่ครอบคลุมเกี่ยวกับสถานะปัจจุบันของเทคโนโลยีนี้ รวมถึงผู้เล่นหลักๆ และความคาดหวังในอนาคต ซึ่งเป็นข้อมูลที่มีค่าสำหรับผู้ที่ต้องการติดตามพัฒนาการล่าสุดในด้าน AI video generation

ข้อมูลอ้างอิงจาก Runway's New Gen-3 AI Video Generator Draws High Praise

Read more

ภาพการ์ตูนชายหน้ายิ้ม นั่งหน้าคอมพิวเตอร์พร้อมข้อความเปิดตัว Grok-2 โดย xAI เพื่อยกระดับโซเชียลด้วย AI ใหม่

news

Grok-2 แชตบอท AI โดย Elon Musk ตอนนี้เร็วขึ้น ฉลาดขึ้น และฟรีสำหรับทุกคน

xAI เปิดตัว Grok-2 AI chatbot รุ่นใหม่ที่ทำงานเร็วขึ้น 3 เท่า พร้อมฟีเจอร์สร้างภาพ AI คุณภาพสูง Web Search และ Citations รวมถึง API ใหม่สำหรับนักพัฒนา ให้ผู้ใช้ X ใช้งานฟรี

By
โลโก้ OpenAI พร้อมข้อความ "12 Days of OpenAI" และประกาศอัปเดตฟีเจอร์ใหม่ต้อนรับปีใหม่บนพื้นหลังสีสันสดใส

news

OpenAI เปิดตัว Canvas ให้ผู้ใช้ ChatGPT ทุกคน

OpenAI จัดแคมเปญพิเศษส่งท้ายปี เปิดตัวฟีเจอร์ใหม่ทุกวันผ่าน Live Stream ไม่ว่าจะเป็น Canvas บน GPT-4, Sora Turbo สร้างวิดีโอ AI และ ChatGPT Pro แพ็กเกจใหม่ พร้อมอัพเกรดประสิทธิภาพ

By
ภาพเรือบรรทุกตู้คอนเทนเนอร์กลางทะเล พร้อมข้อความ "LLMs ปฏิวัติการจัดการ Supply Chain ในยุคใหม่"

news

AI สร้างสรรค์ช่วยพัฒนาการจัดการห่วงโซ่อุปทานอย่างไร

เจาะลึกการใช้ LLMs ปฏิวัติการจัดการ Supply Chain โดย Microsoft นำร่องใช้ในการจัดการ Data Centers ทั่วโลก พร้อมผลลัพธ์ที่น่าประทับใจในด้านประสิทธิภาพและความเร็วในการตัดสินใจ

By
ภาพแอป ChatGPT บนสมาร์ทโฟน พร้อมคีย์บอร์ดคอมพิวเตอร์ในพื้นหลัง

news

ChatGPT กับการปฏิวัติประสิทธิภาพการทำงาน: มุมมองผู้บริหาร SaaS

ค้นพบวิธีการใช้ ChatGPT เพื่อยกระดับประสิทธิภาพการทำงานผ่านมุมมองของ CEO บริษัท SaaS ทั้งการให้ feedback การวางแผน การทำ automation และการพัฒนาศักยภาพทีม เพื่อขับเคลื่อนองค์กรในยุคดิจิทัล

By