news

Runway เปิดตัว AI Video Generator Gen-3 ได้รับการชื่นชมล้นหลาม

Runway ได้ปล่อยตัวอย่างเครื่องมือ AI รุ่นใหม่ล่าสุด ลื่นไหล สมจริง และ "ดีกว่า Sora" ซึ่งเป็น AI ตัวก่อนหน้านี้ของบริษัท

Prompt Expert

Jul 1, 2024 — 1 min read

Key Takeaways

Runway ได้เปิดตัว AI Video Generator รุ่นใหม่ล่าสุด Gen-3 ซึ่งมีความก้าวหน้าอย่างมากในด้านความสมจริง ความสอดคล้อง และการปฏิบัติตาม prompt เมื่อเทียบกับรุ่นก่อนหน้า
ผู้ใช้งานชื่นชม Gen-3 ว่าสร้างวิดีโอที่ดูสมจริงมาก โดยเฉพาะใบหน้ามนุษย์ บางคนเห็นว่าดีกว่า Sora ของ OpenAI ซึ่งยังไม่ได้เปิดตัว
Gen-3 จะขับเคลื่อนเครื่องมือต่างๆ ของ Runway และมีแผนเพิ่มความสามารถในการควบคุมโครงสร้าง สไตล์ และการเคลื่อนไหวได้ละเอียดขึ้น โดยมีเป้าหมายสร้าง "General World Models" ที่ทำให้ AI จำลองเหตุการณ์ในอนาคตได้
คู่แข่งในตลาด AI Video Generator มีมากขึ้น ทั้ง Sora, Kling, Dream Machine รวมถึงโมเดลโอเพ่นซอร์สอย่าง Stable Video Diffusion และ Vidu แต่ Runway ยังคงเป็นผู้นำในด้านคุณภาพและความสามารถ

บริษัท Runway ผู้นำด้าน AI ที่มีชื่อเสียงจากเครื่องมือสร้างวิดีโอ (generative video tool) ได้เปิดตัว Runway Gen-3 รุ่นใหม่ล่าสุด ซึ่งยังอยู่ในช่วง alpha และยังไม่เปิดให้ใช้งานสาธารณะ โดยได้มีการสาธิตผ่านตัวอย่างวิดีโอที่แสดงให้เห็นถึงความก้าวหน้าอย่างมากในด้านความสอดคล้อง ความสมจริง และการปฏิบัติตาม prompt เมื่อเทียบกับ Gen-2 ที่ใช้งานอยู่ในปัจจุบัน

วิดีโอที่สร้างขึ้น โดยเฉพาะอย่างยิ่งที่มีใบหน้ามนุษย์ มีความสมจริงสูงมาก จนสมาชิกในชุมชน AI art รีบเปรียบเทียบในทางที่ดีกับ Sora ของ OpenAI ซึ่งยังไม่ได้เปิดตัวแต่ก็เป็นที่คาดหวังอย่างสูง

"ถึงแม้ว่าจะเป็นการเลือกสรรมาแล้ว แต่ก็ยังดูดีกว่า Sora อยู่ดี" ผู้ใช้ Reddit รายหนึ่งเขียนในความคิดเห็นที่ได้รับโหวตสูงสุดในกระทู้อภิปราย Runway Gen-3 "Sora มีลักษณะและความรู้สึกที่ดัดแปลงไปจากความเป็นจริง" ผู้ใช้อีกรายหนึ่งตอบ "คนเหล่านี้ดูเหมือนจริง ดีที่สุดที่ผมเคยเห็นมา"

"ถ้าคุณแสดงภาพคนที่สร้างขึ้นเหล่านี้ให้ผมดู ผมคงคิดว่ามันเป็นของจริง" ความเห็นอื่น ๆ ใน AI Video subreddit ที่มีสมาชิก 66,000 คนระบุ

หน้าเว็บไซต์ Runway แสดงเครื่องมือ AI สำหรับการสร้างและสำรวจภาพ วิดีโอ และเสียง พร้อมการเปิดตัว Gen-3 Alpha เพื่อการสร้างสื่อที่ควบคุมได้อย่างรวดเร็ว

"คลิป Runway GEN-3 เหล่านี้มีความน่าสนใจทางภาพอย่างมากสำหรับผม - พวกเขาดูเหมือนหนังเลย" PZF ผู้สร้างภาพยนตร์ AI นามแฝง ซึ่งระบุตัวเองเป็นพันธมิตรด้านความคิดสร้างสรรค์ของ Runway ทวีต "นุ่มนวล เรียบง่าย (ในความหมายที่ดี เป็นธรรมชาติ) และน่าเชื่อถือ"

นอกเหนือจาก text-to-video generator รุ่น Gen-3 แล้ว Runway ยังนำเสนอชุดเครื่องมือ fine-tuning รวมถึงการควบคุมภาพและกล้องที่ยืดหยุ่นมากขึ้น

"Gen-3 Alpha จะขับเคลื่อน text-to-video, image-to-video และ text-to-image tools ของ Runway, รวมถึง control modes ที่มีอยู่เดิม เช่น Motion Brush, Advanced Camera Controls และ Director Mode ตลอดจนเครื่องมือที่กำลังจะมาถึงเพื่อให้สามารถควบคุมโครงสร้าง สไตล์ และการเคลื่อนไหวได้ละเอียดยิ่งขึ้น" บริษัทโพสต์ทวีต

Runway อ้างว่า Gen-3 เป็นก้าวสำคัญในการทำให้เป้าหมายอันทะเยอทะยานของพวกเขาในการสร้าง "General World Models" เป็นจริง โมเดลเหล่านี้จะทำให้ระบบ AI สามารถสร้างการแสดงแทนภายในของสภาพแวดล้อม และใช้มันเพื่อจำลองเหตุการณ์ในอนาคตภายในสภาพแวดล้อมนั้น วิธีการนี้จะทำให้ Runway แตกต่างจากเทคนิคทั่วไปที่มุ่งเน้นไปที่การทำนายเฟรมถัดไปที่น่าจะเกิดขึ้นในไทม์ไลน์เฉพาะ

แม้ว่า Runway จะไม่ได้เปิดเผยวันที่เปิดตัว Gen-3 โดยเฉพาะ แต่ Anastasis Germanidis ผู้ร่วมก่อตั้งและ CTO ประกาศว่า Gen-3 Alpha "จะเปิดให้ใช้งานใน Runway product ในเร็วๆ นี้" ซึ่งรวมถึงโหมดที่มีอยู่ รวมทั้ง "โหมดใหม่บางอย่างที่เป็นไปได้เฉพาะกับ base model ที่มีความสามารถมากขึ้นเท่านั้น" เขาเกริ่นไว้

การเดินทางของ Runway ในโลก AI เริ่มต้นขึ้นในปี 2021 เมื่อพวกเขาร่วมมือกับนักวิจัยจากมหาวิทยาลัยมิวนิคเพื่อสร้าง Stable Diffusion เวอร์ชันแรก ต่อมา Stability AI ได้เข้ามาชดเชยค่าใช้จ่ายด้านการคำนวณของโครงการและเปลี่ยนให้กลายเป็นปรากฏการณ์ระดับโลก

นับแต่นั้นมา Runway ก็เป็นผู้เล่นสำคัญในวงการ AI video generation ควบคู่ไปกับคู่แข่งอย่าง Pika Labs อย่างไรก็ตาม landscape ก็เริ่มเปลี่ยนไปเมื่อ OpenAI ประกาศเปิดตัว Sora ซึ่งมีความสามารถเหนือกว่าโมเดลที่มีอยู่ Ashton Kutcher นักแสดงฮอลลีวูดเพิ่งสร้างความฮือฮาเมื่อเขากล่าวว่าเครื่องมือเช่น Sora สามารถพลิกโฉมการผลิตรายการโทรทัศน์และภาพยนตร์ได้อย่างมหาศาล

อย่างไรก็ตาม ในขณะที่โลกรอคอยการเปิดตัว Sora สู่สาธารณะ คู่แข่งรายใหม่ก็ได้ปรากฏตัวขึ้น เช่น Kling ของ Kuaishou และ Dream Machine ของ Luma AI

หน้าเว็บไซต์ Kling แสดงผลงานที่สร้างขึ้นด้วย AI และเครื่องมือสำหรับการสร้างสรรค์ภาพและวิดีโอ โดยใช้ภาษาและคำสั่งต่าง ๆ

Kling ผู้ผลิตวิดีโอชาวจีน สามารถสร้างวิดีโอความยาวได้ถึงสองนาทีในความละเอียด 1080p ที่ 30 เฟรมต่อวินาที ซึ่งเป็นการปรับปรุงอย่างมากเมื่อเทียบกับโมเดลที่มีอยู่ โมเดลจีนนี้ใช้งานได้แล้ว แต่ผู้ใช้ต้องระบุหมายเลขโทรศัพท์ของจีน Kuaishou กล่าวว่าจะเปิดตัวเวอร์ชัน global

ในทางกลับกัน Dream Machine เป็นแพลตฟอร์มใช้งานฟรีที่แปลงข้อความเป็นวิดีโอแบบไดนามิก และให้ผลลัพธ์ที่เอาชนะ Runway Gen-2 ได้อย่างง่ายดายในแง่ของคุณภาพ ความสอดคล้อง และการปฏิบัติตาม prompt มันต้องการบัญชี Google ขั้นพื้นฐาน แต่ได้รับความนิยมมากจนการสร้างใช้เวลานานมาก - ถ้ามันเกิดขึ้นได้จริงน่ะนะ

ในด้านโอเพ่นซอร์ส Stable Video Diffusion แม้จะยังไม่สามารถสร้างผลลัพธ์ที่เทียบเคียงได้ แต่ก็มีพื้นฐานที่มั่นคงสำหรับการปรับปรุงและพัฒนา Vidu ซึ่งเป็นอีกหนึ่ง AI video generator ของจีนที่พัฒนาโดย ShengShu Technology และ Tsinghua University ใช้สถาปัตยกรรมโมเดลการแปลงภาพเฉพาะที่เรียกว่า Universal Vision Transformer (U-ViT) เพื่อสร้างวิดีโอความยาว 16 วินาทีในความละเอียด 1080p ด้วยการคลิกเพียงครั้งเดียว

ส่วน Pika Labs ยังไม่ได้ปล่อยอัปเดตใหญ่ ทำให้ความสามารถยังคงเทียบเท่ากับ Runway Gen-2 อยู่

Why it matters

💡

ข่าวนี้เป็นการอัปเดตที่น่าตื่นเต้นสำหรับผู้ที่สนใจเทคโนโลยี AI ในการสร้างวิดีโอ Runway Gen-3 แสดงให้เห็นถึงความก้าวหน้าอย่างมากในด้านความสมจริงและคุณภาพ เมื่อเทียบกับคู่แข่งรายอื่นๆ ในตลาด บทความนี้ให้ภาพรวมที่ครอบคลุมเกี่ยวกับสถานะปัจจุบันของเทคโนโลยีนี้ รวมถึงผู้เล่นหลักๆ และความคาดหวังในอนาคต ซึ่งเป็นข้อมูลที่มีค่าสำหรับผู้ที่ต้องการติดตามพัฒนาการล่าสุดในด้าน AI video generation

ข้อมูลอ้างอิงจาก Runway's New Gen-3 AI Video Generator Draws High Praise