Gaussian Splatting ข้ามเส้นแล้ว — ตอนนี้มันอยู่ใน Nuke แล้วครับ

สองสามปีที่ผ่านมาเนี่ย ถ้าคุณไปเดินในงาน VFX meetup หัวข้อ Gaussian Splatting จะเป็นเรื่องสนทนาที่จบลงด้วยเสียงถอนหายใจแบบเดิมทุกครั้งเลยครับ
"โห คุณภาพการสแกนสถานที่จริงนี่โคตรสุดเลยนะ..." แล้วก็เงียบไปแป๊บนึง ก่อนจะพูดต่อว่า "...แต่มันยังเอาเข้ามาใช้ทำงานจริงใน pipeline ไม่ได้เลยว่ะ"
แล้วพวกเราทุกคนก็นั่งพยักหน้าเงียบๆ จิบกาแฟเย็นๆ แล้วก็เดินกลับไปนั่งเคลียร์ polygon mesh ที่สแกนพังๆ จากระบบ Photogrammetry (การสแกนภาพถ่ายเป็นโมเดล 3D) แบบเดิมที่โต๊ะทำงานต่อ
แต่บทสนทนาแบบนั้นมันจบลงอย่างเป็นทางการเมื่อเดือนกุมภาพันธ์ 2026 ที่ผ่านมานี่เองครับ เมื่อ Nuke 17.0 ประกาศเปิดตัวพร้อมซัพพอร์ต Gaussian Splat แบบ Native โดยตรงเลยครับ นี่ไม่ใช่แค่ปลั๊กอินบุคคลภายนอก หรือฟีเจอร์ทดลองที่ Houdini TD เขียนเล่นๆ ในช่วงสุดสัปดาห์ แต่มันอยู่ใน Nuke ตัวจริง—โปรแกรมหลักที่ผมและคุณใช้ส่งงานคอมพ์ระดับบล็อกบัสเตอร์ขึ้นโรงหนังนั่นแหละครับ ถ้าคุณเคยปวดหัวกับข้อจำกัดของข้อมูลการสแกนสถานที่จริงล่ะก็ นี่คือจุดเปลี่ยนที่คุณรอคอยครับ
สรุปง่ายๆ: Gaussian Splat มันคืออะไรกันแน่
ผมขออนุญาตเว้นเรื่องสูตรคณิตศาสตร์จ๋าๆ ไปก่อนนะ จะได้เข้าใจกันง่ายๆ และเอาไปประยุกต์ใช้ได้จริงเลย Gaussian Splatting (เทคนิคการบันทึกภาพและสร้างสภาพแวดล้อม 3D ขึ้นมาใหม่ด้วยกลุ่มของจุดฟุ้งนับล้านที่มีสีและความโปร่งใส) เป็นนวัตกรรมการสแกนที่น่าทึ่งมาก แทนที่มันจะพยายามฝืนเปลี่ยนรูปภาพที่เราถ่ายให้กลายเป็นแผ่นเหลี่ยมๆ ของ polygon mesh และ bake ผิวสัมผัสลงไป แต่มันกลับใช้วิธีเทรนตัวเรียนรู้เพื่อหาตำแหน่ง ขนาด ทิศทาง ความโปร่งแสง และสีของกลุ่มเมฆละอองเล็กๆ (Gaussians) นับล้านก้อนแทนครับ
เวลาเราเรนเดอร์มันออกมา ละอองเล็กๆ เหล่านี้จะผสานรวมกันกลายเป็นสภาพแวดล้อม 3D ที่ดูเนียนตา สมจริงราวกับเข้าไปถ่ายในสถานที่จริงเป๊ะๆ เลยครับ
สิ่งที่ต่างจาก Photogrammetry แบบเดิมก็คือ คุณไม่ต้องมานั่งเหนื่อย clean geometry สานตาข่ายโพลีกอนใหม่ ไม่ต้องเสียเวลาแก้ UV และไม่ต้อง bake texture เลย เพราะก้อนเมฆละอองจุดเหล่านั้น คือ ฉากนั้นเลยครับ ผลลัพธ์ที่ได้จึงสมจริงราวกับถ่ายรูปจริงและเรนเดอร์ได้เร็วอย่างน่าเหลือเชื่อ
แต่ปัญหาก็คือ ข้อมูลแบบนี้มันคุยกับระบบ VFX pipeline มาตรฐานของเราไม่ได้เลยครับ ไม่มี mesh โนโพลีกอน ไม่มี shader ไม่มี AOV (ช่องแยกรายละเอียดภาพ เช่น Shadow, Specular) ให้ดึงออกมาได้ คอมพิวเตอร์อย่างพวกเราเลยได้แต่มองตาปริบๆ และเอาไปใช้งานอะไรไม่ได้เลย... จนกระทั่งวันนี้ครับ
Nuke 17 เข้ามาเปลี่ยนชีวิตพวกเรายังไงบ้าง
กระบวนการทำงานใหม่ใน Nuke 17 นั้นเรียบง่ายและเป็นระบบมากครับ คุณแค่ลากไฟล์นามสกุล .ply หรือ .splat เข้ามาผ่านโหนดใหม่อย่าง GeoImport หรือ GeoReference เหมือนกับการดึงโมเดล FBX หรือ USD เข้ามาทุกประการเลย จากนั้นการเรนเดอร์ทั้งหมดจะถูกประมวลผลผ่านโหนดเดี่ยวที่ชื่อว่า SplatRender ครับ
และนี่คือฟีเจอร์สำคัญที่ยกฐานะมันจากการเป็นแค่เดโมโชว์เล่นๆ สู่เครื่องมือทำงานระดับโปรดักชันจริง: SplatRender สามารถเรนเดอร์ Depth Pass (ช่องสัญญาณความลึก), Deep Output (ข้อมูลพิกเซลลึกแบบหลายเลเยอร์) และ Motion Blur (ภาพเบลอจากการเคลื่อนไหว) ออกมาได้เสร็จสรรพเลยครับ!
นั่นแปลว่าคุณไม่ได้รูปถ่ายแบนๆ ก้อนเดียวแล้วต้องมานั่งเดาความลึก แต่คุณได้ข้อมูลความลึกทางคณิตศาสตร์จริงๆ เพื่อใช้ในการประกอบ CG element หรือตัวละครสามมิติต่างๆ เข้าไปกลางฝูงจุดสแกนเหล่านั้นได้เลยทันที จะทำ color grade ปรับโทนแสงให้เนียนเข้ากับ plate (ฟุตเทจถ่ายจริง) คีย์ตัวละครไปหลบอยู่หลังเสา หรือใส่หมอกควัน atmospheric haze ก็ทำได้ด้วยเครื่องมือมาตรฐานที่คุ้นเคยเลยครับ
สำหรับงานสแกนฉากและสถานที่ถ่ายทำ—เช่น หน้าตึกประวัติศาสตร์ ทางเดินในป่าลึก หรือฉากกองถ่ายจริงๆ ที่ถูกรื้อทิ้งไปแล้วหลังจากถ่ายทำเสร็จ—นี่คือสิ่งมหัศจรรย์ครับ สแกนเก็บไว้ครั้งเดียวบนเซ็ตด้วยมือถือหรือกล้องธรรมดา ส่งต่อไฟล์ splat cloud ให้ทีมคอมพ์ พวกเขาก็สามารถ integrate ทุกอย่างได้อย่างสมบูรณ์แบบโดยไม่ต้องวาด Matte Painting เองอีกต่อไป
FIG_01: การซัพพอร์ต Gaussian Splat แบบ Native ใน Nuke 17 — การนำเข้า splat เป็นเหมือน geometry ทั่วไปและเรนเดอร์ผ่านโหนด SplatRender
Houdini ก็เดินหน้าตามมาติดๆ
ฝั่ง Houdini 21 เองก็มาพร้อมกับ Technical Preview ของการซัพพอร์ต splat แบบ Native เช่นกันครับ นอกจากนี้ปลั๊กอินภายนอกยอดนิยมอย่าง GSOPs (Gaussian Splatting Operators) ก็ก้าวหน้าไปไกลมาก มันสามารถเชื่อมต่อกับระบบ USD (Universal Scene Description) และ LOP nodes ของ Solaris ได้สมบูรณ์แบบ แถมยังรองรับการจัดแสงสะท้อนเงาตกกระทบแบบเรียลไทม์ผ่าน renderer ของ Karma ได้แล้วด้วยครับ
นี่ไม่ใช่เรื่องเล็กๆ เลยนะ แปลว่าสภาพแวดล้อมสแกนของคุณจะไม่ได้ทำหน้าที่เป็นเพียงฉากหลังแบนๆ อีกต่อไป แต่มันจะตอบสนองต่อแสงไฟ CG จริงๆ ในชอตที่คุณจัดวางได้ด้วย สำหรับโชว์ที่มีคลังฉากดิจิทัลขนาดใหญ่และซับซ้อน workflow นี้จะเปลี่ยนวิธีคิดและวิธีจัดแสงของคุณไปตลอดกาลเลยล่ะครับ
ตัวเลขที่พิสูจน์ทุกข้อกังขา: หนัง Superman (2025)
ถ้าคุณยังรู้สึกลังเลและกังขาอยู่ว่าเทคโนโลยีนี้จะใช้ได้จริงในสนามแข่งภาพยนตร์ฟอร์มยักษ์ไหม ผมอยากให้คุณจดจำสถิตินี้เอาไว้ครับ: ทีม VFX ยักษ์ใหญ่อย่าง Framestore ได้ใช้เทคนิค 4D Gaussian Splatting เพื่อส่งงานชอตจริงไฟนอลขึ้นจอโรงภาพยนตร์ (Final-pixel shots) ไปมากถึงประมาณ 40 ชอต ในภาพยนตร์ฟอร์มยักษ์เรื่อง Superman (2025) ครับ!
ผมขอย้ำอีกครั้งนะคราบ สี่สิบชอตเต็มๆ ในหนังฟอร์มยักษ์ระดับตำนาน ไม่ใช่ภาพแนวคิด ไม่ใช่ previs และไม่ใช่แค่งานวิจัยหลังบ้าน แต่เป็นผลงานจริงที่คนทั้งโลกตีตั๋วเข้าไปดูในโรงหนัง
โดยเทคนิค 4D splatting นี้คือการอัปเกรดขึ้นไปอีกขั้น โดยเพิ่มมิติของ "เวลา" เข้าไปด้วย ทำให้ไม่เพียงแต่สแกนโครงสร้างฉากเฉยๆ แต่ยังบันทึกการเคลื่อนไหวที่เกิดขึ้นจริงๆ ในเฟรมได้ด้วย และการที่ Framestore นำมาใช้จริงในโปรดักชันขนาดมหึมาเช่นนี้ คือเครื่องยืนยันและตราประทับรับประกันความพร้อมใช้งานที่ชัดเจนที่สุดสำหรับอุตสาหกรรมเราแล้วครับ
สำหรับคอมพิวเตอร์อย่างเรา มันหมายความว่าอะไร
ผมขออนุญาตพูดตรงประเด็นแบบไม่อ้อมค้อมเลยนะครับ: เทคโนโลยีนี้มันไม่ได้มาทดแทนหรือล้างบางงานจัดวางคอมพ์ดั้งเดิมของคุณในเร็วๆ นี้หรอกครับ มันเป็นเหมือนการเพิ่มอาวุธระดับพรีเมียมเข้ามาในคลังของคุณมากกว่า ไม่ใช่การทุบโครงสร้างอาชีพทิ้ง
use case หรือประโยชน์ที่เราจะได้ใช้ในทันทีคือ การคอมพ์สภาพแวดล้อมที่สแกนมาจริง (Scanned Location Environments) เมื่อโปรดักชันต้องการให้ตัวละคร CG โลดแล่นอยู่ในสถานที่จริงแต่ไม่สามารถยกกองไปถ่ายได้เนื่องจากค่าใช้จ่ายมหาศาล หรือไม่ต้องการให้นักแสดงเสี่ยงอันตราย การเอา Gaussian Splatting มาใช้จึงเป็นคำตอบที่สมเหตุสมผลที่สุดในเรื่องคุณภาพครับ
หน้าที่หลักของคุณในฐานะ Compositor ยังคงเหมือนเดิมไม่มีเปลี่ยน—คุณยังต้องพิถีพิถันกับการเกลาเกลี่ยขอบสีตัดต่อ (Edge Integration), การเกลี่ยโทนสีให้กลมกลืน (Grade Matching), การคัดลอกคืนเม็ดเกรนของกล้องต้นฉบับ (Grain Matching), ตลอดจนระยะลึก (Depth) และความเบลอตามจริง (Motion Blur) ทั้งหมดนั้นเหมือนเดิมครับ เพียงแต่เราได้ทำงานกับวัตถุดิบต้นทางที่มีคุณภาพยอดเยี่ยมขึ้นกว่าเมื่อก่อนเยอะมากครับ
ความสนุกที่แท้จริงจะเริ่มขึ้นเมื่อคุณหยิบข้อมูลจุด splat เหล่านี้ไปผสานงานร่วมกับระบบ AI-assisted Extension ครับ เนื่องจากจุดอ่อนของ splat คือมันแสดงได้เฉพาะมุมที่เราสแกนมาเท่านั้น ถ้าคุณต้องการขยายกำแพงออกไป เพิ่มบานหน้าต่างใหม่ หรือต้องการเติมมุมอับสายตาที่กล้องถ่ายไม่ถึง คุณก็สามารถวางรากฐานของฉากหลังที่สมจริงด้วย splat ก่อน แล้วค่อยเอา AI เจนเนอเรทีฟขยายต่อเติมบริเวณโดยรอบเข้าไปครับ 555 ความคิดสร้างสรรค์บวกกับคณิตศาสตร์ที่ลงตัวยังไงก็ไม่มีตันครับ
มองมุมกลับ: ข้อจำกัดที่ยังมีอยู่จริงที่คุณต้องระวัง
อย่างที่ตกลงกันไว้ครับ ผมจะพูดความจริงแบบฟิลเตอร์ศูนย์เสมอ Gaussian Splatting มันเก่งมากก็จริง แต่มันก็มาพร้อมกับขวากหนามและข้อจำกัดที่คุณต้องเตรียมรับมือเช่นกันครับ:
- ปัญหาเรื่องความโปร่งแสง (Transparency) ยังน่าปวดหัว: วัสดุจำพวกกระจก น้ำ หรือพื้นผิวสะท้อนแสงแวววาวต่างๆ มักทำให้การคำนวณของอัลกอริทึมข้างหลังเอ๋อได้ง่ายครับ เพราะระบบคณิตศาสตร์มันแยกแยะระหว่างกระจกใสกับฉากที่ซ้อนอยู่ข้างหลังไม่ออก ดังนั้นคุณต้องวางแผนแยกเลเยอร์องค์ประกอบเหล่านี้ออกมาคอมพ์จัดการมือด้วยตัวเองอยู่ดีครับ
- สิ่งใดที่เคลื่อนไหวอย่างรวดเร็วจะคุมยากมาก: ฉากที่มีตึกรามบ้านช่องนิ่งๆ ทำงานได้เสถียรสุดยอดครับ แต่ถ้าชอตนั้นเป็นท้องถนนที่เต็มไปด้วยรถสัญจร หรือกลุ่มคนเดินพลุกพล่าน คุณจำเป็นต้องใช้เทคนิคสแกนแบบ dynamic scans หลายตัวมาร่วมด้วย หรือต้องหา workaround (วิธีแก้ไขปัญหาเฉพาะหน้า) ที่สร้างสรรค์เข้าช่วยครับ
- ไฟล์ใหญ่มหึมาจะบีบคอ local storage ของคุณ: ข้อมูลจุดสแกนล้านพิกเซลที่มีความละเอียดสูงจะมีขนาดไฟล์ที่หนักหน่วงมากครับ หากทีม TD ในสตูดิโอของคุณไม่ได้เซ็ตระบบจัดเก็บข้อมูลและ cache ท้องถิ่นที่ดี Viewport ของคุณอาจจะค้างจนปวดขมับได้ครับ ผมเรียกปัญหานี้ว่า "ภาษีสัญญาลักษณ์จุด (Splat Storage Tax)"—เวลาขอพื้นที่จัดเก็บ ให้เผื่อพื้นที่จัดเก็บไว้สักสองเท่าจากที่คิดว่าจำเป็นไว้ก่อนเสมอเลยนะครับ!
💡 บทสรุป: ยึดมั่นในฟิสิกส์ของกล้องและแสงเสมอ
วงการ VFX กำลังเคลื่อนตัวไปข้างหน้าเร็วมากครับ ทั้งปัญญาประดิษฐ์ (Generative AI), การแสดงผลเรียลไทม์ (Real-time renderers) และเทคโนโลยีสแกนโลกจริงแบบ Gaussian Splatting นี้ เส้นแบ่งระหว่างโลกความจริงกับงาน CGI กำลังพร่าเลือนจนเกือบรวมเป็นเนื้อเดียวกันแล้ว
แต่คำแนะนำของรุ่นพี่อย่างผมคือ: อย่าเพิ่งตื่นตระหนกตกใจไปครับ และอย่าปล่อยให้กระแสไฮป์ดึงสมาธิของคุณออกไป ทักษะระดับรากฐานของผู้ทำงานคอมพ์ที่เก่งยังคงไม่มีวันเปลี่ยนแปลงครับ เรื่องสี แสน เงา ระยะความลึก และความแนบเนียนในการผสานองค์ประกอบ—สิ่งเหล่านี้คือกฎฟิสิกส์สากลของภาพถ่ายและเลนส์กล้องครับ ไม่ว่าคุณจะกำลังจัดวางองค์ประกอบบนแผ่นฟิล์ม 2D ธรรมดา หรือประกอบพิกเซลในจุดเมฆหมอก 3D Gaussian Splat ความเข้าใจเรื่องเลนส์และความลึกซึ้งในรายละเอียดของคุณต่างหากที่เป็นตัวชี้นำว่าชอตนั้นจะขึ้นจอภาพยนตร์ได้อย่างสมจริงหรือไม่
Nuke 17 วางอยู่ตรงหน้าแล้ว และระบบการทำงานก็พร้อมสุดๆ ลองหาไฟล์ .ply สักตัวมาโยนลงไปในกราฟโหนด ลองทดลองเล่น และหักโหมทดลองทำลายระบบมันดูครับ เพราะวิธีเรียนรู้งานคอมพ์ที่ดีที่สุด คือการลงมือทำและทำมันพังด้วยตัวคุณเองครับ! ขอให้สนุกกับการเรนเดอร์ชอตครับ!