
สอนทำ AI Cover เพลงง่ายๆ ฟรี! ด้วย Ultimate RVC (ผ่าน Google Colab)
เคยสงสัยกันไหมครับว่าคลิปที่เอาเสียงตัวละครหรือศิลปินคนโปรดมาร้องเพลงโควเวอร์ (AI Cover) เขาทำกันยังไง? วันนี้ผมจะมาสอนวิธีทำง่ายๆ แบบไม่ต้องพึ่งคอมพิวเตอร์สเปคแรงเลยซักนิด เพราะเราจะยืมเซิร์ฟเวอร์ฟรีของ Google ผสมกับเครื่องมือสุดล้ำอย่าง Ultimate RVC กันครับ!
บทความนี้จะสอนตั้งแต่การรันเซิร์ฟเวอร์ไปจนถึงการตั้งค่าเสียงคลุมดนตรีแบบยิบยับพร้อมใช้งานเลยครับ (ส่วนใครที่อยากปั้นเสียงเอง บทความนี้จะไม่ได้สอนการเทรนเสียงน้า เน้นนำโมเดลสำเร็จรูปมาใช้ครับผม)
🛠️ สิ่งที่ต้องเตรียมก่อนเริ่ม
- Source ต้นฉบับเพลง:
- รองรับทั้งการแปะ ลิงก์วิดีโอ YouTube (ระบบมีตัวช่วยดูดเสียง
yt-dlpให้ในตัว) - หรือถ้ากลัวเซิร์ฟเวอร์โดนบล็อค IP จากยูทูป (สุ่มดวงพอตัว) แนะนำให้โหลดไฟล์เพลง MP3 / WAV มาเตรียมไว้ในเครื่องชัวร์สุดครับ
- รองรับทั้งการแปะ ลิงก์วิดีโอ YouTube (ระบบมีตัวช่วยดูดเสียง
- ลิงก์โมเดลเสียง (Voice Model):
- ต้องเป็นลิงก์ดาวน์โหลดตรงที่เป็นไฟล์
.zip - สำคัญมาก! ไฟล์ Zip นั้นแตกออกมาข้างในต้องมีไฟล์นามสกุล
.pthและควรมี.indexอยู่คู่กัน (หาโมเดลแจกฟรีได้ตาม Discord กลุ่ม AI หรือ AI Hub ต่างๆ)
- ต้องเป็นลิงก์ดาวน์โหลดตรงที่เป็นไฟล์
- บัญชี Google (Gmail): สำหรับใช้รันระบบบน Google Colab
🚀 ขั้นตอนที่ 1: การเปิดระบบใน Google Colab
โปรเจกต์ที่เราใช้ในวันนี้คือ Ultimate RVC ของคุณ JackismyShephard คลิกที่ลิงก์เพื่อเข้าสู่หน้า GitHub ได้เลยครับ
- เลื่อนลงมาด้านล่างของหน้า GitHub จะเจอปุ่มที่เขียนว่า "Open in Colab" ให้คลิกเข้าไป
- เมื่อหน้า Google Colab เปิดขึ้นมา ให้มองหาแถบเมนูด้านบนสุด คลิกที่ Runtime (รันไทม์) แล้วเลือกเมนู Run all (รันทั้งหมด) ไม่ต้องคอยกดปุ่ม Play ทีละบรรทัด ระบบจะรันโค้ดลงมาให้รวดเดียวเลย
- ระบบอาจมีเด้งหน้าต่างขออนุญาตเข้าถึง Google Drive เล็กน้อย ให้กดยอมรับไปครับ
- กระบวนการติดตั้งจะใช้เวลาประมาณ 6 นาที ให้ปล่อยทิ้งไว้
- เมื่อรันสำเร็จ ให้เลื่อนลงมาเช็คที่ชุดรหัสล่างสุด (ตามรูปด้านล่าง) ในช่องหัวข้อ
Choose a sharing method:ที่ถูกตั้งไว้เป็นgradio - มองหาข้อความว่า
Running on public URL: https://[ตัวหนอนยาวๆ].gradio.liveให้คุณคลิกที่ลิงก์เส้นสีฟ้านี้เพื่อเข้าสู่หน้าจอทำงาน (Web UI) ของ Ultimate RVC ได้เลยครับ!

📥 ขั้นตอนที่ 2: ดาวน์โหลดโมเดลเสียง (Models)
เข้าสู่หน้าต่าง Ultimate RVC รูปแบบเว็บกันแล้ว อันดับแรกเราต้องป้อนไฟล์เสียงตั้งต้นให้ระบบรู้จักก่อน:
- คลิกที่เมนูแท็บหลักด้านบน ไปที่คำว่า Models
- ตรวจสอบให้แน่ใจว่าแท็บย่อยด้านล่างเลือกอยู่ที่คำว่า Download
- Model URL: นำลิงก์ดาวน์โหลดไฟล์
.zipของโมเดลเสียง AI ที่เราเตรียมไว้มาวางในช่องนี้ - Model name: ช่องสำหรับตั้งชื่อโมเดล ให้กรอกชื่ออะไรก็ได้เพื่อเตือนความจำตัวเอง (เช่น แบทแมน, โดราเอม่อน, ศิลปิน X)
- กดปุ่มสีฟ้า Download 🌐 เครื่องหมายลูกโลก
- รอจนกว่าช่อง Output message ด้านล่างขวา แจ้งเตือนข้อความว่าโหลดสำเร็จ (Successfully downloaded)

🎙️ ขั้นตอนที่ 3: สั่ง AI สร้างเสียงร้อง (Generate)
นี่คือขั้นตอนพระเอกของเราครับ กลับมาคลิกที่เมนูแท็บหลัก Generate และตรวจสอบให้แน่ใจว่าแท็บย่อยคือ Song covers (แท็บนี้เกิดมาเพื่อเพลงโดยเฉพาะ มันจะช่วยแยกดนตรีและเสียงร้องให้อัตโนมัติในปุ่มเดียว!)
3.1 การเลือกต้นฉบับและเสียงร้อง
- Source type: ระบบมี Drop-down ให้เลือกต้นฉบับ (จะใช้ YouTube หรือไฟล์ในเครื่อง) ให้เลือก YouTube link/local path
- Source: ถ้านำลิงก์จาก YouTube มาวางได้เลย หรือถ้าอยากอัปโหลดเสียงจากในเครื่องก็กดเบราว์ไฟล์เลือกโฟลเดอร์มาใส่ได้ครับ
- Voice model: เปิดปุ่ม Drop-down เราจะเจอชื่อโมเดลเสียง AI ที่เราเพิ่งดาวน์โหลดแล้วตั้งชื่อไว้ในขั้นตอนที่แล้ว ให้คลิกเลือกชื่อนั้นเลยครับ

3.2 เมนู Options (ตั้งค่ารายละเอียดเสียง)
ไม่ต้องรีบกด Generate นะครับ! ให้คลิกคำว่า Options เพื่อให้เมนูตั้งค่าแบบละเอียดยิบกางออกมา ปรับค่าตามนี้รับรองเสียงเนียนกริบ:
🎵 1. ระดับเสียง (Pitch shift)
- Vocal pitch shift: ปรับจูนคีย์เสียงร้อง AI ให้เข้ากับดนตรี
- หากเพลงต้นฉบับร้องโดย ผู้ชาย แต่โมเดล AI ของคุณเป็น ผู้หญิง 👉 เลื่อนหรือพิมพ์ปรับค่าเป็น
1(หรือ 12 semitones / 1 octave) - พลงต้นฉบับเป็น ผู้หญิง แต่โมเดล AI เป็น ผู้ชาย 👉 เลื่อนหรือพิมพ์ปรับค่าเป็น
-1 - หากเพศเดียวกัน หรือใกล้เคียงกัน ปล่อยไว้ที่
0
- หากเพลงต้นฉบับร้องโดย ผู้ชาย แต่โมเดล AI ของคุณเป็น ผู้หญิง 👉 เลื่อนหรือพิมพ์ปรับค่าเป็น
- Overall pitch shift: ปรับระดับคีย์เสียงรวมของทั้งคลิป รวมทั้งดนตรี ปล่อยค่าเริ่มต้นที่
0ได้เลยครับ
🛠️ 2. การสังเคราะห์เสียง (Voice synthesis / Vocal conversion)
- Pitch extraction algorithm: อัลกอริทึมจับโน้ตเสียง แนะนำให้ทิ้งไว้ที่
rmvpe(ค่าเริ่มต้น) เพราะเป็นตัวที่แม่นยำที่สุดในตระกูล RVC ปัจจุบัน - Index rate: เลื่อนแถบอยู่ระหว่าง
0.3ถึง0.7- ยิ่งตั้งค่าเข้าใกล้
1ระบบจะยิ่งพยายามดัดสำเนียง เทคนิคการร้อง ลูกคอ ให้เหมือนกับร่างต้นฉบับโมเดลมากที่สุด (ใช้ไฟล์.indexเข้ามาช่วย) - ข้อควรระวัง: ถ้าใส่เยอะเกินแล้วต้นฉบับดนตรีมีเสียงรบกวนเยอะ เสียง AI อาจจะแตก แนะนำลองเริ่มที่
0.3ตามค่าเริ่มต้นครับ
- ยิ่งตั้งค่าเข้าใกล้
- RMS mix rate: คงไว้ที่
1เพื่อให้ AI อ้างอิงระดับความดังเบาตามเสียงร้องตามมนุษย์ต้นฉบับ - Protect rate: ปกป้อง "เสียงพูดแบบพ่นลม" สระเสียงซีดๆ หรือจังหวะหายใจ ไม่ให้หายไปตอนแปลงเสียง AI ตั้งค่าเริ่มต้นที่
0.33ถือว่าคลุมโทนได้ดีครับ (ยิ่งปรับสูงเสียงลมจะชัด แต่สำเนียง AI จะลดความเป๊ะลงนิดนึง)

✨ 3. ตัวช่วยปรับแต่งพิเศษ (Vocal enrichment)
ส่วนนี้สามารถติ๊กถูก (Check) เลือกได้ตามความเหมาะสม:
Split input voice:หากเพลงยาวมาก การแบ่งประมวลผลเป็นท่อนเล็กๆ จะช่วยลดอาการเสียงแตกได้Autotune converted voice:ใส่เอฟเฟกต์ออโต้จูนให้เสียง AI ร้องตรงคีย์เป๊ะปังClean converted voice:ระบบลดเสียงรบกวน (Noise Reduction) ใช้ในกรณีที่ไฟล์ตั้งต้นคุณภาพไม่ดีนัก
3.3 การมิกซ์เสียงและการส่งออก (Audio mixing & output)
เมื่อได้เสียง AI แล้ว ระบบของ Ultimate RVC ใจดีมีแผงมิกเซอร์ (Mixer) รวมเสียงร้อง AI กลับเข้ากับดนตรีให้อีก!
🎛️ Audio mixing (ตั้งค่าเสียงก้อง)
- Reverb control: การใส่เสียงก้องให้เสียงร้องกลมกลืนกับดนตรี ไม่ดูแห้งจนลอยออกมา
- Room size: ตั้งความกว้างของห้องสมมุติ ยิ่งห้องใหญ่เสียงยิ่งสะท้อนนาน (ค่าเริ่มต้น
0.15เหมาะกับแนวป๊อปทั่วไป) - Wetness level / Dryness level: สัดส่วนความฉ่ำของคอรัสเทียบกับเสียงเนื้อแท้ (ค่ามาตรฐานคือ
0.2และ0.8)
- Room size: ตั้งความกว้างของห้องสมมุติ ยิ่งห้องใหญ่เสียงยิ่งสะท้อนนาน (ค่าเริ่มต้น
- Volume controls (dB): ปรับความดัง-เบา ของเส้นเสียง
Main gain:ความดังเสียงร้อง AI ตัวหลักInstrumental gain:ความดังของเสียงดนตรี (Backing track)Backup gain:ความดังของเสียงร้องประสานหรือคอรัส (ถ้ามี) (หากลองทำมาฟังแล้วเสียงร้องล่มดนตรี ให้กลับมาเพิ่ม Main gain หรือลด Instrumental gain ครับ)
💾 Audio output (ส่งออกผลงาน)
- Output name: ตั้งชื่อไฟล์ผลลัพธ์ (เช่น Song Title (AI Cover)) ถ้าไม่ตั้งระบบจะคัดลอกชื่อต้นฉบับมาดัดแปลงให้
- Output sample rate: ความละเอียดของเสียง ทิ้งไว้ที่
44100(มาตรฐาน CD) ถือว่าคมชัดมากแล้ว - Output format: นามสกุลไฟล์เสียง เลือกได้ทั้ง
mp3,flac, และwav(รับจบที่mp3ขนาดไฟล์จะเล็กและส่งต่อเพื่อนง่ายครับ)

🎧 ขั้นตอนสุดท้าย: รอดาวน์โหลดผลงาน!
หลังจากตั้งค่าออปชันอย่างหนำใจแล้ว ให้กระแทกคลิกที่ปุ่ม Generate สีฟ้าใหญ่ๆ ด้านล่างได้เลยครับ ระบบจะเริ่มทำงาน:
- ดูดเสียงจาก YouTube (ถ้าใส่ลิงก์)
- แยกดนตรี กับ เสียงร้อง ด้วย AI
- เอาเสียงร้องไปทับด้วยโมเดลเสียงใหม่
- จับยัดเข้าเครื่องมิกเซอร์ (Reverb & Volumes) ยำรวมกันให้เสร็จสรรพ!
เมื่อช่องความคืบหน้าโหลดถึง 100% จะมีกรอบพื้นที่ชื่อว่า Song cover และมีไอคอนโน้ตดนตรีโผล่ขึ้นมาด้านล่างสุด พร้อม ปุ่ม Play (ตัวอย่างเสียง) และ ปุ่มขีดสามขีดเพื่อเลือกคำสั่งดาวน์โหลด
ลองไปแปลงเสียงตามทำกันดูนะครับ ผลลัพธ์ปั่นๆ และฮาๆ รอให้คุณสร้างสรรค์อยู่อีกเพียบ! 🎵✨
แชร์บทความนี้
ช่วยแชร์ความรู้ให้เพื่อนๆ ได้อ่านกัน


