Bạn đang muốn tạo một video trong đó nhiều nhân vật cùng nhép miệng, đối thoại sinh động như thật? Với Runway ML, bạn hoàn toàn có thể biến một ảnh tĩnh hoặc video sẵn có thành một đoạn hội thoại sống động nhờ tính năng Lip Sync Video.
💡 Phù hợp cho video TikTok, hoạt hình, hồi sinh ảnh cũ, dựng podcast video… khi bạn cần nhiều người cùng nói chuyện một cách tự nhiên.
✨ Tổng quan phương pháp
Runway ML sử dụng AI để:
- Phân tích khuôn mặt trong ảnh hoặc video
- Cho phép bạn gán từng đoạn thoại cho từng người (tách biệt)
- Tạo hoạt ảnh miệng (lip sync) chính xác theo giọng nói hoặc văn bản nhập vào
🪜 Các bước thực hiện chi tiết
🖼️ Bước 1: Tải lên ảnh hoặc video gốc

- Truy cập https://app.runwayml.com
- Chọn All Tools > Lip Sync Video
- Nhấn “Upload” và chọn ảnh (có chứa nhiều người) hoặc video
- Hệ thống sẽ quét khuôn mặt tự động và gán nhãn như "Face 1", "Face 2"…


🎙️ Bước 2: Tạo audio lời thoại cho từng nhân vật
Để khẩu hình chính xác và biểu cảm tự nhiên, bạn nên chuẩn bị file âm thanh riêng cho mỗi nhân vật. Bạn cũng có thể sử dụng thoại trực tiếp ngay trong Runway (xem bước 3)
🎧 Gợi ý công cụ tạo giọng nói (TTS):
🔹 1. TTSMaker.com – miễn phí, dễ dùng
- Hỗ trợ giọng nói tiếng Việt và nhiều ngôn ngữ khác
- Có thể chọn giọng nam/nữ, tốc độ nói
- Xuất file .mp3 để gán vào Runway
📌 Phù hợp cho người mới bắt đầu hoặc không có micro thu âm

🔹 2. ElevenLabs.io – chuyên nghiệp, chất lượng cao
- Giọng nói rất tự nhiên, giống người thật
- Có thể tạo giọng riêng (clone voice)
- Hỗ trợ cả tiếng Anh và một số ngôn ngữ khác
📌 Phù hợp cho nội dung chuyên nghiệp, video dài hoặc phim hoạt hình
🗣️ Bước 3: Gán lời thoại vào Runway
🔹 Chọn khuôn mặt (Face 1, Face 2…)
- Runway sẽ hiển thị từng khuôn mặt đã nhận diện
- Click vào từng người để gán thoại tương ứng

🔹 Upload file audio
- Nhấn nút “Upload Audio” và chọn file âm thanh vừa tạo từ TTSMaker hoặc ElevenLabs
- Gán đúng file cho đúng nhân vật
💡 Bạn có thể nhấp vào biểu tượng “🎙️” để chọn giọng nói (chưa hỗ trợ giọng Việt) và nhập lời thoại.

➕ Bước 4: Thêm nhân vật khác (Add Speaker)
- Sau khi hoàn tất nhân vật đầu tiên:
- Nhấn “Add Speaker”
- Chọn “Face 2”, “Face 3”…
- Gán tiếp lời thoại tương ứng

Runway hiện cho phép bạn thêm tối đa 10 người nói trong một cảnh.
🛠️ Bước 5: Tạo & Xuất video
- Kiểm tra lại mọi lời thoại, thời điểm bắt đầu và dừng của từng người
- Nhấn “Generate” để tạo video
- Sau vài phút, bạn có thể xem trước và tải video hoàn chỉnh
✅ Kết luận
Chỉ với một tấm ảnh và vài câu thoại, bạn hoàn toàn có thể thổi hồn vào những nhân vật tưởng chừng vô tri – để họ nói chuyện, biểu cảm và kể chuyện như thật. Runway ML không chỉ giúp bạn tạo video Lip Sync nhiều nhân vật một cách nhanh chóng, mà còn mở ra một thế giới sáng tạo không giới hạn: từ hoạt hình, video TikTok, đến hồi sinh ký ức qua ảnh cũ.
🎯 Dù bạn là content creator, giáo viên, marketer hay đơn giản là người thích “vọc AI”, thì đây chính là lúc để biến trí tưởng tượng của bạn thành video thực thụ.
👉 Hãy bắt đầu với Runway ML + TTSMaker hoặc ElevenLabs ngay hôm nay – và để các nhân vật của bạn… tự lên tiếng!