Một trong những điểm nổi bật nhất của Veo 3 là khả năng hiểu và làm theo các hướng dẫn được đánh dấu trên hình ảnh. Nói cách khác, bạn chỉ cần tải lên một bức ảnh, đánh dấu các vị trí, và viết ngắn gọn bạn muốn điều gì xảy ra, là Veo 3 sẽ tự động tạo ra video theo đúng ý tưởng đó.
Tính năng này cực kỳ hữu ích cho những ai muốn làm video theo kịch bản cụ thể mà không cần viết mô tả dài dòng. Tất cả những gì bạn cần là một hình ảnh và vài dòng chú thích.
🛠️ Cách sử dụng tính năng này của Veo 3
🖼️ Bước 1: Chuẩn bị hình ảnh và chú thích
- Chọn một hình ảnh nền: Đây là khung cảnh chính cho video bạn muốn tạo. Hãy chọn ảnh rõ ràng và có đủ chi tiết.
- Đánh dấu các vị trí quan trọng: Dùng các phần mềm chỉnh ảnh như Canva, Photoshop hoặc bất kỳ công cụ nào cho phép bạn thêm chữ, vẽ hộp, mũi tên...

Viết hướng dẫn ngắn gọn tại mỗi khu vực đã đánh dấu. Ví dụ:
- "Nhân vật đứng lên"
- "Ngọn lửa nhỏ dần"
- "Xuất hiện một bóng đen"
👉 Mẹo: Bạn càng viết rõ ràng, Veo 3 càng dễ hiểu và làm chính xác hơn.
☁️ Bước 2: Tải hình ảnh lên Veo 3 và ra lệnh
- Đăng nhập vào nền tảng Veo 3 (qua website hoặc API nếu bạn dùng kỹ thuật).
- Tải hình ảnh đã chú thích lên hệ thống.
- Viết thêm một dòng lệnh tổng quát, ví dụ:
“Tạo video dựa trên hình ảnh này. Hãy thực hiện các hành động theo chú thích có trong ảnh.”
Sau đó, Veo 3 sẽ xử lý và tạo ra một đoạn video đúng với nội dung bạn mong muốn. Thời gian chờ có thể vài phút, tuỳ vào độ dài và độ phức tạp.
📌 Xem thêm:
👉 Hướng dẫn toàn diện về Google Veo
🎬 Bước 3: Xem kết quả và chỉnh sửa nếu cần
- Xem video đầu ra: Kiểm tra xem các hành động trong video có đúng như bạn yêu cầu không.
- Chỉnh sửa nếu cần: Nếu chưa đúng, bạn có thể:
- Thay đổi chú thích,
- Sửa lại hình ảnh,
- Hoặc thêm lệnh rõ ràng hơn.
Sau đó tải lại và thử lại một lần nữa.
💡 Ví dụ minh hoạ cụ thể
Google Veo 3 understands spatial prompts.
— Jerrod Lew (@jerrod_lew) July 26, 2025
Upload an image with some annotations and ask Veo 3 to follow the instructions in your prompt.
Here's how to do it, and some examples. pic.twitter.com/gwFXQmxzAX
Bạn muốn tạo một đoạn video ngắn có bối cảnh sau:
“Một phi hành gia đang ngồi trong hang, ngọn lửa cháy phía sau, rồi phi hành gia đứng lên, ngọn lửa nhỏ dần và một bóng đen xuất hiện.”
Bạn sẽ làm như sau:
- Chọn hình ảnh nền: Một bức ảnh phi hành gia đang ngồi trong hang có lửa phía sau.
- Chú thích trong ảnh:
- Vẽ hộp quanh nhân vật, ghi: “Phi hành gia đứng lên”
- Vẽ hộp quanh ngọn lửa, ghi: “Ngọn lửa giảm dần”
- Vẽ hộp ở góc tối trong hang, ghi: “Bóng đen xuất hiện”
- Lệnh gửi cho Veo 3:
“Tạo video từ hình ảnh này. Làm theo các hành động được chú thích.”
Kết quả: Veo 3 sẽ tạo ra video đúng như vậy: nhân vật đứng dậy, ngọn lửa yếu đi, và bóng đen xuất hiện.
✅ Lợi ích của tính năng này
- 🎯 Chính xác và trực quan: Bạn không cần mô tả bằng văn bản dài dòng – chỉ cần vẽ và ghi chú thích.
- ⚡ Tiết kiệm thời gian: Ít thao tác hơn, hiệu quả hơn.
- 🎨 Tự do sáng tạo: Dễ dàng làm video theo kịch bản bạn nghĩ ra, kể cả các tình huống phức tạp.
🧠 Tổng kết
Tính năng “hiểu và làm theo lệnh không gian từ hình ảnh” của Google Veo 3 giúp quá trình làm video trở nên đơn giản, nhanh chóng, và trực quan hơn bao giờ hết. Dù bạn là nhà sáng tạo nội dung cá nhân hay một nhóm làm phim chuyên nghiệp, công cụ này sẽ giúp bạn biến ý tưởng thành video một cách dễ dàng và thông minh.