Kling 3.0: Điều khiển chuyển động chuẩn đạo diễn cho video AI
Pan. Tilt. Zoom. Roll. Mọi chuyển động điện ảnh, kết xuất trong vài giây.
Kling 3.0 giới thiệu kiến trúc chuyển động Omni — một hệ thống hợp nhất xử lý chuyển động camera, hoạt họa chủ thể và vật lý môi trường trong một lần duy nhất. Kết quả là video chuyển động như được lên kế hoạch từ giai đoạn tiền kỳ, chứ không phải do thuật toán “đoán mò”.
First frame of the video
Last frame of the video




Example Output
See what you can create with the parameters above
Có gì mới trong Kling 3.0
Mô hình Omni là thay đổi nổi bật nhất — nhưng những cải tiến còn sâu hơn cả kiến trúc. Dưới đây là những điểm thực sự quan trọng cho quy trình làm việc của bạn.
Pan & Tilt
Thiết lập chính xác các chuyển động quét ngang và cung chuyển dọc cho cảnh quay của bạn. Mô hình thực hiện mượt như bạn kỳ vọng từ một bộ gimbal vật lý — không giật, không trôi giữa các khung hình.
Zoom & Dolly
Mô phỏng zoom quang học hoặc dolly tiến. Kling 3.0 tái hiện sự thay đổi độ sâu trường ảnh và độ tách parallax giữa tiền cảnh và hậu cảnh — không phải cắt khung, mà là thay đổi phối cảnh thực sự.
Roll & Dutch Angle
Áp dụng chuyển động roll có kiểm soát để tạo hiệu ứng phong cách. Cảnh vẫn nhất quán khi đường chân trời nghiêng — chủ thể bám theo đúng, và không bị méo ở rìa khung hình.
Kiến trúc Omni
Các phiên bản trước xử lý chuyển động camera và chuyển động chủ thể như những lượt suy luận tách rời, dễ gây xung đột khi nhiều yếu tố cùng chuyển động. Omni xử lý toàn bộ cảnh trong một lượt — mọi yếu tố chuyển động theo mối quan hệ nhất quán về mặt vật lý với nhau.
Tạo video 10–30 giây
Đủ nhanh để bạn lặp lại và tinh chỉnh một cách hiệu quả. Thử ba chuyển động camera khác nhau trên cùng một cảnh trong khoảng thời gian mà một công cụ cạnh tranh cần để trả về một kết quả.
Truy cập REST API
Truyền keyframe camera dưới dạng JSON, chọn preset chuyển động và nhận đầu ra qua webhook. Được xây dựng cho quy trình sản xuất, không chỉ để thử nghiệm.
Hướng dẫn Prompt cho Kling 3.0
Viết prompt để kiểm soát chuyển động đòi hỏi cách tiếp cận khác so với text-to-image. Mô hình Omni xem chỉ dẫn camera và hành vi của chủ thể là hai kênh ngữ nghĩa riêng biệt — hãy viết đúng như vậy.
Lỗi phổ biến nhất là trộn lẫn chỉ dẫn camera và chỉ dẫn cho chủ thể trong cùng một câu. Hãy viết hướng chuyển động camera trước, hành vi của chủ thể sau, phong cách hình ảnh cuối cùng. Mỗi phần thành một mệnh đề riêng. Mô hình sẽ tách chúng; cấu trúc prompt của bạn giúp mô hình làm điều đó chính xác.
Dolly Zoom (Hiệu ứng Vertigo)
Điện ảnh@START_IMAGE Camera thực hiện dolly-in chậm tiến về phía chủ thể, đồng thời zoom out để giữ nguyên kích thước chủ thể, tạo ra sự dịch chuyển phối cảnh kiểu vertigo. Chủ thể đứng yên và sắc nét. Hậu cảnh bị kéo giãn mạnh ra phía xa. Chuyển động mượt, kiểm soát tốt, grading màu điện ảnh, 16:9.
Hiệu quả nhất khi ảnh bắt đầu có tách biệt chiều sâu rõ giữa tiền cảnh và hậu cảnh. cfgScale 0.5–0.7 giúp bám sát chỉ dẫn chuyển động tối đa mà không khóa chặt phong cách quá mức.
Tracking Ngang Tốc Độ Cao
Hành động@START_IMAGE Camera pan nhanh từ trái sang phải để bám theo một chủ thể di chuyển nhanh ở tầm mắt. Hậu cảnh có motion blur, chủ thể vẫn sắc nét nhờ tracking. Nhịp chuyển động điện ảnh 24fps, cảm giác ống kính góc rộng, ánh sáng tương phản cao.
Thời lượng 5 giây cho hiệu ứng nén motion blur đẹp nhất. Kết hợp ảnh tham chiếu phần tử nếu bạn cần chủ thể giữ nhất quán giữa các khung hình.
Tiến Lên Hé Lộ (Crane Shot)
Toàn cảnh mở đầu@START_IMAGE Camera tilt lên từ từ từ tầm mặt đất, hé lộ một công trình cao hoặc phong cảnh rộng lớn. Chuyển động liên tục và mượt, không cắt cảnh. Rack focus nhẹ từ chi tiết tiền cảnh sang chủ thể ở xa. Ánh sáng giờ vàng, đặc trưng ống kính anamorphic.
Mô hình độ sâu của Kling 3.0 xử lý kéo nét (focus pull) rất tốt cho kiểu shot này. Ảnh bắt đầu nên có bố cục dọc rõ — khung hình càng “cao” thì hiệu ứng hé lộ càng dễ cảm nhận.
Kling 3.0 so với Runway Gen-4 so với Google Veo 3.1
So sánh kỹ thuật tập trung vào các khía cạnh quyết định chất lượng kiểm soát chuyển động
Ba mô hình này đại diện cho tuyến đầu hiện tại của công nghệ tạo video bằng AI. Điểm khác biệt lớn nhất nằm ở mức độ kiểm soát chuyển động mà chúng cung cấp — và mức độ nhất quán khi thực thi.
| Model | Điều khiển camera | Độ nhất quán giữa chủ thể và camera | Tốc độ tạo | Độ phân giải tối đa | Gói miễn phí | Truy cập API |
|---|---|---|---|---|---|---|
| Kling AI 3.0★ | Pan / Tilt / Zoom / Roll / Omni | Thống nhất (mô hình Omni) | 10–30 giây | 4K UHD | Có | REST API đầy đủ |
| Runway Gen-4 | Preset hạn chế | Thỉnh thoảng bị lệch | 45–90 giây | 1080p | Không | Chỉ có trong các gói trả phí |
| Google Veo 3.1 | Chỉ dựa trên prompt | Tốt nhưng thiếu nhất quán | 20–50 giây | 1080p | Không | Danh sách chờ |
| Sora (OpenAI) | Dựa trên storyboard | Thay đổi tùy trường hợp | 60–180 giây | 1080p | Không | Không |
Thử nghiệm nội bộ, tháng 4/2026. Kling 3.0 là mô hình duy nhất trong so sánh này vừa có gói tạo miễn phí vừa có REST API công khai.
Câu hỏi thường gặp
Những câu hỏi phổ biến về khả năng của Kling 3.0, quyền truy cập và cách tận dụng tối đa các công cụ điều khiển chuyển động
Giới thiệu về Kling AI 3.0
Kling 3.0 thay đổi gì so với Kling 2.x
Thay đổi cốt lõi về kiến trúc trong Kling 3.0 là chuyển sang suy luận cảnh thống nhất. Kling 2.6 trở về trước xử lý chuyển động camera và hoạt ảnh của chủ thể như hai lượt riêng biệt, hoạt động tốt với cảnh đơn giản nhưng dễ gặp vấn đề khi camera và chủ thể cần tương tác — chẳng hạn một cú máy bám theo một chủ thể đang di chuyển. Mô hình Omni giải quyết điều này bằng cách coi toàn bộ cảnh là một bài toán duy nhất, từ đó tạo ra kết quả nhất quán hơn về mặt vật lý trong các chuỗi chuyển động phức tạp.
Cách viết prompt hiệu quả để điều khiển chuyển động
Cách tiếp cận đáng tin cậy nhất là coi prompt như mô tả một cú máy dành cho quay phim: chỉ dẫn camera trước, hành vi của chủ thể sau, phong cách hình ảnh cuối cùng. Mô hình đã được huấn luyện để đọc chúng như các kênh ngữ nghĩa riêng biệt. Trộn chúng trong cùng một mệnh đề — “camera bám theo người đang chạy” — vẫn dùng được, nhưng tách ra sẽ cho thực thi chính xác hơn: “Camera tracking sang trái ở tầm mắt, giữ khoảng cách không đổi. Nhân vật chạy về phía phải khung hình.”
Kling 3.0 so với Runway và Sora
Điểm so sánh thực sự có ý nghĩa giữa các công cụ này là mức độ cụ thể trong điều khiển chuyển động. Runway Gen-4 nổi bật về tính nhất quán phong cách với những cảnh chậm, ít chuyển động. Sora xử lý video kể chuyện dài nhưng độ trễ cao và chưa có truy cập công khai. Kling 3.0 ở một vị trí khác: ưu tiên trao cho người dùng khả năng kiểm soát rõ ràng, có thể dự đoán về cách camera và các chủ thể di chuyển — điều quan trọng nhất khi chính chuyển động là ý đồ sáng tạo, chứ không chỉ là chi tiết nền.
Truy cập và giá
Kling 3.0 được cung cấp theo hệ thống tín dụng. Gói miễn phí — 10 tín dụng khi đăng ký, không cần thẻ — đủ số lần tạo để đánh giá đúng chất lượng điều khiển chuyển động. Các gói trả phí mở rộng từ 29 USD/tháng cho nhà sáng tạo cá nhân đến 99 USD/tháng cho truy cập API với xử lý theo lô. Tất cả các gói đều dùng cùng một mô hình Omni; khác biệt nằm ở độ phân giải đầu ra, mức độ ưu tiên hàng đợi và khả năng sử dụng API.
ai-motioncontrol.com là một nền tảng độc lập và không liên kết chính thức với Kuaishou, Runway, Google hoặc OpenAI. Kling AI là nhãn hiệu của Kuaishou Technology. Mọi nhãn hiệu khác thuộc về chủ sở hữu tương ứng.
