[FFMPEG] Chuyển đổi video với nhiều filter phức tạp

7/27/2019

Xin vui lòng chờ đợi
Dữ liệu bài viết đang được tải về



Nếu chưa biết FFMPEG là gì, thì các bạn có thể đọc trước ở đây nhé. Còn bây giờ chúng ta hãy thử ứng dụng FFMPEG vào một việc gì đó cụ thể nào.

Giả sử tôi có một bộ phim định dạng mp4 ở độ phân giải 1080p, yêu cầu đặt ra là phải re-scale video này về 720p, tăng tốc bộ phim lên nhanh hơn 15%, lồng thêm logo (watermark), lồng thêm phụ đề hardsub, sau đó render thành một file video mới.

Giả sử không có FFMPEG trong tay, sẽ có khó có công cụ nào có thể đáp ứng hết được những yêu cầu trên chỉ với một lần render duy nhất, nếu có thì gần như chắc chắn phải là công cụ trả phí. Nếu chỉ dùng công cụ miễn phí, tôi sẽ cần ít nhất 2 lần render: Đầu tiên tôi dùng Handbrake để hardsub và đưa bộ phim về 720p trước, sau đó tôi tiếp tục dùng một trình biên tập video nào đó để chỉnh tốc độ video và gắn thêm watermark vào.

Với FFMPEG bạn chỉ cần một dòng lệnh duy nhất để đáp ứng toàn bộ yêu cầu trên:

ffmpeg -i video.mp4 -i logo.png -filter_complex "[0:0]setpts=0.85*PTS[i];[i]scale=1280:720[j];[j]subtitles=video.srt[k];[k]overlay=10:10[l];[0:1]atempo=1/0.85[p]" -map "[l]" -map "[p]" -preset slow -crf 18 video_new.mp4

Giải thích:

-i là để báo cho chương trình biết các input đầu vào, ở đây bao gồm file video.mp4 và file watermark logo.png.

Filde video.mp4 ở đây tôi sẽ sử dụng file này (video được tôi tải từ YouTube có tên "The disarming case to act right now on climate change | Greta Thunberg"):


Sau đó tôi tiếp tục tải phần phụ đề tiếng Việt của video, đổi tên thành video.srt, đặt tất cả (video.mp4, video.srt, logo.png) vào chung một thư mục như sau:


Với các loại render có nhiều yêu cầu phức tạp, chúng ta cần phải kết hợp nhiều filter với nhau, do đó lựa chọn thích hợp nhất là sử dụng filter complex.

File video của tôi ở đây chỉ có 2 stream duy nhất: stream 0:0 là video, còn stream 0:1 chính là audio. Có những file video sẽ có nhiều hơn 2 stream, dễ thấy nhất là các file phim MKV có nhiều audio track ứng với các ngôn ngữ khác nhau.

Để biết chính xác file video của bạn có những stream nào, đơn giản sử dụng lệnh:

ffmpeg -i video.mp4

Như các bạn thấy bên dưới thì file video.mp4 chỉ có 2 stream là 0:0 và 0:1.


Câu lệnh [0:0]setpts=0.85*PTS[i]; giúp tăng tốc của video lên 85% (muốn tăng tốc video lên gấp đôi, tức 50% thì đổi thành [0:0]setpts=0.5*PTS[i];). i ở đây là một tên tham số do tôi tự đặt, có tác dụng đặt tên cho đầu ra là i, nếu bạn apply thêm filter cho video thì i sẽ là đầu vào cho filter tiếp theo. Ví dụ câu lệnh tiếp theo [i]scale=1280:720[j]; như bạn thấy ở đây thì đầu vào của filter scale là i, tôi scale video về 720p, sau đó đặt tên cho đầu ra của scale filter là j. Tương tự như vậy tôi apply tiếp filter subtitles [j]subtitles=en.video[k] và đặt tên đầu ra là k. Cuối cùng tôi chỉ vị trí gắn logo bằng filter overlay [k]overlay=10:10[l]; với k là đầu vào từ filter subtitles và l là đầu ra của filter overlay.

Sau đó, tôi chuyển filter audio tempo cho track audio 0:1, [0:1]atempo=1/0.85[p]. Vì video tăng tốc nhưng audio sẽ không tăng theo, nếu không có câu lệnh này, video sau khi xuất xong sẽ có hiện tượng hình nhanh hơn tiếng, không ăn khớp nhau. Để 2 stream này khớp nhau, bạn chỉ cần gán tốc độ là 1 chia cho chính giá trị tăng tốc của video (ở đây 0.85). Đầu ra của filter atempo tôi đặt tên p.

Vì không apply thêm filter nào nữa nên tôi map 2 stream đã xử lý vào video mới bằng lệnh -map "[l]" -map "[p]" với l là đầu ra cuối cùng dãy filter video, và p là đầu ra cuối cùng của dãy filter audio.

Câu lệnh -preset slow không bắt buộc phải có, nó chỉ định thời gian nén của video. Ví dụ nếu bạn chọn ultrafast thì thời gian xử lý sẽ là nhanh nhất, nhưng size của video output sẽ khá lớn. Ngược lại nếu bạn chọn càng chậm thì size càng nhỏ. Nếu bạn không chọn preset nào thì mặc định sẽ là medium. Danh sách các preset sẵn có xem bên dưới:

  • ultrafast
  • superfast
  • veryfast
  • faster
  • fast
  • medium – default preset
  • slow
  • slower
  • veryslow
-crf (constant rate factor) để chỉ định chất lượng của video output có giá trị trong khoảng từ 0 tới 51, với 0 là lossless. Mặc định nếu bạn không khai báo gì thì giá trị này là 23. Thông thường nếu bạn chọn preset là slow thì chọn crf là 17 hoặc 18 sẽ tối ưu nhất.

Cuối cùng, tôi đặt tên cho video sau khi được xử lý xong là video_new.mp4. Như các bạn thấy bên dưới thì video gốc có độ dài hơn 11 phút, nhưng video sau xử lý chỉ có hơn 9 phút rưỡi mà thôi. Đó là kết quả của việc xử lý tăng tốc video và audio.

Và đây là kết quả cuối cùng:


Không quá đơn giản, nhưng cũng không quá phức tạp phải không nào? Chúc các bạn thành công!!!

Cảm ơn bạn đã đọc bài viết của Cuộc Sống Tối Giản. Đây là một blog cá nhân, được lập ra nhằm mục đích lưu trữ và chia sẻ mọi thứ hay ho theo chủ quan của chủ sở hữu. Có lẽ vì vậy mà bạn sẽ thấy blog này hơi (rất) tạp nham. Mọi chủ đề đều có thể được tìm thấy ở đây, từ tâm sự cá nhân, kinh nghiệm sống, phim ảnh, âm nhạc, lập trình... Phần lớn các bài đăng trong blog này đều được tự viết, trừ các bài có tag "Sponsored" là được tài trợ, quảng cáo, hoặc sưu tầm. Để ủng hộ blog, bạn có thể share những bài viết hay tới bạn bè, người thân, hoặc có thể follow Kênh YouTube của chúng tôi. Nếu cần liên hệ giải đáp thắc mắc hoặc đặt quảng cáo, vui lòng gửi mail theo địa chỉ songtoigianvn@gmail.com. Một lần nữa xin được cảm ơn rất nhiều!!!

BÌNH LUẬN



BÀI VIẾT LIÊN QUAN

© Copyright 2018 by CUỘC SỐNG TỐI GIẢN
Loading...
CUỘC SỐNG TỐI GIẢN