Các giả thiết cơ bản đằng sau ước lượng chuyển động là
các mô hình tương ứng với đối tượng và nền tảng trong một
khung di chuyển chuỗi video trong khung để hình thành
các đối tượng tương ứng trên khung tiếp theo. Ý tưởng
đằng sau khối hợp là để chia khung hiện tại vào một
ma trận của các 'khối macro' mà sau đó được so sánh với
khối tương ứng và các nước láng giềng lân cận của nó trong các trước
khung để tạo ra một vector mà quy định sự chuyển động của một
khối vĩ mô từ một địa điểm một trong các trước
khung. Phong trào này được tính cho tất cả các khối vĩ mô
bao gồm một khung hình, tạo các chuyển động được ước tính trong
khung hiện tại. Khu vực tìm kiếm cho một trận đấu khối vĩ mô tốt
là hạn chế đến p pixel trên bốn chân bên của
khối macro tương ứng trong khung trước đó. Đây 'p' được
gọi là các tham số tìm kiếm. Chuyển động lớn hơn yêu cầu một lớn hơn
p, và các tham số tìm kiếm lớn hơn các chi tiết
quá trình tính toán đắt tiền của ước lượng chuyển động
trở nên. Thông thường các khối vĩ mô được thực hiện như là một vuông mặt
16 điểm ảnh, và các thông số tìm kiếm p là 7 pixels. Ý tưởng này được
thể hiện trong hình 2. Việc kết hợp của một khối macro với
nhau dựa trên đầu ra của một hàm chi phí. Các macro
block mà kết quả trong chi phí ít nhất là một trong đó phù hợp với
gần khối hiện nay. Có chức năng chi phí khác nhau, trong
đó phổ biến nhất và ít tính toán đắt tiền là
Mean Difference Absolute (MAD) cho bởi phương trình (i).
Một chức năng chi phí là Mean Squared Error (MSE) cho bởi
phương trình (ii).
đang được dịch, vui lòng đợi..