Rotation Bất Biến Hình ảnh Mô tả với Local Binary Pattern Histogram Fourier Điểm
Timo Ahonen1, Jir'ı Matas2, Chu He3,1, và Matti Pietik¨ainen1
1
Machine Vision Group, Đại học Oulu, Phần Lan
{tahonen, MKP} @ ee.oulu.fi
2
Trung tâm Máy Percpetion, Bộ môn Điều khiển học,
Khoa Elec. Eng., Đại học Kỹ thuật Séc tại Prague matas@cmp.felk.cvut.cz
3
Trường Thông tin điện tử, Đại học Vũ Hán, Trung Quốc chuhe.whu@gmail.com
Tóm tắt. Trong bài báo này, chúng tôi đề xuất tính năng Local Binary Pattern Histogram Fourier (LBP-HF), một cuốn tiểu thuyết xoay ảnh bất biến mô tả tính từ biến đổi Fourier rời rạc của mô hình nhị phân địa phương (LBP) biểu đồ. Không giống như hầu hết các biểu đồ dựa trên mô tả kết cấu bất biến khác mà bình thường hóa luân chuyển tại địa phương, các bất biến đề xuất được xây dựng trên toàn cầu cho toàn bộ khu vực được mô tả. Ngoài việc là vòng xoay bất biến, tính năng LBP-HF giữ lại tính chất cao phân biệt của biểu đồ LBP. Trong các thí nghiệm, người ta thấy những tính năng tốt hơn không bất biến và phiên bản trước đó xoay LBP bất biến và mô tả các MR8 trong phân loại kết cấu, phân loại và nhận dạng khuôn mặt kiểm tra vật liệu.
1 Giới thiệu
Rotation phân tích kết cấu bất biến là một vấn đề nghiên cứu rộng rãi [1] , [2], [3]. Nó nhằm mục đích cung cấp với các tính năng kết cấu đó là bất biến để góc quay của hình ảnh kết cấu đầu vào. Hơn nữa, các tính năng thông thường nên cũng mạnh mẽ với các điều kiện hình ảnh như thay đổi ánh sáng.
Khi mô tả sự xuất hiện tại địa phương, ví dụ, bằng cách sử dụng đồng lần xuất hiện của các giá trị màu xám hoặc phản ứng với ngân hàng bộ lọc và sau đó hình thành một mô tả toàn cầu bằng cách tính toán thống kê trên khu vực ảnh là một kỹ thuật cũng được thành lập trong kết cấu phân tích [4]. Cách tiếp cận này đã được mở rộng bởi một số tác giả để sản xuất các tính năng xoay bất biến bằng cách chuyển đổi mô tả từng địa phương để một đại diện bất biến kinh điển để quay các hình ảnh đầu vào [2], [3], [5]. Các số liệu thống kê mô tả toàn bộ khu vực sau đó được tính từ các địa phương chuyển đổi mô tả.
Mặc dù cách tiếp cận như vậy đã tạo ra kết quả tốt trong vòng quay bất biến phân loại kết cấu, họ có một số weaknesses.Most quan trọng, như mô tả mỗi địa phương (ví dụ, phản ứng của ngân hàng lọc) được chuyển để đại diện kinh điển một cách độc lập, sự phân bố tương đối của các hướng khác nhau là bị mất. Hơn nữa, như việc chuyển đổi cần phải được thực hiện cho từng texton, nó phải được tính toán đơn giản, nếu các chi phí tính toán tổng thể cần phải được thấp.
A.-B. Salberg, JY Hardeberg, và R. Jenssen (Eds.):. SCIA 2009, LNCS 5575, pp 61-70, 2009. c Springer-Verlag Berlin Heidelberg 2009
Trong bài báo này, chúng tôi đề xuất mới Pattern Binary tính năng Histogram Fourier địa phương (LBP -HF), một vòng quay bất biến hình ảnh mô tả dựa trên thống nhất mẫu nhị phân cục bộ (LBP) [2]. LBP là một nhà điều hành để mô tả hình ảnh đó là dựa trên các dấu hiệu của sự khác nhau của các điểm ảnh lân cận. Đó là nhanh chóng để tính toán và bất biến để thay đổi độ xám đơn điệu của hình ảnh. Mặc dù là đơn giản, nó là rất mô tả, được chứng thực bởi các nhiều loại nhiệm vụ khác nhau nó đã được áp dụng thành công. Các biểu đồ LBP đã được chứng minh là một tính năng hình ảnh được áp dụng rộng rãi cho, ví dụ, phân loại kết cấu, phân tích khuôn mặt, nền Video trừ, mô tả khu vực quan tâm, etc1.
Không giống như các tính năng xoay bất biến địa phương trước đó, các mô tả LBP-HF được hình thành bởi tính đầu tiên một biểu đồ LBP không bất biến trên toàn bộ khu vực và sau đó xây dựng các tính năng luân phiên bất biến từ biểu đồ. Điều này có nghĩa là vòng xoay bất biến là đạt được trên toàn cầu, và các tính năng là như vậy, bất biến đối với phép quay của tín hiệu đầu vào toàn bộ nhưng họ vẫn giữ lại các thông tin về phân bố tương đối định hướng khác nhau của mô hình nhị phân địa phương thống nhất.
2 Rotation bất biến Pattern Binary địa phương mô tả
Vòng xoay đề xuất bất biến tính năng mô hình biểu đồ nhị phân Fourier địa phương dựa trên thống nhất biểu đồ mô hình nhị phân của địa phương. Đầu tiên, các phương pháp LBP được xem xét ngắn gọn và các tính năng LBP-HF sau đó được giới thiệu.
2.1 The Local Binary Pattern Operator
Nhà điều hành mô hình nhị phân địa phương [2] là một phương tiện mạnh mẽ của mô tả kết cấu. Phiên bản gốc của các nhà điều hành nhãn pixel hình ảnh bởi ngưỡng những 3x3-khu phố của mỗi điểm ảnh với giá trị trung tâm và cách tổng hợp các giá trị thresholded trọng bởi quyền hạn của hai người.
Các nhà điều hành cũng có thể được mở rộng để sử dụng các khu phố của các kích cỡ khác nhau [2] ( Xem hình 1). Để làm điều này, một khu phố tròn ký hiệu là (P, R) được định nghĩa. Ở đây P đại diện cho số điểm lấy mẫu và R là bán kính của khu phố. Những điểm lấy mẫu trên điểm ảnh (x, y) nằm ở tọa độ (xp, yp) = (x + Rcos (2πp / P), y - Rsin (2πp / P)). Khi một điểm lấy mẫu không nằm ở tọa độ số nguyên, giá trị điểm ảnh được bilinearly nội suy. Bây giờ các nhãn LBP cho các điểm ảnh trung tâm (x, y) của ảnh f (x, y) là thu được thông qua
, (1)
trong đó s (z) là hàm ngưỡng
(2) 1 Xem LBP bibliography tại http: // www .ee.oulu.fi / MVG / trang / LBP bibliography Hình 1. Ba khu phố tròn: (8,1), (16,2), (24,3). Các giá trị điểm ảnh được bilinearly suy bất cứ khi nào các điểm lấy mẫu không phải là ở trung tâm của một điểm ảnh. Mở rộng thêm cho các nhà điều hành ban đầu như vậy gọi là mô hình thống nhất [2]. Một mô hình nhị phân địa phương được gọi là đồng nhất nếu các mô hình nhị phân chứa ít nhất hai chuyển bitwise 0-1 hoặc ngược lại khi các mẫu bit được coi là hình tròn. Trong tính toán của biểu đồ LBP, mẫu đồng phục được sử dụng để biểu đồ có một thùng riêng biệt cho mỗi mẫu đồng phục và tất cả các mẫu không đồng nhất được gán cho một thùng. 58 mẫu đồng phục có thể trong khu phố 8 điểm lấy mẫu được hiển thị trong hình. 2. Người điều khiển xoay LBP bất biến ban đầu, ký hiệu ở đây là LBPriu2, đạt được bằng cách xoay tròn mỗi mẫu bit với giá trị tối thiểu. Ví dụ, các bit tuần tự 1000011, 1110000 và 0011100 phát sinh từ phép quay khác nhau của các mô hình cùng một địa phương và tất cả đều tương ứng với trình tự bình thường 0000111. Trong hình. 2 điều này có nghĩa rằng tất cả các mẫu từ một hàng được thay thế bằng một nhãn hiệu duy nhất. 2.2 Descriptors bất biến từ LBP Histograms Chúng ta hãy biểu thị một mô hình thống nhất LBP cụ thể bằng UP (n, r). Các cặp (n, r) xác định một mô hình thống nhất để n là số bit 1 trong mô hình (tương ứng với số hàng trong hình. 2) và r là vòng quay của mô hình (số cột trong hình 2). . Bây giờ nếu các khu phố có P điểm lấy mẫu, n giá được giá trị từ 0 đến P 1, trong đó n = P + 1 là nhãn đặc biệt đánh dấu tất cả các mẫu không đồng nhất. Hơn nữa, khi 1 ≤ n ≤ P - 1, vòng quay của mô hình là trong khoảng 0 ≤ r ≤ P Let) biểu thị sự quay của ảnh I (x, y) bởi độ α. Theo vòng quay này, điểm (x, y) được luân chuyển đến vị trí (). Nếu chúng ta đặt một khu vực lấy mẫu tròn trên điểm I (x, y) và), chúng tôi thấy rằng nó cũng quay bởi α◦. Xem hình. 3. Nếu xoay được giới hạn bội số của góc giữa hai điểm lấy mẫu, tức là 1, điều này làm quay khu phố lấy mẫu chính xác bằng một bước rời rạc. Vì vậy, hình thống nhất UP (n, r) tại điểm (x, y) được thay thế bởi mô hình thống nhất UP (n, r + P mod) tại điểm (của hình ảnh xoay. Bây giờ xem xét LBP thống nhất biểu đồ hI (UP ( n, r)). Các giá trị hI histogram tại bin UP (n, r) là số lần xuất hiện của bộ đồng phục UP mẫu (n, r) trong hình ảnh I. Hình 2. 58 mẫu đồng phục khác nhau trong (8, R ) khu . Nếu hình ảnh tôi được quay bằng, dựa trên các lý do trên, luân chuyển này của hình ảnh đầu vào gây ra một sự thay đổi tuần hoàn trong các biểu đồ theo từng hàng, hIα◦ (UP (n, r + a)) = hI (UP (n, r)) (3) Ví dụ, trong trường hợp của 8 xóm LBP, khi hình ảnh đầu vào được quay bằng 45◦, giá trị từ biểu đồ bin U8 (1,0) = 000000001b chuyển đến bin U8 ( 1,1) = 00000010b, giá trị từ bin U8 (1,1) để bin U8 (1,2), vv Dựa trên tài sản, trong đó nói rằng luân gây ra sự thay đổi trong các đại diện cực (P, R) của khu phố , chúng tôi đề xuất một lớp học đặc trưng đó là bất biến chuyển động quay của hình ảnh đầu vào, cụ thể là các tính năng như vậy, tính theo biểu đồ hàng đầu vào, đó là bất biến để thay đổi theo chu kỳ. Chúng tôi sử dụng Discrete Fourier Transform để xây dựng các tính năng này. Hãy H (n, •) là DFT của hàng thứ n của hI histogram (UP (n, r)), tức là . (4) Bây giờ cho DFT nó cho rằng một sự thay đổi theo chu kỳ của các vector đầu vào gây ra một sự thay đổi giai đoạn trong các hệ số DFT. Nếu)), sau đó , (5) Hình 3. Ảnh hưởng của luân chuyển hình ảnh vào các điểm trong các khu phố tròn và do đó, với bất kỳ 1 ≤ n1, n2 ≤ P - 1 . nơi) biểu thị phức liên hợp của H (n2, u) Điều này cho thấy rằng với bất kỳ 1 ≤ n1, n2 ≤ P -1 và 0 ≤ u ≤ P -1, các tính năng LBP, (7) là bất biến để thay đổi theo chu kỳ của các hàng của hI (UP (n, r)) và do đó, họ là bất biến cũng phải quay của đầu vào hình ảnh tôi (x, y). Các Fourier phổ độ lớn Hình 4. Cột 1: hình ảnh Texture vào định hướng 0◦ và 90◦. Cột thứ 2: thùng 1-56 của biểu đồ LBPu2 tương ứng. Cột thứ 3: Rotation tính năng bất biến | H (n, u) |, 1 ≤ n ≤ 7,0 ≤ u ≤ 5, (đường liền) và LBPriu2 (tròn, đường nét đứt). Lưu ý rằng các biểu đồ LBPu2 cho hai hình ảnh là khác nhau rõ rệt, nhưng | H (n, u) |. Tính năng này là gần như bằng nhau ) (8) có thể được coi là một trường hợp đặc biệt của các tính năng này. Hơn nữa cũng cần lưu ý rằng quang phổ độ Fourier chứa LBPriu2 tính năng như là một tập hợp con, kể từ . (9) Một minh họa cho các tính năng này là trong hình. 4 3 thí nghiệm Chúng tôi đã thử nghiệm hiệu suất của các bộ mô tả đề xuất trong ba kịch bản khác nhau: phân loại kết cấu, vật liệu phân loại và mô tả khuôn mặt. Vòng xoay bất biến đề xuất tính năng LBP-HF được so sánh với LBPu2 không bất biến và tự quay cũ hơn phiên bản bất biến LBPriu2. Trong các thí nghiệm phân loại kết cấu và vật liệu phân loại, mô tả MR8 [3] đã được sử dụng như một
đang được dịch, vui lòng đợi..