Xoay bất biến hình ảnh mô tả với tính năng Fourier địa phương nhị phân mẫu biểu đồTimo Ahonen1, Jiˇr´ı Matas2, Chu He3, 1, và Matti Pietik¨ainen11Máy tính tầm nhìn nhóm, University of Oulu, Phần Lan{tahonen,mkp}@ee.oulu.fi2Trung tâm máy Percpetion, Phòng điều khiển học,Các giảng viên của ELEC Eng., đại học kỹ thuật Séc tại Praha matas@cmp.felk.cvut.cz3Trường học điện tử thông tin, đại học Vũ Hán, Trung Quốc PR chuhe.whu@gmail.comTóm tắt. Trong bài này, chúng tôi đề xuất tính năng địa phương nhị phân mẫu biểu đồ Fourier (LBP-HF), một tiểu thuyết xoay bất biến hình ảnh mô tả tính từ biến đổi Fourier rời rạc của các mô hình nhị phân địa phương (LBP) histograms. Không giống như hầu hết các biểu đồ dựa bất biến kết cấu descriptor mà bình thường hóa quay tại địa phương, đề xuất invariants được xây dựng trên toàn cầu cho toàn bộ các khu vực để được mô tả. Ngoài việc luân chuyển bất biến, các tính năng LBP-HF giữ lại bản chất rất discriminative của LBP histograms. Trong các thí nghiệm, nó hiển thị các tính năng tốt hơn phiên bản phòng không phải là bất biến và trước đó quay bất biến LBP, mô tả MR8 trong phân loại kết cấu và vật liệu phân loại và khuôn mặt công nhận bài kiểm tra.1 giới thiệuXoay bất biến kết cấu phân tích là một nghiên cứu rộng rãi vấn đề [1], [2], [3]. Nó nhằm mục đích cung cấp với các tính năng kết cấu là bất biến để xoay góc của hình ảnh đầu vào kết cấu. Hơn nữa, các tính năng này nên thường được mạnh mẽ cũng để điều kiện hình thành hình ảnh như thay đổi chiếu sáng.Mô tả sự xuất hiện tại địa phương, ví dụ, bằng cách sử dụng đồng lần xuất hiện của các giá trị màu xám hoặc với bộ lọc ngân hàng hồi đáp và sau đó hình thành một mô tả toàn cầu bởi máy tính thống kê trên khu vực hình ảnh là một kỹ thuật cũng được thành lập trong kết cấu phân tích [4]. Cách tiếp cận này đã được mở rộng bởi nhiều tác gia để sản xuất tính năng bất biến xoay bằng cách chuyển đổi mỗi mô tả địa phương để một đại diện kinh điển bất biến với sự quay của hình ảnh nhập vào [2], [3], [5]. Thống kê mô tả toàn bộ khu vực sau đó được tính toán từ các descriptor chuyển địa phương.Mặc dù phương pháp tiếp cận như vậy đã sản xuất các kết quả tốt trong xoay bất biến kết cấu phân loại, họ có một số điểm yếu. Quan trọng nhất, như mỗi mô tả địa phương (ví dụ, là phản ứng lọc ngân hàng) được chuyển đến kinh điển đại diện một cách độc lập, bản phân phối tương đối của định hướng khác nhau là bị mất. Hơn nữa, như sự chuyển đổi cần phải được thực hiện cho mỗi texton, nó phải computationally đơn giản nếu chi phí tổng thể tính toán cần phải được thấp.A. B. Salberg, J.Y. Hardeberg, và R. Jenssen (chủ biên): SCIA 2009, LNCS 5575, trang 61-70, năm 2009. c Springer-Verlag Berlin Heidelberg năm 2009Trong bài này, chúng tôi đề xuất tính năng địa phương nhị phân mẫu biểu đồ Fourier mới lạ (LBP-HF), một mô tả bất biến hình ảnh quay dựa trên trang phục địa phương nhị phân mẫu (LBP) [2]. LBP là một nhà điều hành để mô tả hình ảnh dựa trên các dấu hiệu của sự khác biệt của giáp ranh pixel. Nó là nhanh chóng để tính toán và bất biến để thay đổi màu xám quy mô monotonic của hình ảnh. Dù đã được đơn giản, nó là rất mô tả, mà được chứng thực bởi sự đa dạng trong nhiệm vụ khác nhau nó đã được áp dụng thành công cho. Biểu đồ LBP đã chứng minh là một tính năng rộng rãi áp dụng hình ảnh cho, ví dụ, kết cấu phân loại, phân tích khuôn mặt, video nền trừ, quan tâm đến vùng mô tả, etc1.Không giống như các tính năng trước đó bất biến địa phương xoay, mô tả LBP-HF được hình thành bởi lần đầu tiên tính toán một biểu đồ LBP phòng không phải là bất biến trong toàn bộ khu vực và sau đó xây dựng các tính năng rotationally bất biến từ biểu đồ. Điều này có nghĩa rằng quay định đạt được trên toàn cầu, và các tính năng như vậy là bất biến với sự quay của tín hiệu đầu vào toàn bộ nhưng họ vẫn còn giữ lại các thông tin về các phân phối tương đối của các định hướng khác nhau của trang phục mô hình địa phương nhị phân.2 xoay bất biến mô hình địa phương nhị phân bộ mô tảCác biểu đồ bất biến mô hình địa phương nhị phân quay được đề xuất tính năng Fourier được dựa trên trang phục mô hình địa phương nhị phân histograms. Trước tiên, các phương pháp LBP một thời gian ngắn được nhận xét và tính năng LBP-HF được giới thiệu sau đó.2.1 các nhà điều hành địa phương nhị phân mẫuCác nhà điều hành địa phương nhị phân mẫu [2] là một phương tiện mạnh mẽ của kết cấu mô tả. Phiên bản gốc của các nhà điều hành nhãn hình ảnh điểm ảnh bởi thresholding khu phố 3 x 3 của mỗi điểm ảnh với giá trị Trung tâm và cách tổng hợp các giá trị thresholded trọng bởi các quyền hạn của hai.Các nhà điều hành cũng có thể được mở rộng để sử dụng vùng lân cận của các kích cỡ khác nhau [2] (xem Fig.1). Để làm điều này, một khu phố tròn ký hiệu là (P, R) được định nghĩa. Ở đây đại diện cho số lượng mẫu điểm P và R là bán kính của khu phố. Những điểm lấy mẫu xung quanh thành phố pixel (x, y) nằm ở tọa độ (xp, yp) = (x + Rcos(2πp/P), y − Rsin(2πp/P)). Khi nhiệt độ Lấy mẫu không nằm tại tọa độ nguyên, giá trị pixel bilinearly interpolated. Bây giờ nhãn LBP cho Trung tâm pixel (x, y) của hình ảnh f(x,y) thu được thông qua , (1)nơi s(z) là các chức năng thresholding (2) 1Xem LBP tài liệu tại thư mục http://www.ee.oulu.fi/mvg/page/lbp Fig.1. ba thông tư khu dân cư: (8,1), (16,2), (24,3). Các giá trị điểm ảnh bilinearly được interpolated bất cứ khi nào điểm lấy mẫu không phải là ở giữa của một điểm ảnh.Tiện ích mở rộng hơn nữa để các nhà điều hành ban đầu vì vậy được gọi là mô hình thống nhất [2]. Một mô hình nhị phân địa phương được gọi là thống nhất nếu các mô hình nhị phân có chứa tối đa hai bitwise quá trình chuyển đổi từ 0 đến 1 hoặc ngược khi các mô hình bit được xem là tròn. Trong tính toán của biểu đồ LBP, trang phục mô hình được sử dụng do đó biểu đồ có một thùng riêng biệt cho mỗi mô hình thống nhất và tất cả các mẫu trang phục phòng không được gán cho một thùng duy nhất. 58 mẫu có thể thống nhất trong khu phố của 8 mẫu điểm được minh họa trong hình 2.Các bản gốc quay vòng bất biến LBP nhà điều hành, biểu hiện ở đây là LBPriu2, đạt được bằng cách tròn xoay mỗi mô hình bit đến giá trị tối thiểu. Ví dụ, các chuỗi chút 1000011, 1110000 và 0011100 phát sinh từ các phép quay khác nhau của cùng một khuôn mẫu địa phương và tất cả đều tương ứng với trình tự bình thường 0000111. Trong hình 2, điều này có nghĩa rằng tất cả các mô hình từ một hàng được thay thế bằng một nhãn duy nhất.2.2 bộ mô tả bất biến từ LBP HistogramsHãy để chúng tôi biểu thị một mô hình cụ thể trang phục LBP bởi UP(n,r). Cặp (n, r) chỉ định một mô hình thống nhất do đó n là số 1-bit trong các mô hình (tương ứng với số hàng trong hình 2) và r là sự quay của các mô hình (cột số ở hình 2).Bây giờ nếu khu phố có điểm P mẫu, n được giá trị từ 0 đến P + 1, trong trường hợp n = P + 1 là nhãn hiệu đặc biệt đánh dấu tất cả các mô hình phòng không đồng phục. Hơn nữa, khi 1 ≤ n ≤ P − 1, sự quay của các mô hình là trong phạm vi0 ≤ r ≤ PHãy để) biểu thị sự quay của hình ảnh I(x,y) α độ. Theo chuyển động này, điểm (x, y) quay theo vị trí (). Nếu chúng tôi đặt một khu phố tròn mẫu vào điểm I(x,y) và), chúng tôi quan sát rằng nó cũng quay bởi α◦. Xem hình 3.Nếu các phép quay được giới hạn đối với số nguyên bội số của góc giữa hai điểm lấy mẫu, tức là 1, điều này quay khu phố mẫu chính xác bởi một bước rời rạc. Do đó các mô hình thống nhất UP(n,r) tại điểm (x, y) được thay thế bằng trang phục mô hình lập (n, r + một mod P) tại điểm (của xoay ảnh.Bây giờ hãy xem xét đồng phục LBP histograms hI(UP(n,r)). Biểu đồ giá trị chào tại bin UP(n,r) là số lần xuất hiện của mô hình thống nhất UP(n,r) trong hình ảnh tôi. Fig.2. The 58 mẫu khác nhau thống nhất trong (8, R) khu phố.Nếu hình ảnh tôi được quay bởi, dựa trên lý luận ở trên, chuyển động của hình ảnh nhập vào này gây ra một sự thay đổi nhóm cyclic trong biểu đồ dọc theo mỗi hàng,hIα◦ (lập (n, r + một)) = hI(UP(n,r)) (3)Ví dụ, trong trường hợp của người hàng xóm 8 LBP, khi hình ảnh nhập vào được quay bởi 45◦, các giá trị từ biểu đồ bin U8(1,0) = 000000001b di chuyển đến bin U8(1,1) = 00000010b, giá trị từ bin U8(1,1) bin U8(1,2), vv.Dựa trên tài sản, mà biểu rằng phép quay gây ra sự thay đổi trong các đại diện cực (P, R) của các khu phố, chúng tôi đề xuất một lớp các tính năng đó là bất biến để chuyển động của hình ảnh nhập vào, cụ thể là các tính năng, tính dọc theo dòng đầu vào biểu đồ, mà là bất biến để thay đổi nhóm cyclic.Chúng tôi sử dụng biến đổi Fourier rời rạc để xây dựng các tính năng này. Để H(n,•) là DFT của hàng thứ n của biểu đồ hI(UP(n,r)), tức là . (4)Bây giờ cho DFT nó giữ rằng một sự thay đổi nhóm cyclic của vector đầu vào gây ra một sự thay đổi giai đoạn trong hệ số DFT. If)), sau đó , (5) Fig.3. hiệu ứng hình ảnh quay trên điểm trong khu vực lân cận thông tưvà do đó, với bất kỳ n1 ≤ 1, n2 ≤ P − 1, nơi) là bắt liên hợp phức tạp của H(n2,u).Điều này cho thấy rằng với bất kỳ n1 ≤ 1, n2 ≤ P −1, 0 ≤ u ≤ P −1, các tính năngLBP, (7)là bất biến để thay đổi nhóm cyclic của các hàng của hI(UP(n,r)) và kết quả là, họ là bất biến cũng với sự quay của hình ảnh nhập vào I(x,y). Quang phổ cấp sao biểu kiến Fourier Fig.4. 1 cột: kết cấu hình ảnh ở định hướng 0◦ và 90◦. 2 cột: thùng 1-56 trên tổng histograms LBPu2 tương ứng. 3 cột: xoay bất biến tính năng | H (n, u) |, 1 ≤ n ≤ 7,0 ≤ u ≤ 5, (rắn dòng) và LBPriu2 (vòng tròn, dòng tiêu tan). Lưu ý rằng các histograms LBPu2 cho hai hình ảnh khác nhau rõ rệt, nhưng các | H (n, u) | tính năng là gần như bằng nhau. ) (8)có thể được coi là một trường hợp đặc biệt của các tính năng này. Hơn nữa nó cần lưu ý rằng quang phổ cấp sao biểu kiến Fourier có chứa LBPriu2 tính năng như là một tập hợp con, kể từ khi . (9)Một minh hoạ của các tính năng này là trong hình 43 thí nghiệmChúng tôi kiểm tra hiệu suất của mô tả được đề xuất trong ba trường hợp khác nhau: phân loại kết cấu, tài liệu mô tả phân loại và khuôn mặt. Các tính năng được đề xuất xoay LBP-HF bất biến đã được so sánh với phòng không phải là bất biến LBPu2 và xoay bất biến phiên bản cũ LBPriu2. Trong phân loại kết cấu và vật liệu loại thí nghiệm, mô tả MR8 [3] đã được sử dụng như là một
đang được dịch, vui lòng đợi..
