Đầu tiên, chúng tôi trình bày kết quả trên một bộ tiêu chuẩn đánh giá, FOT cả các phát hiện và mô tả. Tiếp theo, chúng tôi thảo luận về kết quả thu được trong một ứng dụng nhận dạng đối tượng thực tế cuộc sống. Tất cả các máy dò và mô tả trong sự so sánh dựa trên việc triển khai ban đầu của tác giả.
Đánh giá Chuẩn Chúng tôi kiểm tra phát hiện và mô tả của chúng tôi bằng cách sử dụng chuỗi ảnh và kiểm thử phần mềm được cung cấp bởi Mikolajczyk 3. Đây là những hình ảnh của kết cấu thực sự và cảnh cấu trúc. Do không gian hạn chế, chúng tôi không thể hiển thị các kết quả trên tất cả các trình tự. Đối với việc so sánh máy phát hiện, chúng tôi đã chọn hai viewpointchanges (Gra ffi tiandWall), onezoomandrotation (Boat) thay đổi andlighting (Leuven) (xem hình. 6, thảo luận dưới đây). Các đánh giá mô tả được hiển thị cho tất cả các trình tự, ngoại trừ dãy Bark (xem hình. 4 và 7). Đối với các máy dò, chúng tôi sử dụng số điểm lặp lại, như được mô tả trong [9]. Điều này cho thấy có bao nhiêu trong những điểm quan tâm phát hiện được tìm thấy trong cả hai hình ảnh, so với tổng số thấp nhất của các điểm quan tâm được tìm thấy (nơi chỉ có một phần của hình ảnh mà có thể nhìn thấy trong cả hai hình ảnh được đưa vào tài khoản). Các máy dò được so sánh với erence di ff của Gaussian (DoG) phát hiện bởi Lowe [2], và các Harris- và Hessian-Laplace dò bởi Mikolajczyk [15] đề xuất. Số lượng các điểm quan tâm tìm thấy là trên trung bình rất giống nhau cho tất cả các máy dò. Điều này giữ cho tất cả các hình ảnh, bao gồm cả những người từ các cơ sở dữ liệu được sử dụng trong các thí nghiệm nhận dạng đối tượng, xem Bảng 1 cho một ví dụ. Như có thể thấy 'Fast-Hessian' dò của chúng tôi là nhanh hơn 3 lần so với Hessian-Laplace rằng DoG và 5 lần. Đồng thời, độ lặp lại cho máy dò của chúng tôi là so sánh (Gra ffi ti, Leuven, Thuyền) hoặc thậm chí tốt hơn (Wall) hơn so với các đối thủ cạnh tranh. Lưu ý rằng các chuỗi Gra ffi ti và Wall chứa out-of-máy bay quay, kết quả là một biến dạng ffi ne, trong khi các máy dò trong việc so sánh chỉ rotation- và quy mô bất biến. Do đó, các biến dạng phải được giải quyết bằng sự vững mạnh tổng thể của các tính năng. Thedescriptorsareevaluatedusingrecall- (1-chính xác) đồ thị, asin [4] và [8]. Đối với mỗi đánh giá, chúng tôi sử dụng đầu tiên fi và hình ảnh thứ tư của dãy, trừ các Gra ffi ti (hình 1 và 3) và cảnh Wall (hình 1 và 5), tương ứng với một sự thay đổi quan điểm của 30 và 50 độ, tương ứng. Trong fi gures4 and7, chúng tôi comparedour SURF để mô tả GLOH, SIFT và PCA-SIFT, dựa vào các điểm quan tâm phát hiện với 'Fast-Hessian' dò của chúng tôi. SURF vượt trội so với các mô tả khác cho gần như tất cả những sự so sánh. Trong hình. 4, chúng tôi so sánh các kết quả bằng cách sử dụng hai kỹ thuật phù hợp erent di ff, một dựa trên ngưỡng tương đồng và một dựa trên tỷ lệ người hàng xóm gần nhất (xem [8] cho một cuộc thảo luận về các kỹ thuật). Điều này có một e ff ect trên bảng xếp hạng của các mô tả, nhưng SURF thực hiện tốt nhất trong cả hai trường hợp. Do không gian hạn chế, chỉ có kết quả trên ngưỡng tương hợp dựa được hiển thị trong hình. 7, như kỹ thuật này là phù hợp hơn để đại diện phân phối của các mô tả trong không gian đặc trưng của nó [8] và nó được sử dụng tổng quát hơn. Bộ mô tả SURF nhanh hơn so với các mô tả khác trong một cách có hệ thống và không thể fi trọng yếu, có đôi khi sự cải thiện hơn so với 10% trong thu hồi cho cùng một mức độ chính xác. Đồng thời, nó là nhanh chóng để tính toán (xem Bảng 2). Các phiên bản chính xác (SURF-128), được trình bày trong phần 4, cho thấy kết quả tốt hơn một chút so với SURF thường xuyên, nhưng chậm hơn để phù hợp và do đó ít thú vị cho các ứng dụng tốc độ phụ thuộc. Lưu ý rằng trong suốt bài báo, bao gồm cả các recognitionexperiment đối tượng, chúng tôi luôn luôn sử dụng cùng một tập hợp các thông số và các ngưỡng (xem bảng 1). Các timings được đánh giá trên một tiêu chuẩn Linux PC (Pentium IV, 3GHz).
đang được dịch, vui lòng đợi..
