Máy tính vision2 là sự chuyển đổi của các dữ liệu từ 2D/3D tĩnh hoặc video vào một quyết định hoặc một đại diện mới. Tất cả các biến đổi đó được thực hiện để đạt được một số mục tiêu cụ thể. Đầu vào dữ liệu có thể bao gồm một số thông tin theo ngữ cảnh, chẳng hạn như "máy ảnh được đặt trong một chiếc xe" hoặc "laser range finder cho thấy một đối tượng là 1 mét đi". Quyết định có thể là "không có một người trong cảnh này" hoặc "không có 14 khối u tế bào trên slide này". Một đại diện mới có thể có nghĩa là biến một hình ảnh màu thành một hình ảnh màu xám hoặc loại bỏ máy ảnh chuyển động từ một chuỗi hình ảnh.Bởi vì chúng tôi là những sinh vật trực quan, nó là dễ dàng để được fooled vào suy nghĩ rằng máy tính tầm nhìn công việc được dễ dàng. Làm thế nào cứng nó có thể là tìm thấy, nói, một chiếc xe khi bạn đang nhìn chằm chằm vào nó vào một hình ảnh? Intuitions ban đầu của bạn có thể khá gây hiểu nhầm. Bộ não con người chia tín hiệu tầm nhìn vào nhiều kênh đó dòng phần khác nhau của các thông tin vào trong bộ não của bạn. Bộ não của bạn có một hệ thống sự chú ý xác định, trong một cách phụ thuộc vào nhiệm vụ, các bộ phận quan trọng của một hình ảnh để kiểm tra trong khi đàn áp trong việc kiểm tra của các khu vực khác. Có thông tin phản hồi lớn trong dòng hình ảnh đó là, như được nêu ra, ít hiểu rõ. Có là phổ biến rộng rãi kết hợp đầu vào từ cơ bắp điều khiển cảm biến và tất cả các giác quan khác cho phép bộ não để vẽ trên đường-Hiệp hội được thực hiện từ năm của cuộc sống trên thế giới. Vòng lặp thông tin phản hồi trong não trở lại tất cả các giai đoạn xử lý bao gồm các cảm biến phần cứng mình (mắt), Máy móc kiểm soát ánh sáng thông qua iris và điều chỉnh việc tiếp nhận trên bề mặt của võng mạc.Trong một hệ thống tầm nhìn máy, Tuy nhiên, một máy tính sẽ nhận được một mạng lưới các số từ máy ảnh hoặc từ đĩa, và, trong hầu hết trường hợp, đó là nó. Hầu hết các phần, đó là không công nhận mẫu được xây dựng trong, không có điều khiển tự động tập trung và độ mở ống kính, không có chữ thập Hiệp hội với nhiều năm kinh nghiệm. Hầu hết các phần, tầm nhìn hệ thống vẫn còn khá là ngây thơ. Con số 1 - 1 cho thấy một hình ảnh của một ô tô. Trong đó là hình ảnh chúng tôi nhìn thấy một gương mặt bên của trình điều khiển của chiếc xe. Những gì máy tính "nhìn thấy" chỉ là một mạng lưới các con số. Bất kỳ số nhất định trong mạng lưới mà có một thành phần khá lớn tiếng ồn và do đó của chính nó cho chúng ta ít thông tin, nhưng mạng lưới các con số là tất cả máy tính "thấy". Nhiệm vụ của chúng tôi sau đó sẽ trở thành để bật lưới này ồn ào của số điện thoại vào nhận thức: "gương mặt". Hình 1-2 cung cấp cho một số sâu thêm vào lý do tại sao máy tính tầm nhìn là khó khăn như vậy.
đang được dịch, vui lòng đợi..
