Một nhóm các nhà khoa học đã phát triển một thuật toán mà bắt khả năng học tập của chúng tôi, cho phép các máy tính để nhận biết và vẽ khái niệm trực quan đơn giản mà hầu hết là không thể phân biệt từ những người tạo ra bởi con người. Công việc, xuất hiện trong số mới nhất của tạp chí Science, đã đánh dấu một bước tiến đáng kể trong lĩnh vực này -. Một, rút ngắn đáng kể thời gian cần máy tính có thể nhận biết những khái niệm mới và mở rộng các ứng dụng của họ với nhiệm vụ sáng tạo hơn
"Kết quả của chúng tôi cho thấy rằng bằng kỹ thuật đảo ngược thế nào mọi người suy nghĩ về một vấn đề, chúng ta có thể phát triển các thuật toán tốt hơn, "giải thích Brenden Lake, một Moore-Sloan Khoa học Dữ liệu nghiên cứu sinh tại Đại học New York và là tác giả chính của bài báo. "Hơn nữa, công việc này điểm đến phương pháp đầy hứa hẹn để thu hẹp khoảng cách cho các nhiệm vụ học máy khác."
Tác giả khác của bài báo là Ruslan Salakhutdinov, một trợ lý giáo sư về khoa học máy tính tại Đại học Toronto, và Joshua Tenenbaum, một giáo sư tại MIT trong Bộ não và nhận thức khoa học và các Trung tâm Brains, Minds và máy móc.
Khi con người được tiếp xúc với một khái niệm mới - chẳng hạn như đoạn mới của thiết bị nhà bếp, một điệu nhảy di chuyển mới, hoặc một bức thư mới trong một bảng chữ cái xa lạ - họ thường chỉ cần một vài ví dụ để hiểu nó make-up và công nhận các trường hợp mới. Trong khi các máy bây giờ có thể tái tạo một số nhiệm vụ mô hình nhận dạng trước đó chỉ được thực hiện bởi con người - máy ATM đọc những con số ghi trên séc, ví dụ - máy thường cần phải được đưa ra hàng trăm hoặc hàng ngàn ví dụ để thực hiện với độ chính xác tương tự.
"Nó có đã rất khó khăn để xây dựng máy móc đòi hỏi ít dữ liệu như con người khi học một khái niệm mới, "quan sát Salakhutdinov. "Nhân rộng những khả năng là một lĩnh vực thú vị của nghiên cứu kết nối máy học, thống kê, tầm nhìn máy tính, và nhận thức khoa học."
Salakhutdinov giúp để khởi động quan tâm gần đây việc học với "mạng lưới thần kinh sâu, vào trong một báo công bố trên Science gần 10 năm trước đây với cố vấn tiến sĩ của ông Geoffrey Hinton. Thuật toán của họ học được cấu trúc của 10 khái niệm nhân vật viết tay - các chữ số 0-9 -. Từ 6.000 ví dụ từng, hoặc tổng cộng 60.000 ví dụ huấn luyện
trong công việc xuất hiện trong khoa học tuần này, các nhà nghiên cứu đã tìm cách để rút ngắn quá trình học tập và làm cho nó giống như để cách con người tiếp thu và áp dụng kiến thức mới -. tức là, học hỏi từ một số lượng nhỏ các ví dụ và thực hiện một loạt các nhiệm vụ, chẳng hạn như tạo ra các ví dụ mới của một khái niệm hoặc tạo ra toàn bộ những khái niệm mới
Để làm như vậy, họ phát triển một "Chương trình Bayesian Learning" (BPL) khuôn khổ, nơi mà khái niệm được biểu diễn như là các chương trình máy tính đơn giản. Ví dụ, các chữ 'A' được đại diện bởi các mã máy tính - giống như công việc của một lập trình viên máy tính - mà tạo ra các ví dụ về thư đó khi đang chạy. Tuy nhiên, không lập trình được yêu cầu trong suốt quá trình học tập: các chương trình thuật toán riêng của mình bằng cách xây dựng mã để sản xuất các thư nó thấy. Ngoài ra, không giống như các chương trình máy tính tiêu chuẩn sản xuất ra cùng kết quả mỗi khi họ chạy, các chương trình này xác suất sản xuất ra khác nhau ở từng thực hiện. Điều này cho phép họ nắm bắt cách các trường hợp của một khái niệm khác nhau, chẳng hạn như sự khác nhau giữa cách hai người vẽ chữ 'A'
Trong khi các thuật toán nhận dạng mẫu tiêu chuẩn đại diện cho các khái niệm như các cấu hình của các điểm ảnh, bộ sưu tập các tính năng, cách tiếp cận BPL học "sinh sản mô hình "của các quá trình trên thế giới, làm cho việc học là một vấn đề" Xây dựng mô hình 'hoặc' giải thích 'dữ liệu cung cấp cho các thuật toán. Trong trường hợp văn bản và thư công nhận, BPL được thiết kế để nắm bắt cả những quan hệ nhân quả và tính thành phần của quá trình thực thế giới, cho phép các thuật toán để sử dụng dữ liệu hiệu quả hơn. Mô hình này cũng "học cách học" bằng cách sử dụng kiến thức từ những khái niệm trước đây để tăng tốc độ học tập trên những khái niệm mới - ví dụ, bằng cách sử dụng kiến thức của bảng chữ cái Latin để học chữ cái trong bảng chữ cái Hy Lạp. Các tác giả áp dụng mô hình của họ đến hơn 1.600 loại ký tự viết tay trong 50 hệ thống của thế giới văn bản, bao gồm tiếng Phạn, Tây Tạng, Gujarati, Chữ Glagolitic - và các nhân vật thậm chí còn phát minh ra như những từ phim truyền hình Futurama.
Ngoài kiểm tra khả năng của thuật toán để nhận ra các trường hợp mới của một khái niệm, các tác giả đã yêu cầu cả hai người và máy tính để tái sản xuất một loạt các ký tự viết tay sau khi được thể hiện một ví dụ đơn lẻ của từng nhân vật, hoặc trong một số trường hợp, để tạo ra nhân vật mới trong phong cách của những người nó đã được chứng minh . Các nhà khoa học sau đó so sánh các kết quả ở cả người và máy thông qua 'bài kiểm tra Turing thị giác. " Ở đây, các thẩm phán của con người đã được đưa ra ví dụ kết hợp của cả hai đầu ra của con người và máy móc, cùng với dấu nhắc ban đầu, và được yêu cầu xác định trong những biểu tượng đã được sản xuất bởi máy tính.
Trong khi trả lời đúng các thẩm phán khác nhau giữa các nhân vật, mỗi bài kiểm tra Turing thị giác , ít hơn 25 phần trăm của các thẩm phán thực hiện tốt hơn so với cơ hội đáng kể trong việc đánh giá liệu một máy hay một con người được sản xuất một được thiết lập của các biểu tượng.
"Trước khi họ nhận được để mẫu giáo, trẻ học cách nhận ra các khái niệm mới từ chỉ là một ví dụ duy nhất, và thậm chí có thể tưởng tượng ví dụ mới mà họ đã không nhìn thấy, "lưu ý Tenenbaum. "Tôi đã muốn xây dựng mô hình của những khả năng đặc biệt kể từ khi công việc tiến sĩ của riêng mình vào cuối những năm chín mươi. Chúng tôi vẫn đang ở xa máy thông minh như một đứa trẻ con người xây dựng, nhưng đây là lần đầu tiên chúng tôi đã có một máy tính có thể học và sử dụng một lớp lớn của các khái niệm thực thế giới - ngay cả khái niệm trực quan đơn giản như chữ viết tay - theo những cách khó khăn để nói ngoài từ con người ".
Công trình này được tài trợ bởi Quỹ Khoa học Quốc gia Trung tâm nghiên cứu cho Brains , Minds và Máy móc (CCF-1.231.216), Văn phòng Nghiên cứu Quân đội (W911NF-08-1-0242, W911NF-13-1-2012), Văn phòng Nghiên cứu Hải quân (N000141310333), và Môi trường Moore-Sloan dữ liệu khoa học tại Đại học New York
đang được dịch, vui lòng đợi..
