A Framework for Representing KnowledgeMarvin MinskyMIT-AI Laboratory M dịch - A Framework for Representing KnowledgeMarvin MinskyMIT-AI Laboratory M Việt làm thế nào để nói

A Framework for Representing Knowle

A Framework for Representing Knowledge

Marvin Minsky

MIT-AI Laboratory Memo 306, June, 1974.

Reprinted in The Psychology of Computer Vision, P. Winston (Ed.), McGraw-Hill, 1975. Shorter versions in J. Haugeland, Ed., Mind Design, MIT Press, 1981, and in Cognitive Science, Collins, Allan and Edward E. Smith (eds.) Morgan-Kaufmann, 1992 ISBN 55860-013-2]



FRAMES



It seems to me that the ingredients of most theories both in Artificial Intelligence and in Psychology have been on the whole too minute, local, and unstructured to account–either practically or phenomenologically–for the effectiveness of common-sense thought. The "chunks" of reasoning, language, memory, and "perception" ought to be larger and more structured; their factual and procedural contents must be more intimately connected in order to explain the apparent power and speed of mental activities.

Similar feelings seem to be emerging in several centers working on theories of intelligence. They take one form in the proposal of Papert and myself (1972) to sub-structure knowledge into "micro-worlds"; another form in the "Problem-spaces" of Newell and Simon (1972); and yet another in new, large structures that theorists like Schank (1974), Abelson (1974), and Norman (1972) assign to linguistic objects. I see all these as moving away from the traditional attempts both by behavioristic psychologists and by logic-oriented students of Artificial Intelligence in trying to represent knowledge as collections of separate, simple fragments.

I try here to bring together several of these issues by pretending to have a unified, coherent theory. The paper raises more questions than it answers, and I have tried to note the theory's deficiencies.

Here is the essence of the theory: When one encounters a new situation (or makes a substantial change in one's view of the present problem) one selects from memory a structure called a Frame. This is a remembered framework to be adapted to fit reality by changing details as necessary.

A frame is a data-structure for representing a stereotyped situation, like being in a certain kind of living room, or going to a child's birthday party. Attached to each frame are several kinds of information. Some of this information is about how to use the frame. Some is about what one can expect to happen next. Some is about what to do if these expectations are not confirmed.

We can think of a frame as a network of nodes and relations. The "top levels" of a frame are fixed, and represent things that are always true about the supposed situation. The lower levels have many terminals–"slots" that must be filled by specific instances or data. Each terminal can specify conditions its assignments must meet. (The assignments themselves are usually smaller "sub-frames.") Simple conditions are specified by markers that might require a terminal assignment to be a person, an object of sufficient value, or a pointer to a sub-frame of a certain type. More complex conditions can specify relations among the things assigned to several terminals.

Collections of related frames are linked together into frame-systems . The effects of important actions are mirrored by transformations between the frames of a system. These are used to make certain kinds of calculations economical, to represent changes of emphasis and attention, and to account for the effectiveness of "imagery."

For visual scene analysis, the different frames of a system describe the scene from different viewpoints, and the transformations between one frame and another represent the effects of moving from place to place. For non-visual kinds of frames, the differences between the frames of a system can represent actions, cause-effect relations, or changes in conceptual viewpoint. Different frames of a system share the same terminals; this is the critical point that makes it possible to coordinate information gathered from different viewpoints.

Much of the phenomenological power of the theory hinges on the inclusion of expectations and other kinds of presumptions. A frame's terminals are normally already filled with "default" assignments. Thus, a frame may contain a great many details whose supposition is not specifically warranted by the situation. These have many uses in representing general information, most likely cases, techniques for bypassing "logic," and ways to make useful generalizations.

The default assignments are attached loosely to their terminals, so that they can be easily displaced by new items that fit better the current situation. They thus can serve also as "variables" or as special cases for "reasoning by example," or as "textbook cases," and often make the use of logical quantifiers unnecessary.

The frame-systems are linked, in turn, by an information retrieval network. When a proposed frame cannot be made to fit reality–when we cannot find terminal assignments that suitably match its terminal marker conditions–this network provides a replacement frame. These inter-frame structures make possible other ways to represent knowledge about facts, analogies, and other information useful in understanding.

Once a frame is proposed to represent a situation, a matching process tries to assign values to each frame's terminals, consistent with the markers at each place. The matching process is partly controlled by information associated with the frame (which includes information about how to deal with surprises) and partly by knowledge about the system's current goals. There are important uses for the information, obtained when a matching process fails. I will discuss how it can be used to select an alternative frame that better suits the situation.

Apology! The schemes proposed herein are incomplete in many respects. First, I often propose representations without specifying the processes that will use them. Sometimes I only describe properties the structures should exhibit. I talk about markers and assignments as though it were obvious how they are attached and linked; it is not.

Besides the technical gaps, I will talk as though unaware of many problems related to "understanding" that really need much deeper analysis. I do not claim that the ideas proposed here are enough for a complete theory, but only that the frame-system scheme may help explain a number of phenomena of human intelligence. The basic frame idea itself is not particularly original–it is in the tradition of the "schema" of Bartlett and the "paradigms" of Kuhn {1970}; the idea of a frame-system is probably more novel. Winograd (1974) discusses the recent trend, in theories of Artificial Intelligence, toward frame-like ideas.

The rest of Part 1 applies the frame-system idea to vision and imagery. In part 2 we turn to linguistic and other kinds of understanding. Part 3 discusses memory, acquisition, and retrieval of knowledge; Part 4 is about control, and Part 5 takes up other problems of vision and spatial imagery.

In the body of the paper I discuss a variety of kinds of reasoning by analogy, and ways to impose stereotypes on reality and jump to conclusions based on partial similarity matching. These are basically uncertain methods. Why not use methods that are more "logical" and certain? Section 6 is a sort of Appendix which argues that traditional logic cannot deal very well with realistic, complicated problems because it is poorly suited to represent approximations to solutions–and these are absolutely vital.

Thinking always begins with suggestive but imperfect plans and images; these are progressively replaced by better–but usually still imperfect–ideas.



LOCAL AND GLOBAL THEORIES FOR VISION


"For there exists a great chasm between those, on the one side, who relate everything to a single central vision, one system more or less coherent or articulate, in terms of which they understand, think and feel–a single, universal, organizing principle in terms of which alone all that they are and say has significance–and, on the other side, those who pursue many ends, often unrelated and even contradictory, connected, if at all, only in some de facto way, for some psychological or physiological cause, related by no moral or esthetic principle."–Isaiah Berlin {The Hedgehog and the Fox}.

When we enter a room we seem to see the entire scene at a glance. But seeing is really an extended process. It takes time to fill in details, collect evidence, make conjectures, test, deduce, and interpret in ways that depend on our knowledge, expectations and goals. Wrong first impressions have to be revised. Nevertheless, all this proceeds so quickly and smoothly that it seems to demand a special explanation.

Some people dislike theories of vision that explain scene-analysis largely in terms of discrete, serial, symbolic processes. They feel that although programs built on such theories may indeed seem to "see," they must be too slow and clumsy for a nervous system to use. But the alternative usually proposed is some extreme position of "holism" that never materializes into a technical proposal. I will argue that serial symbolic mechanisms could indeed explain much of the apparent instantaneity and completeness of visual experience.

Some early Gestalt theorists tried to explain a variety of visual phenomena in terms of global properties of electrical fields in the brain. This idea did not come to much (Koffka, 1935). Its modern counterpart, a scattered collection of attempts to use ideas about integral transforms, holograms, and interference phenomena, has done no better. In spite of this, most thinkers outside (and some inside) the symbolic processing community still believe that only through some sort of field-like global parallel process could the required speed be attained.

While my theory is thus addressed to basic problems of Gestalt psychology, the method is fundamentally different. In both approaches, one wants to explain the structuring of . sensory data into wholes and parts. Gestalt theoris
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
Một khuôn khổ cho đại diện cho kiến thứcMarvin MinskyMIT-AI phòng thí nghiệm Memo 306, tháng 6 năm 1974.Tái bản trong tâm lý của máy tính tầm nhìn, P. Winston (Ed.), McGraw-Hill, năm 1975. Phiên bản ngắn hơn trong thiết kế J. Haugeland, Ed., tâm trí, MIT Press, 1981, và nhận thức khoa học, Collins, Allan và Edward E. Smith (chủ biên) Morgan-Kaufmann, 1992 ISBN 55860-013-2] KHUNG Dường như với tôi rằng các thành phần của hầu hết lý thuyết trong trí tuệ nhân tạo và tâm lý học đã trên toàn bộ quá phút, địa phương, và không có cấu trúc để hoặc-tài khoản thực tế hoặc phenomenologically-cho hiệu quả của ý thức chung suy nghĩ. Các "khối" của lý luận, ngôn ngữ, bộ nhớ và "nhận thức" cần phải được lớn hơn và nhiều cấu trúc; nội dung thực tế và thủ tục của họ phải được kết nối sâu sắc hơn để giải thích rõ ràng sức mạnh và tốc độ của các hoạt động tinh thần.Tương tự như cảm xúc dường như xuất hiện trong một số Trung tâm làm việc trên lý thuyết về tình báo. Họ có một hình thức trong đề nghị của Papert và bản thân mình (1972) để phụ cơ cấu kiến thức vào "vi-thế giới"; một hình thức trong các "vấn đề-không gian" của Newell và Simon (1972); và thêm một trong các cấu trúc mới, lớn các nhà lý thuyết như Schank (1974), Abelson (1974), và Norman (1972) chỉ định cho các đối tượng ngôn ngữ. Tôi thấy tất cả các như là di chuyển ra khỏi những nỗ lực truyền thống của nhà tâm lý học behavioristic và của sinh viên theo định hướng logic của trí tuệ nhân tạo trong cố gắng để đại diện cho kiến thức như các bộ sưu tập của các mảnh vỡ riêng biệt, đơn giản.Tôi cố gắng ở đây để mang lại cùng một số trong những vấn đề bằng cách giả vờ để có một lý thuyết thống nhất và mạch lạc. Giấy ra những câu hỏi nhiều hơn nó câu trả lời, và tôi đã cố gắng để lưu ý của lý thuyết thiếu sót.Đây là bản chất của lý thuyết: khi một gặp một tình huống mới (hoặc thực hiện một thay đổi đáng kể trong một cái nhìn của vấn đề hiện nay) một trong những lựa chọn từ bộ nhớ một cấu trúc gọi là một khung. Đây là một khuôn khổ nhớ để được điều chỉnh để phù hợp với thực tế bằng cách thay đổi các chi tiết như là cần thiết.Một khung là một cấu trúc dữ liệu cho đại diện cho một tình huống rập khuôn, như trong một loại nhất định của phòng sinh hoạt chung, hay đi đến tiệc sinh nhật của một đứa trẻ. Gắn liền với mỗi khung là một số loại thông tin. Một số thông tin này là về làm thế nào để sử dụng khung. Một số là về một trong những gì có thể mong đợi xảy ra kế tiếp. Một số là về phải làm gì nếu những mong đợi không được xác nhận.Chúng tôi có thể nghĩ đến một khung như là một mạng lưới các nút và quan hệ. Các cấp độ đầu trang"" của một khung cố định, và đại diện cho điều đó là luôn luôn đúng sự thật về tình hình nghĩa. Các cấp thấp hơn có nhiều thiết bị đầu cuối-"khe" mà phải được lấp đầy bởi các trường hợp cụ thể hoặc dữ liệu. Mỗi thiết bị đầu cuối có thể chỉ định các điều kiện của nó tập phải đáp ứng. (Các bài tập bản thân thường là nhỏ hơn "khung phụ.") Đơn giản điều kiện được quy định bởi dấu hiệu có thể yêu cầu một nhiệm vụ thiết bị đầu cuối là một người, một đối tượng đầy đủ giá trị, hoặc một con trỏ đến một khung phụ của một loại nhất định. Điều kiện phức tạp hơn có thể chỉ định các quan hệ trong số những thứ được gán cho một số thiết bị đầu cuối.Các bộ sưu tập liên quan đến khung được liên kết với nhau vào khung-hệ thống. Những ảnh hưởng của những hành động quan trọng được phản ánh bởi các biến đổi giữa khung hình của một hệ thống. Chúng được sử dụng để làm cho một số loại tính toán kinh tế, đại diện cho thay đổi trọng tâm và sự chú ý, và vào tài khoản cho hiệu quả của "hình ảnh."Đối với phân tích trực quan cảnh, khung hình khác nhau của một hệ thống mô tả cảnh từ quan điểm khác nhau, và các biến đổi giữa một khung và khác đại diện cho những tác động của di chuyển từ nơi này đến nơi. Cho-visual loại khung, sự khác biệt giữa khung hình của một hệ thống có thể đại diện cho hành động, quan hệ gây ra-có hiệu lực, hoặc thay đổi trong khái niệm quan điểm. Các khung hình khác nhau của một hệ thống chia sẻ thiết bị đầu cuối cùng; đây là điểm quan trọng mà làm cho nó có thể phối hợp thông tin thu thập từ quan điểm khác nhau.Hầu hết sức mạnh phenomenological của lý thuyết bản lề về việc đưa những kỳ vọng và các loại khác của presumptions. Thiết bị đầu cuối một khung bình thường đã được làm đầy với bài tập "mặc định". Vì vậy, một khung có thể chứa một chi tiết tuyệt vời có giả thuyết cho là không cụ thể bảo hành bởi tình hình. Những có sử dụng nhiều trong đại diện cho thông tin chung, trường hợp có nhiều khả năng, kỹ thuật để bỏ qua "logic", và cách để thực hiện hữu ích chung chung.Bài tập mặc định được đính kèm lỏng lẻo của thiết bị đầu cuối, vì vậy mà họ có thể được thay thế dễ dàng bởi mục mới tốt hơn phù hợp với tình hình hiện tại. Họ do đó có thể phục vụ cũng như là "biến" hoặc là các trường hợp đặc biệt cho "lý luận bằng ví dụ", hoặc là "trường hợp sách giáo khoa," và thường làm cho việc sử dụng hợp lý quantifiers không cần thiết.Khung-hệ thống được liên kết, lần lượt, bởi một mạng lưới thông tin tra cứu. Khi một khung đề nghị không thể được thực hiện để phù hợp với thực tế-khi chúng tôi không thể tìm thấy bài tập thiết bị đầu cuối phù hợp phù hợp với thiết bị đầu cuối điểm đánh dấu điều kiện-này mạng cung cấp một khung thay thế. Các cấu trúc liên khung làm cho có thể những cách khác để đại diện cho các kiến thức về các sự kiện, suy, và thông tin hữu ích trong sự hiểu biết.Một khi một khung được đề xuất để đại diện cho một tình huống, một quá trình phù hợp với cố gắng để chỉ định giá trị của mỗi khung thiết bị đầu cuối, phù hợp với các dấu hiệu tại mỗi địa điểm. Quá trình kết hợp một phần được kiểm soát bởi thông tin kết hợp với khung (trong đó bao gồm các thông tin về làm thế nào để đối phó với những bất ngờ) và một phần bởi các kiến thức về các mục tiêu hiện tại của hệ thống. Sử dụng quan trọng cho các thông tin, thu được khi một quá trình kết hợp không có. Tôi sẽ thảo luận làm thế nào nó có thể được sử dụng để chọn một khung thay thế tốt hơn phù hợp với tình hình.Lời xin lỗi! Các chương trình được đề xuất ở đây là không đầy đủ ở nhiều khía cạnh. Trước tiên, tôi thường đề nghị đại diện mà không có chỉ định các quá trình đó sẽ sử dụng chúng. Đôi khi tôi chỉ mô tả tính chất các cơ cấu nên triển lãm. Tôi nói chuyện về đánh dấu và bài tập như thể nó đã được rõ ràng như thế nào họ được đính kèm và liên kết; nó không phải là.Bên cạnh các khoảng trống kỹ thuật, tôi sẽ nói là mặc dù không biết gì về nhiều vấn đề liên quan đến "hiểu biết" mà thực sự cần nhiều phân tích sâu hơn. Tôi không yêu cầu rằng các ý tưởng đề xuất ở đây là đủ cho một lý thuyết hoàn chỉnh, nhưng chỉ rằng các đề án khung-hệ thống có thể giúp giải thích một số các hiện tượng của trí thông minh của con người. Ý tưởng cơ bản khung chính nó không phải là đặc biệt là bản gốc-nó là trong truyền thống của "lược đồ" của Bartlett và paradigms"" của Kuhn (1970); ý tưởng của một hệ thống khung là cuốn tiểu thuyết có lẽ thêm. Winograd (1974) thảo luận về xu hướng gần đây, trong lý thuyết của trí tuệ nhân tạo, hướng tới ý tưởng giống như khung.Phần còn lại của phần 1 áp dụng ý tưởng hệ thống khung cho tầm nhìn và hình ảnh. Trong phần 2, chúng tôi chuyển sang ngôn ngữ và các loại của sự hiểu biết. Phần 3 thảo luận về bộ nhớ, mua lại và truy của kiến thức; Phần 4 về kiểm soát và phần 5 chiếm các vấn đề khác của tầm nhìn và không gian hình ảnh.Trong cơ thể của giấy tôi thảo luận về một số loại lý do tương tự, và cách để áp đặt khuôn trên thực tế và nhảy đến kết luận dựa trên một phần tương tự kết hợp. Đây là không chắc chắn về cơ bản phương pháp. Tại sao không sử dụng phương pháp "hợp lý" và nhất định? Phần 6 là một loại phụ lục đó lập luận rằng truyền thống logic không thể đối phó rất tốt với những vấn đề thực tế, phức tạp bởi vì nó là kém thích hợp để đại diện cho xấp xỉ để giải pháp- và đây là hoàn toàn quan trọng.Tư duy luôn luôn bắt đầu với kế hoạch gợi nhưng không hoàn hảo và hình ảnh; Chúng dần dần được thay thế bởi tốt hơn-nhưng thường vẫn còn nghĩa-ý tưởng. LÝ THUYẾT ĐỊA PHƯƠNG VÀ TOÀN CẦU CHO TẦM NHÌN "Cho có tồn tại một hang sâu lớn giữa những người, trên một mặt, những người liên quan tất cả mọi thứ để một tầm nhìn trung tâm duy nhất, một hệ thống chặt chẽ hơn hoặc ít hơn hoặc rõ, trong điều kiện trong đó họ hiểu, hãy suy nghĩ và cảm thấy-một đĩa đơn, phổ quát, tổ chức các nguyên tắc về mà mình tất cả những gì họ đang và nói có ý nghĩa- và, trên mặt khác, những người theo đuổi nhiều kết thúcthường không liên quan nhất và thậm chí mâu thuẫn, kết nối, nếu ở tất cả, chỉ trong một số cách trên thực tế, cho một số nguyên nhân tâm lý hoặc sinh lý, liên quan đến bởi không có nguyên tắc đạo đức hoặc thẩm Mỹ. "-Isaiah Berlin {Hedgehog và con cáo}.Khi chúng ta bước vào một căn phòng chúng tôi có vẻ để xem toàn bộ khung cảnh trong nháy mắt. Nhưng nhìn thấy thực sự là một quá trình mở rộng. Phải mất thời gian để điền vào thông tin chi tiết, thu thập chứng cứ, thực hiện phỏng đoán, kiểm tra, suy ra, và giải thích trong những cách mà phụ thuộc vào kiến thức, sự mong đợi và mục tiêu của chúng tôi. Sai số lần hiển thị đầu tiên phải được sửa đổi. Tuy nhiên, tất cả điều này tiền như vậy một cách nhanh chóng và thuận lợi mà dường như để yêu cầu một lời giải thích đặc biệt.Một số người không thích lý thuyết của tầm nhìn mà giải thích cảnh-phân tích phần lớn trong điều khoản của quy trình rời rạc, nối tiếp, biểu tượng. Họ cảm thấy rằng mặc dù chương trình được xây dựng trên lý thuyết như vậy thực sự có thể có vẻ để "xem," họ phải được quá chậm và vụng về cho một hệ thống thần kinh để sử dụng. Nhưng thay thế thường đề xuất một số vị trí cực của "holism" mà không bao giờ materializes thành một đề nghị kỹ thuật. Tôi sẽ tranh luận rằng cơ chế mang tính biểu tượng nối tiếp thực sự có thể giải thích nhiều instantaneity rõ ràng và đầy đủ của kinh nghiệm thị giác.Một số nhà lý thuyết Gestalt đầu đã cố gắng để giải thích một số các hiện tượng trực quan trong điều khoản của các tính chất toàn cầu của các lĩnh vực điện trong não. Ý tưởng này đã không đi đến nhiều (Koffka, 1935). Đối tác hiện đại của nó, một bộ sưu tập phân tán của các nỗ lực để sử dụng những ý tưởng về biến đổi tích phân, holograms và hiện tượng can thiệp, đã làm không tốt hơn. Mặc dù vậy, hầu hết các nhà tư tưởng bên ngoài (và một số bên trong) cộng đồng xử lý mang tính biểu tượng vẫn còn tin rằng chỉ có thông qua một số loại lĩnh vực như quá trình toàn cầu song song có thể yêu cầu tốc độ thể đạt được.Trong khi lý thuyết của tôi do đó được gửi đến các vấn đề cơ bản của Gestalt tâm lý học, phương pháp là cơ bản khác nhau. Trong cả hai phương pháp tiếp cận, ai muốn giải thích những cơ cấu của. cảm giác dữ liệu vào wholes và các bộ phận. Gestalt theoris
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
A Framework for Representing Knowledge

Marvin Minsky

MIT-AI Laboratory Memo 306, June, 1974.

Reprinted in The Psychology of Computer Vision, P. Winston (Ed.), McGraw-Hill, 1975. Shorter versions in J. Haugeland, Ed., Mind Design, MIT Press, 1981, and in Cognitive Science, Collins, Allan and Edward E. Smith (eds.) Morgan-Kaufmann, 1992 ISBN 55860-013-2]



FRAMES



It seems to me that the ingredients of most theories both in Artificial Intelligence and in Psychology have been on the whole too minute, local, and unstructured to account–either practically or phenomenologically–for the effectiveness of common-sense thought. The "chunks" of reasoning, language, memory, and "perception" ought to be larger and more structured; their factual and procedural contents must be more intimately connected in order to explain the apparent power and speed of mental activities.

Similar feelings seem to be emerging in several centers working on theories of intelligence. They take one form in the proposal of Papert and myself (1972) to sub-structure knowledge into "micro-worlds"; another form in the "Problem-spaces" of Newell and Simon (1972); and yet another in new, large structures that theorists like Schank (1974), Abelson (1974), and Norman (1972) assign to linguistic objects. I see all these as moving away from the traditional attempts both by behavioristic psychologists and by logic-oriented students of Artificial Intelligence in trying to represent knowledge as collections of separate, simple fragments.

I try here to bring together several of these issues by pretending to have a unified, coherent theory. The paper raises more questions than it answers, and I have tried to note the theory's deficiencies.

Here is the essence of the theory: When one encounters a new situation (or makes a substantial change in one's view of the present problem) one selects from memory a structure called a Frame. This is a remembered framework to be adapted to fit reality by changing details as necessary.

A frame is a data-structure for representing a stereotyped situation, like being in a certain kind of living room, or going to a child's birthday party. Attached to each frame are several kinds of information. Some of this information is about how to use the frame. Some is about what one can expect to happen next. Some is about what to do if these expectations are not confirmed.

We can think of a frame as a network of nodes and relations. The "top levels" of a frame are fixed, and represent things that are always true about the supposed situation. The lower levels have many terminals–"slots" that must be filled by specific instances or data. Each terminal can specify conditions its assignments must meet. (The assignments themselves are usually smaller "sub-frames.") Simple conditions are specified by markers that might require a terminal assignment to be a person, an object of sufficient value, or a pointer to a sub-frame of a certain type. More complex conditions can specify relations among the things assigned to several terminals.

Collections of related frames are linked together into frame-systems . The effects of important actions are mirrored by transformations between the frames of a system. These are used to make certain kinds of calculations economical, to represent changes of emphasis and attention, and to account for the effectiveness of "imagery."

For visual scene analysis, the different frames of a system describe the scene from different viewpoints, and the transformations between one frame and another represent the effects of moving from place to place. For non-visual kinds of frames, the differences between the frames of a system can represent actions, cause-effect relations, or changes in conceptual viewpoint. Different frames of a system share the same terminals; this is the critical point that makes it possible to coordinate information gathered from different viewpoints.

Much of the phenomenological power of the theory hinges on the inclusion of expectations and other kinds of presumptions. A frame's terminals are normally already filled with "default" assignments. Thus, a frame may contain a great many details whose supposition is not specifically warranted by the situation. These have many uses in representing general information, most likely cases, techniques for bypassing "logic," and ways to make useful generalizations.

The default assignments are attached loosely to their terminals, so that they can be easily displaced by new items that fit better the current situation. They thus can serve also as "variables" or as special cases for "reasoning by example," or as "textbook cases," and often make the use of logical quantifiers unnecessary.

The frame-systems are linked, in turn, by an information retrieval network. When a proposed frame cannot be made to fit reality–when we cannot find terminal assignments that suitably match its terminal marker conditions–this network provides a replacement frame. These inter-frame structures make possible other ways to represent knowledge about facts, analogies, and other information useful in understanding.

Once a frame is proposed to represent a situation, a matching process tries to assign values to each frame's terminals, consistent with the markers at each place. The matching process is partly controlled by information associated with the frame (which includes information about how to deal with surprises) and partly by knowledge about the system's current goals. There are important uses for the information, obtained when a matching process fails. I will discuss how it can be used to select an alternative frame that better suits the situation.

Apology! The schemes proposed herein are incomplete in many respects. First, I often propose representations without specifying the processes that will use them. Sometimes I only describe properties the structures should exhibit. I talk about markers and assignments as though it were obvious how they are attached and linked; it is not.

Besides the technical gaps, I will talk as though unaware of many problems related to "understanding" that really need much deeper analysis. I do not claim that the ideas proposed here are enough for a complete theory, but only that the frame-system scheme may help explain a number of phenomena of human intelligence. The basic frame idea itself is not particularly original–it is in the tradition of the "schema" of Bartlett and the "paradigms" of Kuhn {1970}; the idea of a frame-system is probably more novel. Winograd (1974) discusses the recent trend, in theories of Artificial Intelligence, toward frame-like ideas.

The rest of Part 1 applies the frame-system idea to vision and imagery. In part 2 we turn to linguistic and other kinds of understanding. Part 3 discusses memory, acquisition, and retrieval of knowledge; Part 4 is about control, and Part 5 takes up other problems of vision and spatial imagery.

In the body of the paper I discuss a variety of kinds of reasoning by analogy, and ways to impose stereotypes on reality and jump to conclusions based on partial similarity matching. These are basically uncertain methods. Why not use methods that are more "logical" and certain? Section 6 is a sort of Appendix which argues that traditional logic cannot deal very well with realistic, complicated problems because it is poorly suited to represent approximations to solutions–and these are absolutely vital.

Thinking always begins with suggestive but imperfect plans and images; these are progressively replaced by better–but usually still imperfect–ideas.



LOCAL AND GLOBAL THEORIES FOR VISION


"For there exists a great chasm between those, on the one side, who relate everything to a single central vision, one system more or less coherent or articulate, in terms of which they understand, think and feel–a single, universal, organizing principle in terms of which alone all that they are and say has significance–and, on the other side, those who pursue many ends, often unrelated and even contradictory, connected, if at all, only in some de facto way, for some psychological or physiological cause, related by no moral or esthetic principle."–Isaiah Berlin {The Hedgehog and the Fox}.

When we enter a room we seem to see the entire scene at a glance. But seeing is really an extended process. It takes time to fill in details, collect evidence, make conjectures, test, deduce, and interpret in ways that depend on our knowledge, expectations and goals. Wrong first impressions have to be revised. Nevertheless, all this proceeds so quickly and smoothly that it seems to demand a special explanation.

Some people dislike theories of vision that explain scene-analysis largely in terms of discrete, serial, symbolic processes. They feel that although programs built on such theories may indeed seem to "see," they must be too slow and clumsy for a nervous system to use. But the alternative usually proposed is some extreme position of "holism" that never materializes into a technical proposal. I will argue that serial symbolic mechanisms could indeed explain much of the apparent instantaneity and completeness of visual experience.

Some early Gestalt theorists tried to explain a variety of visual phenomena in terms of global properties of electrical fields in the brain. This idea did not come to much (Koffka, 1935). Its modern counterpart, a scattered collection of attempts to use ideas about integral transforms, holograms, and interference phenomena, has done no better. In spite of this, most thinkers outside (and some inside) the symbolic processing community still believe that only through some sort of field-like global parallel process could the required speed be attained.

While my theory is thus addressed to basic problems of Gestalt psychology, the method is fundamentally different. In both approaches, one wants to explain the structuring of . sensory data into wholes and parts. Gestalt theoris
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2025 I Love Translation. All reserved.

E-mail: