Distance function computation is a

Distance function computation is a key subtask in many data mining algorithms and applications. The most effective form of the distance function can only be expressed in the context of a particular data domain. It is also often a challenging and non-trivial task to find the most effective form of the distance function. For example, in the text domain, distance function design has been considered such an important and complex issue that it has been the focus of intensive research over three decades. The final design of distance functions in this domain has been reached only by detailed empirical testing and consensus over the quality of results provided by the different variations. With the increasing ability to collect data in an automated way, the number of new kinds of data continues to increase rapidly. This makes it increasingly difficult to undertake such efforts for each and every new data type. The most important aspect of distance function design is that since a human is the end-user for any application, the design must satisfy the user requirements with regard to effectiveness. This creates the need for a systematic framework to design distance functions which are sensitive to the particular characteristics of the data domain. In this paper, we discuss such a framework. The goal is to create distance functions in an automated way while minimizing the work required from the user. We will show that this framework creates distance functions which are significantly more effective than popularly used functions such as the Euclidean metric.

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Khoảng cách chức năng tính toán là một subtask quan trọng trong nhiều thuật toán khai thác dữ liệu và các ứng dụng. Dạng hàm khoảng cách, hiệu quả nhất chỉ có thể được bày tỏ trong bối cảnh của một tên miền cụ thể dữ liệu. Nó cũng thường là một nhiệm vụ đầy thử thách và không nhỏ để tìm mẫu hàm khoảng cách, hiệu quả nhất. Ví dụ, trong lĩnh vực văn bản, khoảng cách chức năng thiết kế đã được coi như một quan trọng và phức tạp vấn đề rằng nó đã là tập trung nghiên cứu chuyên sâu hơn ba thập kỷ. Thiết kế cuối cùng của khoảng cách chức năng trong tên miền này đã đạt tới chỉ bằng cách thử nghiệm thực nghiệm chi tiết và sự đồng thuận trên chất lượng của các kết quả được cung cấp bởi các biến thể khác nhau. Với khả năng tăng thu thập dữ liệu một cách tự động, số lượng các loại mới của dữ liệu tiếp tục tăng nhanh chóng. Điều này làm cho nó ngày càng khó khăn để thực hiện những nỗ lực cho mỗi kiểu dữ liệu mới. Các khía cạnh quan trọng nhất của khoảng cách chức năng thiết kế là vì con người là người dùng cuối cho bất kỳ ứng dụng, thiết kế phải đáp ứng các yêu cầu của người dùng đối với hiệu quả. Điều này tạo ra sự cần thiết cho một khuôn khổ hệ thống chức năng khoảng cách thiết kế rất nhạy cảm với các đặc tính cụ thể của dữ liệu tên miền. Trong bài báo này, chúng tôi thảo luận về một khuôn khổ. Mục tiêu là tạo ra khoảng cách chức năng một cách tự động trong khi giảm thiểu công việc yêu cầu của người dùng. Chúng tôi sẽ hiển thị rằng khuôn khổ này tạo ra hàm khoảng cách là đáng kể hiệu quả hơn các chức năng được sử dụng phổ biến như mêtric Euclid.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

hàm khoảng cách tính toán là một công việc phụ quan trọng trong nhiều thuật toán khai thác dữ liệu và ứng dụng. Các hình thức hiệu quả nhất của hàm khoảng cách chỉ có thể được thể hiện trong bối cảnh của một miền dữ liệu cụ thể. Nó cũng thường là một nhiệm vụ đầy thách thức và không tầm thường để tìm ra hình thức hiệu quả nhất của hàm khoảng cách. Ví dụ, trong lĩnh vực văn bản, thiết kế chức năng khoảng cách đã được coi là một vấn đề quan trọng và phức tạp như vậy mà nó đã được tập trung nghiên cứu chuyên sâu hơn ba thập kỷ. Thiết kế cuối cùng của chức năng khoảng cách trong lĩnh vực này đã được đạt được chỉ bằng thử nghiệm thực nghiệm chi tiết và sự đồng thuận về chất lượng của các kết quả được cung cấp bởi các biến thể khác nhau. Với khả năng tăng để thu thập dữ liệu một cách tự động, số mới, các loại dữ liệu tiếp tục tăng nhanh. Điều này làm cho nó ngày càng khó khăn để thực hiện những nỗ lực như vậy cho mỗi kiểu dữ liệu mới. Khía cạnh quan trọng nhất của thiết kế chức năng khoảng cách là kể từ khi một con người là người dùng cuối cho bất kỳ ứng dụng, thiết kế phải đáp ứng các yêu cầu người sử dụng liên quan đến hiệu quả với. Điều này tạo ra sự cần thiết cho một khung hệ thống để thiết kế các chức năng khoảng cách đó rất nhạy cảm với các đặc thù của lĩnh vực dữ liệu. Trong bài báo này, chúng tôi thảo luận về một khuôn khổ như vậy. Mục đích là để tạo ra các chức năng khoảng cách một cách tự động trong khi giảm thiểu các công việc cần thiết từ người sử dụng. Chúng tôi sẽ cho thấy rằng khuôn khổ này tạo ra các chức năng khoảng cách đó là đáng kể hiệu quả hơn so với các chức năng sử dụng phổ biến như các số liệu Euclide.

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.