Khoảng cách chức năng tính toán là một subtask quan trọng trong nhiều thuật toán khai thác dữ liệu và các ứng dụng. Dạng hàm khoảng cách, hiệu quả nhất chỉ có thể được bày tỏ trong bối cảnh của một tên miền cụ thể dữ liệu. Nó cũng thường là một nhiệm vụ đầy thử thách và không nhỏ để tìm mẫu hàm khoảng cách, hiệu quả nhất. Ví dụ, trong lĩnh vực văn bản, khoảng cách chức năng thiết kế đã được coi như một quan trọng và phức tạp vấn đề rằng nó đã là tập trung nghiên cứu chuyên sâu hơn ba thập kỷ. Thiết kế cuối cùng của khoảng cách chức năng trong tên miền này đã đạt tới chỉ bằng cách thử nghiệm thực nghiệm chi tiết và sự đồng thuận trên chất lượng của các kết quả được cung cấp bởi các biến thể khác nhau. Với khả năng tăng thu thập dữ liệu một cách tự động, số lượng các loại mới của dữ liệu tiếp tục tăng nhanh chóng. Điều này làm cho nó ngày càng khó khăn để thực hiện những nỗ lực cho mỗi kiểu dữ liệu mới. Các khía cạnh quan trọng nhất của khoảng cách chức năng thiết kế là vì con người là người dùng cuối cho bất kỳ ứng dụng, thiết kế phải đáp ứng các yêu cầu của người dùng đối với hiệu quả. Điều này tạo ra sự cần thiết cho một khuôn khổ hệ thống chức năng khoảng cách thiết kế rất nhạy cảm với các đặc tính cụ thể của dữ liệu tên miền. Trong bài báo này, chúng tôi thảo luận về một khuôn khổ. Mục tiêu là tạo ra khoảng cách chức năng một cách tự động trong khi giảm thiểu công việc yêu cầu của người dùng. Chúng tôi sẽ hiển thị rằng khuôn khổ này tạo ra hàm khoảng cách là đáng kể hiệu quả hơn các chức năng được sử dụng phổ biến như mêtric Euclid.
đang được dịch, vui lòng đợi..