kỹ thuật sed [23].
Một hệ quả đầu tiên của việc sử dụng một cây quyết định là
hiệu suất được cải thiện kể từ sự phức tạp
được giới hạn bởi chiều cao của cây. Như vậy, chỉ một
tập hợp con của các biện pháp tương tự nó liên quan được sử dụng
cho một công việc phù hợp với thực tế. Ưu điểm thứ hai
nằm trong việc cải thiện chất lượng của các trận đấu.
Thật vậy, đối với một tên miền nhất định, chỉ thích hợp nhất
các biện pháp tương tự được sử dụng. Hơn nữa, các cây quyết định là linh hoạt vì các biện pháp tương tự mới
có thể được thêm vào, bất kể sản lượng của họ (rời rạc hoặc
các giá trị liên tục).
Bây giờ chúng ta vạch ra những bước khác nhau của thuật toán. Các giá trị tương đồng tính bằng một biện pháp tương tự phải thoả mãn các điều kiện (liên tục hay rời rạc) trên các cạnh để truy cập vào một nút tiếp theo.
Vì vậy, khi kết hợp hai thành phần giản đồ với các
cây quyết định, các biện pháp tương tự đầu tiên - đó tại
nút gốc - là sử dụng và trả về một tương
xứng. Theo giá trị này, các cạnh mà
điều kiện của nó là hài lòng dẫn đến nút cây bên cạnh.
Quá trình này lặp cho đến khi một nút lá được đạt tới,
cho thấy cho dù hai yếu tố phù hợp hay không.
Các giá trị tương tự cuối cùng giữa hai yếu tố này là
người cuối cùng đã được tính toán, vì chúng tôi coi rằng các giá trị tương tự trước đó đã chỉ
được tính toán để tìm ra biện pháp tương tự thích hợp nhất. Hình (1) minh họa một ví dụ
của một cây quyết định. Bây giờ, chúng ta hãy minh họa cho việc ghép nối hoạt động bằng cách sử dụng cây này và ba cặp
nhãn để được so sánh.
• (số lượng, số tiền) lần đầu tiên được xuất hiện bởi sự bình đẳng mà trả về 0, sau đó kích thước nhãn tiền
được tính toán (giá trị của 14), tiếp theo bởi 3
gam biện pháp tương tự. Các giá trị tương
thu được với 3-gram là thấp (0,1), ngụ ý
các kỹ thuật từ điển để cuối cùng được sử dụng để
phát hiện ra một mối quan hệ đồng nghĩa.
• Ngược lại, (loại văn hóa, cultureType) là lần xuất hiện bằng cách sử dụng bình đẳng, sau đó nhãn
kích thước tổng, và cuối cùng là 3-gram trong đó cung cấp
một giá trị giống nhau đủ (0.17) để ngăn chặn
quá trình.
• Cuối cùng, cặp (ngày phân tích, ngày phân tích)
liên quan đến nhãn giống hệt nhau, ngụ ý các biện pháp bình đẳng để trở 1. Bối cảnh người hàng xóm
sau đó phải được tính toán để xác định nếu có
một trận đấu hay không. Thật vậy, cả hai nhãn có thể tham khảo để phân tích khác nhau, ví dụ, có thể
đại diện cho một phân tích nước và độc khác
cho một ngày báo cáo.
đang được dịch, vui lòng đợi..
