Hãy để T [1, ..., l] là một văn bản có độ dài l trên một bảng chữ cái Σ đổi kích thước, tokenized thành lời k bằng word-ký tự phân cách, và để cho I là tập hợp các vị trí bảng chữ cái ở đó từ mới bắt đầu. Các hậu tố từ mảng A [1,. . . , K] là một hoán vị của tôi như vậy mà T [A [i-1], ..., l] <T [A [i], ..., l] cho tất cả 1 <i ≤ k; tức là, các mảng A đại diện cho thứ tự tự từ điển của tất cả các hậu tố, như thể hiện trong hình. 8 (xem chi tiết trong [7]). Tập hợp các vị trí từ, B, được xem như một sản phẩm phụ của việc xây dựng WSA. Mô hình của chúng tôi sử dụng B để tìm Jc (wi-n + 1) trong Dc, t. WSA có thể được xây dựng trong thời gian O (l) thời gian và O (k) không gian khi sử dụng các thuật toán xây dựng tuyến tính thời gian cho mảng hậu tố (ví dụ, [ 23]). Nó có thể tìm kiếm wi-n + 1 (chiều dài của bảng chữ cái m) một cách nhanh chóng với một tìm kiếm nhị phân trong O (m log k + fc (wi-n + 1)), như trong mảng hậu tố.
đang được dịch, vui lòng đợi..
