Chúng tôi đã tìm thấy rằng quan trọng nhất cho việc thu hồi
chất lượng là phải có một vốn từ vựng lớn (số lượng lớn các lá
nút), và không cung cấp cho trọng lượng quá mạnh để các bên trong
các nút của cây từ vựng. Về nguyên tắc, các từ vựng
kích thước cuối cùng phải phát triển quá lớn, do những biến đổi
và tiếng ồn trong các vectơ mô tả thường xuyên di chuyển các
vectơ mô tả giữa các tế bào lượng tử khác nhau.
Các thương mại-off ở đây là khóa học khác biệt (đòi hỏi
các tế bào lượng tử nhỏ và một từ vựng sâu cây) so với
độ lặp lại (đòi hỏi các tế bào lượng tử lớn). Tuy nhiên,
lợi ích của việc ghi bàn thứ bậc là các nguy cơ hơn làm
kích thước của từ vựng được giảm đi. Hơn nữa, chúng tôi
đã tìm thấy rằng đối với một phạm vi rộng lớn của các kích cỡ từ vựng (lên
đến một nơi nào đó giữa 1 và 16 triệu nút lá), các
tăng hiệu suất thu hồi với số lượng lá
nút. Đây có lẽ cũng là lời giải thích tại sao nó là
tốt hơn để gán entropy trực tiếp liên quan đến nút gốc.
Các nút lá chỉ đơn giản là mạnh hơn rất nhiều so với
các nút bên trong.
đang được dịch, vui lòng đợi..