Như đã thảo luận trước đó, từ nhúng hoặc đại diện phân phối là một kỹ thuật của việc học đại diện vector cho tất cả các từ có trong corpus nhất định. Các đại diện vector học nói chung là dày đặc, giá trị thực và các lowdimension. Như trái ngược với đại diện vector một nóng mỗi chiều của từ-vector được cho là đại diện cho một tính năng tiềm ẩn của tính lexicosemantic của từ. Trong công việc của chúng tôi, chúng tôi xem xét hai nhà nước của các chữ nghệ thuật kỹ thuật, cụ thể là, word2vec và găng tay nhúng. Mặc dù trong văn học có tồn tại một số kỹ thuật wordembedding (Hinton et al, 1986;. Bengio et al, 2003;. Bengio, 2008; Mnih và Hinton, 2009; Collobert et al, 2011)., Các lựa chọn hai
chữ nhúng kỹ thuật rất nhiều tính toán hiệu quả và được coi là stateof-nghệ thuật. Chúng tôi đã tóm tắt các nguyên tắc cơ bản của hai phương pháp trong các phần tiếp theo.
đang được dịch, vui lòng đợi..