Kể từ khi phát minh của mình, văn bản đã được các kho lưu trữ cơ bản của kiến thức con người và sự hiểu biết. Với sự phát minh ra máy in, máy tính, và sự tăng trưởng bùng nổ của Web, chúng ta thấy rằng số lượng văn bản dễ dàng truy cập từ lâu đã vượt qua khả năng của con người để đọc nó. Thách thức này chỉ trở thành tồi tệ hơn với bùng nổ của động cơ sản xuất văn bản mới như Twitter, nơi hàng trăm triệu của "văn bản" ngắn được tạo ra hàng ngày [Ritter et al., 2011]. Ngay cả việc tìm văn bản có liên quan đã trở nên ngày càng khó khăn. Rõ ràng, sự hiểu biết văn bản tự động có tiềm năng để giúp đỡ, nhưng các công nghệ có liên quan có thể mở rộng để Web.
đang được dịch, vui lòng đợi..
