Không phải tất cả cơ sở dữ liệu cho phép những đoạn văn dài của văn bản được lưu trữ trong hồ sơ, có lẽ thiết lập chiều dài tối đa cho các chuỗi văn bản, hoặc đòi hỏi độ dài được ấn định trước. Trường hợp này là trường hợp, cơ sở dữ liệu nghiêm túc hạn chế các ứng dụng giao diện mà văn bản là một phần quan trọng. Ở một thái cực khác, hệ thống thu hồi văn bản miễn phí được tập trung vào chưa được định dạng, văn bản phi cấu trúc. Các hệ thống này làm việc bằng cách giữ một chỉ số của từng chữ trong mỗi tài liệu, và do đó, bạn có thể yêu cầu 'cho tôi tất cả các tài liệu với các từ "con người" và "máy tính" trong đó'. Các chương trình, chẳng hạn như các phiên bản của lệnh UNIX 'grep', cung cấp cho một số thiết bị tương tự bằng cách nhanh chóng quét một danh sách các tập tin cho một từ nào đó, nhưng chậm hơn nhiều. Trên trang web, tìm kiếm văn bản miễn phí của khóa học là cách tiêu chuẩn để tìm những thứ sử dụng công cụ tìm kiếm.
đang được dịch, vui lòng đợi..
