Tìm kiếm không thể nhìn thấyNó cũng là đáng để xem xét các loại nội dung mà tìm kiếm động cơ không thể "thấy" trong ý thức của con người.Ví dụ, mặc dù công cụ tìm kiếm có thể phát hiện rằng bạn đang hiển thị một hình ảnh, họ có chút ý tưởng những gì hình ảnh là một hình ảnh, ngoại trừ bất kỳ thông tin bạn cung cấp cho họ trong các thuộc tính alt, như được thảo luận trước đó. Họ chỉ có thể nhận ra một số loại rất cơ bản của thông tin trong hình ảnh, chẳng hạn như sự hiện diện của một khuôn mặt, hoặc cho dù hình ảnh có nội dung khiêu dâm bằng bao nhiêu thịt giai điệu đó là trong hình ảnh. Công cụ tìm kiếm dễ dàng không thể nói cho dù một hình ảnh là một hình ảnh của Bart Simpson, một chiếc thuyền, một ngôi nhà hoặc một cơn lốc xoáy. Ngoài ra, công cụ tìm kiếm thường không nhận ra bất kỳ văn bản nào thực hiện trong hình ảnh.Thực tế là công cụ tìm kiếm có công nghệ để xử lý các loại nhiệm vụ với một số mức độ. Ví dụ, bạn có thể chụp ảnh của Taj Majal và kéo nó vào hộp tìm kiếm, Google tìm kiếm hình ảnh và nó sẽ nhận ra nó. Tuy nhiên, do sức mạnh xử lý để làm như vậy nhận dạng hình ảnh, tìm kiếm động cơ không hiện đang cố gắng để làm điều đó cho tất cả các hình ảnh mà họ gặp trên hàng trăm ot tỷ trang web trên web.Công cụ tìm kiếm cũng thử nghiệm với các công nghệ sử dụng nhận dạng ký tự quang học (OCR) để trích xuất văn bản từ hình ảnh, nhưng công nghệ này là chưa nói chung sử dụng trong tìm kiếm. Vấn đề chính với cách áp dụng OCR và công nghệ xử lý hình ảnh là họ đang rất computationally chuyên sâu, và nó không phải là thực tế để áp dụng chúng ở quy mô của các trang web.Ngoài ra, SEO khôn ngoan thông thường đã luôn luôn giữ rằng công cụ tìm kiếm không thể đọc tập tin Flash, nhưng điều này là một chút overstated. Công cụ tìm kiếm đã trích xuất một số thông tin từ Flash trong nhiều năm qua, như được chỉ ra bởi các thông báo này của Google trong năm 2008:http://googlewebmastercentral.blogspot.com/2008/06/Improved-Flash-indexing.html. Tuy nhiên, mấu chốt là rằng nó không phải là dễ dàng cho công cụ tìm kiếm để xác định những gì là trong Flash. Một số lớn các vấn đề là rằng ngay cả khi tìm kiếm động cơ nhìn bên trong Flash, họ vẫn đang tìm kiếm nội dung văn bản, nhưng Flash là một phương tiện hình ảnh và có chút ưu đãi (khác với các công cụ tìm kiếm) cho một nhà thiết kế để thực hiện các văn bản bên trong Flash. Tất cả các manh mối ngữ nào được hiện diện trong HTML văn bản (ví dụ như thẻ tiêu đề, văn bản đậm, vv) mất quá, ngay cả khi HTML được sử dụng kết hợp với đèn Flash.Một loại thứ ba của nội dung các tìm kiếm động cơ không thể nhìn thấy là các khía cạnh hình ảnh của bất cứ thứ gì chứa trong Flash, do đó, khía cạnh này của đèn Flash hoạt động trong cùng một cách hình ảnh làm. Ví dụ, khi văn bản được chuyển đổi thành một véc tơ dựa trên phác thảo (ví dụ, kết xuất đồ họa), các thông tin văn bản, công cụ tìm kiếm có thể đọc là bị mất. Chương 6 thảo luận về các phương pháp để tối ưu hóa Flash.Tệp âm thanh và video này cũng không dễ dàng cho công cụ tìm kiếm để đọc. Như với các hình ảnh, dữ liệu không phải là dễ dàng để phân tích cú pháp. Có một vài ngoại lệ mà các công cụ tìm kiếm có thể trích xuất một số giới hạn các dữ liệu, chẳng hạn như ID3 tags trong tập tin MP3 hoặc podcast nâng cao ở định dạng AAC với văn bản "Hiển thị ghi chú," hình ảnh, và đánh dấu chương nhúng. Cuối cùng, mặc dù, một đoạn video của một trò chơi bóng đá không thể được phân biệt với một đoạn video của một đám cháy rừng.Công cụ tìm kiếm cũng không thể đọc bất kỳ nội dung nào chứa trong một chương trình. Công cụ tìm kiếm thực sự cần để tìm văn bản có thể đọc được bằng mắt người nhìn vào mã nguồn của trang web, như đã nêu trước đó. Nó không giúp đỡ nếu bạn có thể nhìn thấy nó khi trình duyệt tải một trang web — nó có thể được nhìn thấy và có thể đọc được các mã nguồn cho trang đó.Một ví dụ của một công nghệ có thể trình bày đáng kể các nội dung có thể đọc được con người công cụ tìm kiếm không thể xem là AJAX. AJAX là JavaScript dựa trên phương pháp tự động vẽ các nội dung trên trang web sau khi lấy dữ liệu từ cơ sở dữ liệu, mà không cần phải tải lại toàn bộ trang web. Điều này thường được sử dụng trong các công cụ mà khách truy cập đến một trang web có thể cung cấp một số đầu vào và các công cụ AJAX sau đó lấy và hiển thị hình ảnh chính xác nội dung.Vấn đề phát sinh bởi vì nội dung được lấy bởi một kịch bản đang chạy trên máy tính (máy tính của người dùng) chỉ sau khi nhận được một số đầu vào từ người dùng. Điều này có thể dẫn đến kết quả đầu ra khả năng có thể khác nhau rất nhiều. Ngoài ra, cho đến khi nhận được đầu vào mà nội dung không phải là hiện diện trong mã HTML của trang, do đó, công cụ tìm kiếm không thể nhìn thấy nó. Google cung cấp các lời khuyên cụ thể về cách làm cho các ứng dụng AJAX thập, bạn có thể xem ở đây: http://code.google.com/web/ajaxcrawling/docs/getting-started.html.Vấn đề tương tự xảy ra với các hình thức khác của JavaScript mà không khiến các nội dung trong HTML cho đến khi một người sử dụng hành động được thực hiện. Các hình thức mới của Javascript, chẳng hạn như góc JavaScript (https://angularjs.org/) thực hiện điều này thậm chí nhiều hơn khó khăn cho công cụ tìm kiếm (http://stackoverflow.com/questions/13499040/how-do-search-động cơ-thỏa thuận-với-angularjs-ứng dụng).Theo HTML 5, một xây dựng tên là nhúng cô thẻ ((tiếng Việt)
đang được dịch, vui lòng đợi..
