Google gần đây đã tung ra một phiên bản mới của reCaptcha trong đó tuyên bố mạnh mẽ hơn để chương trình và dễ dàng đi trên con người.
Trong khi video này trên youtube của Google là khá thuyết phục quá, mọi thứ có một chút thú vị khi chúng ta đào sâu hơn. Cách tiếp cận mới mà có vẻ là một thuật toán nhận dạng bot tinh vi, là gì, nhưng một cách sử dụng đơn thuần các cookie của trình duyệt.
Vì vậy, đây là những gì sẽ xảy ra khi bạn đang ném một reCAPTCHA:
Bạn được yêu cầu để giải quyết một hình ảnh reCAPTCHA lần đầu tiên.
Các phản ứng để đánh giá của các chuỗi văn bản nhập vào bởi bạn, được lưu trữ trong các tập tin cookie của trình duyệt của bạn.
thời gian tiếp theo bạn truy cập vào trang web, hoặc bất kỳ trang nào mà đòi hỏi bạn phải vượt qua reCAPTCHA, các thông tin từ các tập tin cookie được sử dụng để xác định xem bạn đã thông qua các bài kiểm tra . trước
một thử nghiệm đơn giản có thể được thực hiện ở đây. https://wordpress.org/support/register.php
Sau khi giải quyết các hình ảnh reCAPTCHA cho lần đầu tiên, nó không yêu cầu bạn phải giải quyết một hình ảnh khi bạn truy cập một lần nữa. Nhưng, một khi bạn xóa các tập tin cookie của bạn và thử lại ... có! Trở lại một hình vuông, bạn được yêu cầu để giải quyết các hình ảnh để thành công khi nộp mẫu đơn. Google đã chỉ đơn giản là sử dụng cookie để lưu giữ thông tin về tính xác thực của bạn.
Điều này có nghĩa gì đối với chương trình? Bây giờ chương trình có thể sử dụng một công cụ OCR để giải quyết các thông tin hoặc yêu cầu một ai đó để giải quyết các hình ảnh ban đầu, sau đó, bot có thể giữ lại các cookie và tiếp tục cạo!
PS: Vâng, chúng tôi đã không nhận vào khóa học chính chưa
mới phiên bản của reCAPTCHA cũng có thể được bỏ qua bởi một kỹ thuật khác. Điều này có thể được thực hiện bằng cách sử dụng khóa công khai của trang web (được gọi là dữ liệu sitekey). Chờ đợi, những gì? Vâng! Hãy nói rằng một bot muốn bỏ qua reCAPTCHA một trang web X mà không thực sự để cho một người sử dụng (trên trang web Y) biết rằng anh ta đang cho phép một bot để làm như vậy. Về mặt kỹ thuật, điều này được gọi là tấn công clickjacking bồi thường hoặc giao diện người dùng. Các bot có thể sử dụng dữ liệu sitekey của trang web X và vô hiệu hóa các header Referer trên một trang web trong Y, nơi người dùng sẽ được yêu cầu giải quyết reCAPTCHA.
Một khi người dùng giải quyết CAPTCHA, phản ứng (gọi là "g-reCAPTCHA-phản ứng") có thể được sử dụng bởi một bot chạy ở chế độ nền phải gửi biểu mẫu trên trang web X. bằng cách này, các bot có thể đánh lừa Google vào suy nghĩ rằng phản ứng reCAPTCHA giải quyết được nguồn gốc từ trang web X (trong khi nó thực sự là đến từ Y). Do đó, các bot có thể tiến hành cạo trên webiste X. này kỳ diệu làm việc bởi vì Google không xác nhận các tiêu đề referer nếu nó đã bị vô hiệu hóa bởi các khách hàng hoặc rỗng. Một người sử dụng chính hãng chỉ đóng góp vào một bot nạo trang web X mà không thực sự nhận ra rằng ông đã được sử dụng như một thẻ truy cập.
đang được dịch, vui lòng đợi..
