E (Ti) và E (Ti) là giá trị của các tính năng Ti và họtrước đó đã được tính toán từ thiết lập Q. thiết lập Q không bao gồm các tập tinchúng tôi muốn phát hiện. Nó rất dễ dàng để nhận ra rằng max D(Ti) = N V N V hoặc một tập tin lành tính.Chọn trường hợp WTrường hợp "cao":Nếu (s > 0,9) hoặc (fm - fb > 0,75) sau đók đột dtrở về "f là mã độc hại"kháctrở về "f là tập tin lành tính" cuối nếuTrường hợp "trung bình":Nếu (s > 0,75) hoặc (fm - fb > 0,5) sau đók đột dtrở về "f là mã độc hại"kháctrở về "f là tập tin lành tính" cuối nếuTrường hợp "low":Nếu (s > 0,5) hoặc (fm > 0,5) sau đók đột dtrở về "f là mã độc hại"kháctrở về "f là tập tin lành tính" cuối nếuCuối cùng chọnB. phân tíchKhi một file được công nhận là một con sâu, nó được lưu trong M thiết lập, và một tập tin được công nhận là một tập tin lành tính, nó sẽ được lưu vào B thiết lập. Phần mềm chống virus có thể sử dụng kết quả này để phát hiện các biến thể của nó bởi các thuật toán khác như secure hash algorithm... Trong tương lai, chúng tôi sử dụng kết quả này để tính toán một lần nữa D(Ti) như học tập một thuật toán máy tính và chúng tôi trình bày trong một bài báo.Tính năng Ai được xác định sau khi phân tích các tính năng của Q tập tin thiết lập. Nó bao gồm các tính năng tĩnh và năng động như api chức năng cuộc gọi, hành vi của con sâu và lành tính ứng dụng... Tính năng Ti được xác định từ tập A bằng các thuật toán khai thác tính năng, sau khi phân loại tính năng Ai theo D(Ai) thứ tự giảm dần. Ví dụ, nếu chúng tôi chọn gọi api chức năng như các tính năng, tập A bao gồm tất cả các chức năng api của windows. Nhưng "thuật toán phát hiện mã độc không rõ" chỉ kiểm tra api chức năng được lựa chọn trong thiết lập T.Không có một số tính năng mà bạn luôn luôn sử dụng chúng để phát hiện tĩnh. Một số tính năng luôn luôn sử dụng để phát hiện tự động. Tuy nhiên, một số tính năng có thể sử dụng cho cả hai. Ví dụ, tính năng "các thiết bị lưu trữ bên ngoài có chứa nhiều các tập tin có nội dung tương tự với tập tin f". Nếu USB của chúng tôi không lây nhiễm giun, chúng tôi sử dụng tính năng này như là một tính năng động. Khi chúng tôi USB nhiễm giun như w32-virut.gen (sâu được đặt tên bởi Avira), 0,71 khi E (Ti) = 1 và E (Ti) = 0 hoặc E (Ti) = 0 và E (Ti) = 1.Nó có nghĩa rằng Ti các tính năng cụ thể của các mã độc hại hoặc lành tính ứng dụng. Nếu bạn tìm thấy một tính năng trong tập tin, bạn có thể kết luận f là một mã độc hại (hoặc lành tính ứng dụng), nhưng thẩm định của bạn không phải là 100% chính xác bởi vì D(Ti) chỉ được tính toán trên một mẫu tập tin thiết lập. Khi thiết lập Q là đủ lớn cho dữ liệu khai thác kỹ thuật, làm giảm giá trị D(Ti). Bởi vì nó là khó khăn để tìm thấy một tính năng đặc biệt của tất cả các mã độc hại hoặc tất cả các tập tin lành tính. Vì vậy, các thuật toán kiểm tra nhiều tính năng để có được fm > = 1 hoặc fb > = 1. Trong trường hợp này, nếu chúng tôi tìm thấy một tính năng mà có D(Ti) = 0,71, thẩm định chúng tôi là chính xác hơn. Thuật toán của chúng tôi luôn luôn đã kiểm tra tính năng có giá trị cao hơn D(Ti). Bởi vì họ là các tính năng cụ thể của các mã độc hại hoặc lành tính ứng dụng. Ví dụ, chúng tôi kiểm tra một tập tin word, nếu tính năng "không có macro" được phát hiện, nó không phải là cần thiết để tiếp tục. Phương pháp tiếp cận của chúng tôi cho phép để tiết kiệm thời gian cho việc phát hiện sâu và bướu sâu. Ví dụ, W32.sality.y là một con sâu bướu. Mặc dù con sâu này có thể tạo ra tệp mới có sự khác biệt kích thước. Nhưng nó vẫn còn có tính năng mà chúng tôi có thể phát hiện nó tĩnh khi nó nhiễm trong USB của chúng tôi hoặc trong máy tính của chúng tôi. Nếu chúng tôi chỉ có một tập tin mới và chúng tôi không biết nếu nó là sâu hay không? Phần mềm diệt virus chạy nó phát hiện năng động. Nhưng khi máy tính của chúng tôi nhiễm W32.sality.y hoặc chúng tôi cắm một USB nhiễm W32.sality.y vào máy tính của chúng tôi, phần mềm chống vi-rút có thể phát hiện nó mà không cần phải chạy tập tin. Nó không phải là cần thiết để kiểm tra tất cả các tính năng của thiết lập T.
đang được dịch, vui lòng đợi..