trong một SVM bạn đang tìm kiếm cho hai điều: một hyperplane với rìa tối thiểu lớn nhất, và một hyperplane một cách chính xác tách càng nhiều càng tốt. Vấn đề là rằng bạn sẽ không phải luôn luôn có thể để có được cả hai điều. Các tham số c sẽ xác định như thế nào hay mong muốn của bạn là cho sau này. Tôi đã rút ra một ví dụ nhỏ dưới đây để minh họa điều này. Bên trái, bạn có một c thấp mà cung cấp cho bạn một biên độ tối thiểu khá lớn (màu tím). Tuy nhiên, điều này đòi hỏi rằng chúng tôi bỏ qua outlier vòng tròn màu xanh chúng tôi đã không thể phân loại chính xác. Bên phải bạn có một c cao. Bây giờ, bạn sẽ không bỏ bê outlier và do đó kết thúc với một lợi nhuận nhỏ hơn nhiều.Tùy thuộc vào thiết lập dữ liệu của bạn, thay đổi c có thể hoặc có thể không tạo ra một hyperplane khác nhau. Nếu nó tạo ra một hyperplane khác nhau, mà không ngụ ý rằng loại của bạn sẽ xuất các lớp khác nhau của dữ liệu cụ thể bạn đã sử dụng nó để phân loại. Weka là một công cụ tốt cho visualizing dữ liệu và chơi xung quanh với các cài đặt khác nhau cho một SVM. Nó có thể giúp bạn có được một ý tưởng tốt hơn về cách dữ liệu của bạn nghe và tại sao thay đổi giá trị c không thay đổi phân loại lỗi. Nói chung, có vài trường hợp đào tạo và nhiều thuộc tính làm cho nó dễ dàng hơn để làm cho một tách tuyến tính của dữ liệu. Cũng rằng thực tế là bạn đánh giá trên của bạn đào tạo dữ liệu và dữ liệu không nhìn thấy không mới làm cho tách dễ dàng hơn.
đang được dịch, vui lòng đợi..
