Trong chương 1, bắt đầu với Python máy học, chúng tôi đã cố gắng để phù hợp vớiđa thức phức tạp khác nhau kiểm soát bởi tham số chiều,d, để phù hợp với dữ liệu. Chúng tôi nhận ra rằng một đa thức hai chiều, một đường thẳng, đã làmkhông phù hợp dữ liệu ví dụ rất tốt bởi vì các dữ liệu không có tính chất tuyến tính. Khôngvấn đề phức tạp như thế nào chúng tôi thủ tục phù hợp đã có, chúng tôi hai chiềuMô hình sẽ thấy tất cả mọi thứ như là một đường thẳng. Chúng tôi nói rằng nó quá thiên vị cho các dữ liệuở bàn tay; nó là dưới phù hợp.Chúng tôi chơi một chút với các kích thước và phát hiện ra rằng chiều 100đa thức là thực sự phù hợp rất tốt vào dữ liệu mà trên đó nó được đào tạo (chúng tôikhông biết gì về đào tạo thử nghiệm chia tách lúc đó). Tuy nhiên, chúng tôi nhanh chóng thấy rằng nólà phù hợp quá tốt. Chúng tôi nhận ra rằng nó quá trang bị cho nên nặng mà khác nhaumẫu của các điểm dữ liệu, chúng tôi sẽ có nhận được hoàn toàn khác nhau chiều 100đa thức. Chúng tôi nói rằng các mô hình có quá cao một phương sai cho dữ liệu nhất định hoặcđó là phù hợp hơn.Đây là những thái cực giữa mà hầu hết máy của chúng tôi học vấn đềcư trú. Lý tưởng nhất, chúng tôi muốn có thiên vị thấp và thấp phương sai. Tuy nhiên, chúng tôi đang trong mộtthế giới xấu và phải thương mại off giữa chúng. Nếu chúng tôi cải thiện trên một, chúng tôi sẽ có khả năngcó được tồi tệ hơn khác.
đang được dịch, vui lòng đợi..
