phim điện ảnh). Thời gian này, như là một phương pháp hồi qui, đa dạng, chúng tôi sẽ sử dụng cácLassoCV lớp:từ sklearn.linear_model nhập khẩu LassoCVreg = LassoCV (fit_intercept = True, alphas=[.125,.25,.5,1.,2.,4.])Bằng cách đi qua các nhà xây dựng một thiết lập rõ ràng của alphas, chúng tôi có thể cố định các giá trịrằng đường bên trong, xác nhận sẽ sử dụng. Bạn có thể lưu ý rằng các giá trị là bộicủa hai, bắt đầu với 1/8 lên đến 4. Chúng tôi bây giờ sẽ viết một chức năng mà học mộtMô hình cho người dùng i:# cô lập người dùng nàyu = đánh giá [i]Chúng tôi là chỉ quan tâm đến những bộ phim u người dùng đánh giá cao, do đó, chúng ta phải xây dựng cácchỉ số của những người. Có một vài thủ thuật NumPy ở đây: u.toarray() để chuyển đổi từmột ma trận thưa thớt đến một mảng thường xuyên. Sau đó, chúng tôi ravel() rằng mảng để chuyển đổi từ mộthàng loạt (có nghĩa là, một mảng hai chiều với một kích thước đầu tiên của 1) để một đơn giảnhết mảng. Chúng tôi so sánh nó với zero và yêu cầu sự so sánh này ở đâusự thật. Kết quả, ps, là một loạt các chỉ số; những chỉ số tương ứng với phim màngười dùng có Xếp hạng:u = u.array().ravel()PS, = np.where (u > 0)# Xây dựng một mảng với các chỉ số [0... N] ngoại trừ tôichúng tôi = np.delete(np.arange(reviews.shape[0]), tôi)x = giá [chúng tôi] [:, ps].TCuối cùng, chúng tôi chọn chỉ xem phim mà người dùng đã đánh giá cao:y = u [ps]Cross-xác nhận được thiết lập như trước. Bởi vì chúng tôi có nhiều người sử dụng, chúng tôi sẽ đểchỉ sử dụng bốn nếp gấp (thêm sẽ mất một thời gian dài và chúng tôi có đủ dữ liệu đào tạovới chỉ 80 phần trăm của dữ liệu):err = 0KF = KFold(len(y), n_folds = 4)chuyến tàu, kiểm tra trong kf:# Bây giờ chúng tôi thực hiện một normaliz cho một bộ phim
đang được dịch, vui lòng đợi..