Chúng tôi ước tính đầu tiênBây giờ chúng tôi có tất cả mọi thứ tại chỗ để tạo vectorizer đầu tiên của chúng tôi. Hầu hết cáccách thuận tiện để làm điều đó là để kế thừa nó từ BaseEstimator. Nó đòi hỏi chúng ta đểthực hiện ba phương pháp sau đây:get_feature_names(): điều này trả về một danh sách các chuỗi của các tính năng mà chúng tôi sẽtrở lại trong transform().phù hợp với (tài liệu, y = không có gì): như chúng tôi không thực hiện một loại, chúng tôi có thểbỏ qua điều này và chỉ đơn giản là trở lại tự.Transform(Documents): điều này trở về numpy.array(), có một mảng củahình dạng (len(documents), len(get_feature_names)). Điều này có nghĩa rằng đối với mỗitài liệu trong các tài liệu, nó có để trở về một giá trị cho mỗi tính năng tên trongget_feature_names().Hãy cho chúng tôi bây giờ thực hiện những phương pháp này:
đang được dịch, vui lòng đợi..