In the same vein as ImageNet — a massive trove of categorized images utilized by researchers to improve machine learning, image understanding, and search functionalities across the web — Google says that it is now looking to create a similar database for videos.
On its Research Blog yesterday, the search giant announced the release of YouTube-8M, a database of 8 million YouTube videos — comprising over 500,000 hours of video — that can be used for video analysis, and thereby to help improve video search and discovery across the web. Google says the YouTube-8M — comprised exclusively of public videos with over 1,000 views — has been categorized into 24 top verticals (including Arts & Entertainment, Games, Autos & Vehicles, and Sports), as well as 4,800 more specific classes and 1.8 million total labels.
Prior to the YouTube-8M, the largest such video database was the Sports-1M, Google says, comprising 1 million sports-related YouTube videos categorized into 500 different classes. The fact that video is far more time-consuming to annotate manually than images and much more expensive to process and store makes the YouTube-8M a substantial accomplishment.
“We believe this dataset can significantly accelerate research on video understanding,” Google software engineers Sudheendra Vijayanarasimhan and Paul Natsev wrote in the post, “as it enables researchers and students without access to big data or big machines to do their research at previously unprecedented scale.” The YouTube-8M is explorable in browser form right here (check out a screencap below), and you can read more about the project in a technical report submitted by researchers to the Cornell University Library.
Trong cùng một tĩnh mạch như ImageNet — một tàng lớn của phân loại các hình ảnh được sử dụng bởi các nhà nghiên cứu để cải thiện máy học hình sự hiểu biết, và tìm kiếm chức năng trên trang web-Google nói rằng nó bây giờ là tìm cách để tạo ra một cơ sở dữ liệu tương tự cho video.Trên Blog của mình nghiên cứu hôm qua, khổng lồ tìm kiếm đã công bố việc phát hành của YouTube - 8M, cơ sở dữ liệu của 8 triệu YouTube video — bao gồm hơn 500.000 giờ video — có thể được sử dụng cho video phân tích, và do đó giúp cải thiện tìm kiếm video và phát hiện trên toàn bộ web. Google nói rằng YouTube - 8M-bao gồm độc quyền của khu vực video với hơn 1.000 lượt xem — đã được phân loại thành 24 đầu dọc (bao gồm cả nghệ thuật & giải trí, trò chơi, ô tô & xe cộ, và thể thao), cũng như các lớp học cụ thể hơn 4.800 và 1,8 triệu tất cả nhãn.Trước khi đến với YouTube - 8M, lớn nhất như cơ sở dữ liệu video là thể thao - 1M, Google nói, bao gồm 1 triệu liên quan đến thể thao video YouTube được phân loại thành các lớp khác nhau 500. Một thực tế rằng video là tốn thời gian hơn để chú thích bằng tay hơn so với hình ảnh và đắt tiền hơn để xử lý và lưu trữ làm cho YouTube - 8M một thành tựu đáng kể."Chúng tôi tin rằng số liệu này đáng kể có thể đẩy nhanh các nghiên cứu trên video hiểu biết," kỹ sư phần mềm Google Sudheendra Vijayanarasimhan và Paul Natsev đã viết trong bài, "vì nó cho phép các nhà nghiên cứu và sinh viên không có quyền truy cập vào dữ liệu lớn hoặc các máy lớn để làm nghiên cứu của họ ở quy mô chưa từng thấy trước đây." YouTube - 8M là VRML trong trình duyệt mẫu ở đây (hãy kiểm tra screencap dưới đây), và bạn có thể đọc thêm về các dự án trong một báo cáo kỹ thuật gửi bởi các nhà nghiên cứu đến thư viện đại học Cornell.
đang được dịch, vui lòng đợi..
Trong bối cảnh đó như ImageNet - một kho lớn của hình ảnh phân loại sử dụng bởi các nhà nghiên cứu để cải thiện máy học tập, hiểu biết hình ảnh, và các chức năng tìm kiếm trên web - Google cho biết rằng nó bây giờ là tìm cách để tạo ra một cơ sở dữ liệu tương tự cho video.
Vào Blog nghiên cứu của mình ngày hôm qua, gã khổng lồ tìm kiếm công bố việc phát hành của YouTube-8M, một cơ sở dữ liệu của 8 triệu video YouTube - bao gồm hơn 500.000 giờ video - có thể được sử dụng để phân tích video, và qua đó giúp cải thiện tìm kiếm video và phát hiện trên web. Google cho biết YouTube-8M - bao gồm độc quyền các video công với hơn 1.000 lượt xem - đã được phân loại thành 24 ngành dọc trên (bao gồm cả Nghệ thuật & Giải trí, Games, Ô tô & Xe và Thể thao), cũng như 4.800 lớp học cụ thể hơn và 1,8 triệu tổng số nhãn.
Trước khi YouTube-8M, cơ sở dữ liệu video như lớn nhất là thể thao-1M, Google cho biết, bao gồm video YouTube 1.000.000 thể thao liên quan đến phân loại vào 500 lớp học khác nhau. Thực tế rằng video được thêm rất nhiều thời gian để chú thích bằng tay hơn hình ảnh và đắt hơn nhiều để xử lý và lưu trữ làm cho YouTube-8M một thành tựu đáng kể.
"Chúng tôi tin rằng số liệu này có thể tăng tốc đáng kể các nghiên cứu về sự hiểu biết video," kỹ sư phần mềm của Google Sudheendra Vijayanarasimhan và Paul Natsev đã viết trong bài viết, "vì nó cho phép các nhà nghiên cứu và sinh viên không có quyền truy cập vào dữ liệu lớn hay máy lớn để làm nghiên cứu ở quy mô trước đây chưa từng có." YouTube-8M là explorable ở dạng trình duyệt ngay tại đây (kiểm tra một screencap dưới đây), và bạn có thể đọc thêm về dự án trong một báo cáo kỹ thuật do các nhà nghiên cứu cho Thư viện Cornell.
đang được dịch, vui lòng đợi..