Computers can do some amazing thing

Computers can do some amazing things lately, with things like parallel processing, machine intelligence, and more powerful hardware allowing extraordinary advancements on what seems like a daily basis. Microsoft is in the thick of things when it comes to the artificial intelligence, and machine learning is at the center of it all. On Tuesday, the company announced another significant breakthrough.

The most natural way for humans to interact with computers is by speaking with them, and Microsoft has created technology that can understand spoken language as well as humans, according to the Microsoft blog. Reaching human parity in speech recognition is a historic achievement and Microsoft achieved this milestone more quickly than it expected. “Even five years ago, I wouldn’t have thought we could have achieved this. I just wouldn’t have thought it would be possible,” said Harry Shum, executive vice president in charge of Microsoft’s Intelligence and Research Group.

According to a paper published on Monday, Microsoft’s research team has created a speec- recognition system that achieves a word error rate (WER) of only 5.9 percent, a reduction from the 6.3 percent reported just a month ago. Human beings who transcribe the same conversation used in the test also achieve around a 5.9 percent WER, meaning that for the first time, a computer performs just as well in the industry standard Switchboard task as do humans.

Speech-recognition research began in the early 1970s at the Defense Advanced Research Projects Agency (DARPA), and the computer industry took up the challenge and has been working ever since to accomplish the goal of a human-like ability to understand what is being said. Now that this milestone has been reached, we can expect digital assistants and other tools to dramatically improve their ability to interact with us in more natural fashion. “This will make Cortana more powerful, making a truly intelligent assistant possible,” Shum said.

Microsoft’s new speech-recognition system does not achieve perfection in recognizing spoken conversation, but then again, neither do we. To overcome the usual mistakes in recognizing language, the system uses neural network technology to leverage neural language models that can make the same inferences that humans make when correcting for misheard words.

The team used a few existing tools to achieve the speech-recognition milestone. For example, the Computational Network Toolkit, an open source Microsoft system for applying deep learning to computing tasks, was utilized, allowing the specialized graphics processing units (GPUs) running in parallel to enable faster processing of deep-learning algorithms. Technologies used for other tasks, such as image processing, were also leveraged.

The researchers are not resting on their laurels, however. Work remains to make the speech-recognition technology work in more real-world settings where background noise and context can make recognizing conversational speaking a much more difficult task. As Geoffrey Zweig, manager of Microsoft’s Speech & Dialog research group, put it, “The next frontier is to move from recognition to understanding.”

The most natural way for humans to interact with computers is by speaking with them, and Microsoft has created technology that can understand spoken language as well as humans, according to the Microsoft blog. Reaching human parity in speech recognition is a historic achievement and Microsoft achieved this milestone more quickly than it expected. “Even five years ago, I wouldn’t have thought we could have achieved this. I just wouldn’t have thought it would be possible,” said Harry Shum, executive vice president in charge of Microsoft’s Intelligence and Research Group.

According to a paper published on Monday, Microsoft’s research team has created a speec- recognition system that achieves a word error rate (WER) of only 5.9 percent, a reduction from the 6.3 percent reported just a month ago. Human beings who transcribe the same conversation used in the test also achieve around a 5.9 percent WER, meaning that for the first time, a computer performs just as well in the industry standard Switchboard task as do humans.

Speech-recognition research began in the early 1970s at the Defense Advanced Research Projects Agency (DARPA), and the computer industry took up the challenge and has been working ever since to accomplish the goal of a human-like ability to understand what is being said. Now that this milestone has been reached, we can expect digital assistants and other tools to dramatically improve their ability to interact with us in more natural fashion. “This will make Cortana more powerful, making a truly intelligent assistant possible,” Shum said.

Microsoft’s new speech-recognition system does not achieve perfection in recognizing spoken conversation, but then again, neither do we. To overcome the usual mistakes in recognizing language, the system uses neural network technology to leverage neural language models that can make the same inferences that humans make when correcting for misheard words.

The team used a few existing tools to achieve the speech-recognition milestone. For example, the Computational Network Toolkit, an open source Microsoft system for applying deep learning to computing tasks, was utilized, allowing the specialized graphics processing units (GPUs) running in parallel to enable faster processing of deep-learning algorithms. Technologies used for other tasks, such as image processing, were also leveraged.

The researchers are not resting on their laurels, however. Work remains to make the speech-recognition technology work in more real-world settings where background noise and context can make recognizing conversational speaking a much more difficult task. As Geoffrey Zweig, manager of Microsoft’s Speech & Dialog research group, put it, “The next frontier is to move from recognition to understanding.”

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Máy tính có thể làm một số những điều tuyệt vời gần đây, với những thứ như xử lý song song, máy tình báo và phần cứng mạnh mẽ hơn cho phép các tiến bộ bất thường trên những gì có vẻ như một cơ sở hàng ngày. Microsoft là trong dày của sự vật khi nói đến trí tuệ nhân tạo, và máy học tại Trung tâm của tất cả. Ngày thứ ba, công ty đã công bố một bước đột phá đáng kể.Cách tự nhiên nhất cho con người tương tác với máy tính là bằng cách nói với họ, và Microsoft đã tạo ra công nghệ có thể hiểu ngôn ngữ nói cũng như con người, theo blog của Microsoft. Đạt tính chẵn lẻ của con người trong bài phát biểu công nhận là một thành tích lịch sử và Microsoft đạt được mốc này nhanh hơn so với nó mong đợi. "Thậm chí 5 năm trước đây, tôi sẽ không có suy nghĩ chúng tôi có thể đạt được điều này. Tôi chỉ không có nghĩ rằng nó sẽ có thể,"ông Harry Shum, phó chủ tịch điều hành phụ trách tình báo và nhóm nghiên cứu của Microsoft.Theo một bài báo được công bố vào ngày thứ hai, nhóm nghiên cứu của Microsoft đã tạo ra một hệ thống công nhận speec đạt được một tỷ lệ lỗi word (WER) của chỉ 5.9%, giảm từ 6.3% báo cáo chỉ một tháng trước. Con người sao lại cuộc trò chuyện tương tự được sử dụng trong các thử nghiệm cũng đạt được xung quanh một phần trăm 5.9 WER, có nghĩa rằng lần đầu tiên, một máy tính thực hiện chỉ là tốt trong nhiệm vụ tổng đài tiêu chuẩn của ngành công nghiệp như con người.Nhận dạng tiếng nói nghiên cứu đã bắt đầu vào đầu thập niên 1970 tại các phòng thủ tiên tiến nghiên cứu dự án cơ quan (DARPA), và các ngành công nghiệp máy tính đã lên những thách thức và đã làm việc từ bao giờ để đạt mục tiêu của một con người như khả năng để hiểu những gì đang được nói. Bây giờ mà đã đạt đến cột mốc quan trọng này, chúng tôi có thể mong đợi các trợ lý kỹ thuật số và công cụ khác để cải thiện đáng kể khả năng của họ để tương tác với chúng tôi trong thời trang tự nhiên hơn. "Điều này sẽ làm cho Cortana mạnh mẽ hơn, làm cho một trợ lý thông minh thật sự có thể," Shum nói.Hệ thống nhận dạng giọng nói mới của Microsoft không đạt được sự hoàn hảo trong công nhận được nói chuyện, nhưng sau đó một lần nữa, cũng không làm chúng tôi. Để khắc phục những sai lầm bình thường trong công nhận ngôn ngữ, Hệ thống sử dụng mạng nơ-ron để thúc đẩy mô hình thần kinh ngôn ngữ có thể làm cho những suy luận tương tự làm cho con người khi điều chỉnh cho misheard từ.Nhóm nghiên cứu sử dụng một số các công cụ hiện có để đạt được các mốc quan trọng nhận dạng giọng nói. Ví dụ: bộ công cụ mạng tính toán là một mã nguồn mở Microsoft hệ thống cho việc áp dụng học sâu để tính toán công việc, đã được sử dụng, cho phép đồ họa chuyên xử lý đơn vị (GPU) chạy song song để cho phép xử lý nhanh hơn của thuật toán sâu học tập. Công nghệ sử dụng cho các nhiệm vụ khác, chẳng hạn như xử lý hình ảnh, cũng được thừa hưởng.Các nhà nghiên cứu không nghỉ ngơi trên quế của họ, Tuy nhiên. Công việc còn lại để làm cho công nghệ nhận dạng giọng nói làm việc trong cài đặt thực tế thêm nơi nền tiếng ồn và bối cảnh có thể làm cho công nhận đàm thoại phát biểu một nhiệm vụ khó khăn hơn. Như Geoffrey Zweig, giám đốc của Microsoft Speech & hộp thoại Nhóm nghiên cứu, đặt nó, "biên giới tiếp theo là để di chuyển từ công nhận cho sự hiểu biết."

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Máy tính có thể làm một số những điều tuyệt vời gần đây, với những việc như xử lý song song, máy thông minh, và phần cứng mạnh mẽ hơn cho phép những tiến bộ phi thường về những gì có vẻ như một cơ sở hàng ngày. Microsoft đang trong dày của sự vật khi nói đến trí thông minh nhân tạo, và máy học là trung tâm của tất cả. Hôm thứ ba, công ty đã công bố một bước đột phá đáng kể.

Cách tự nhiên nhất cho con người tương tác với máy tính là bằng cách nói chuyện với họ, và Microsoft đã tạo ra công nghệ có thể hiểu ngôn ngữ nói cũng như con người, theo blog của Microsoft. Đạt được cân bằng của con người trong phát biểu công nhận là một thành tựu lịch sử và Microsoft đạt được mốc này nhanh hơn so với dự kiến. "Ngay cả năm năm trước, tôi đã không nghĩ rằng chúng tôi có thể đạt được điều này. Tôi chỉ sẽ không nghĩ rằng nó sẽ có thể, "Harry Shum, phó chủ tịch điều hành phụ trách tình báo và nghiên cứu của Tập đoàn Microsoft cho biết.

Theo một bài báo được công bố vào thứ hai, nhóm nghiên cứu của Microsoft đã tạo ra một hệ thống nhận dạng speec- mà đạt được một tỷ lệ từ lỗi (WER) chỉ có 5,9 phần trăm, giảm từ 6,3 phần trăm báo cáo chỉ cách đây một tháng. Con người ai ghi lại cuộc trò chuyện cùng được sử dụng trong các thử nghiệm cũng đạt khoảng 5,9 phần trăm WER, có nghĩa là lần đầu tiên, một máy tính thực hiện cũng như trong các ngành công nghiệp công đài tiêu chuẩn cũng như con người.

Nghiên cứu Speech-nhận bắt đầu vào đầu năm 1970 tại các dự án nghiên cứu Cơ quan Quốc phòng cao cấp (DARPA), và các ngành công nghiệp máy tính đã lên thách thức và đã được làm việc kể từ khi hoàn thành mục tiêu của một khả năng của con người giống như để hiểu những gì đang được nói. Bây giờ sự kiện này đã đạt được, chúng ta có thể mong đợi trợ lý kỹ thuật số và các công cụ khác để cải thiện đáng kể khả năng tương tác với chúng tôi trong thời trang tự nhiên hơn. "Điều này sẽ làm cho Cortana mạnh mẽ hơn, làm cho một trợ lý thực sự thông minh có thể," Shum cho biết.

Hệ thống nhận diện giọng nói mới của Microsoft không đạt được sự hoàn hảo trong việc nhận ra chuyện nói, nhưng sau đó một lần nữa, chúng ta cũng vậy. Để khắc phục những sai lầm thông thường trong việc nhận ra ngôn ngữ, hệ thống sử dụng công nghệ mạng thông minh để tận dụng mô hình ngôn ngữ thần kinh có thể làm cho những kết luận tương tự mà con người thực hiện khi điều chỉnh cho lời nói nghe nhầm.

Nhóm nghiên cứu đã sử dụng một vài công cụ hiện có để đạt được các mốc nhận dạng tiếng nói. Ví dụ, tính toán mạng Toolkit, một nguồn hệ thống Microsoft mở cho việc áp dụng học sâu với nhiệm vụ tính toán, đã được sử dụng, cho phép các đơn vị chuyên xử lý đồ họa (GPU) chạy song song để cho phép xử lý nhanh hơn các thuật toán sâu học tập. Công nghệ sử dụng cho các nhiệm vụ khác, chẳng hạn như xử lý hình ảnh, cũng được thừa hưởng.

Các nhà nghiên cứu không được nghỉ ngơi trên vòng nguyệt quế của họ, tuy nhiên. Công việc còn lại để làm cho công tác công nghệ nhận diện giọng nói trong nhiều thiết lập thế giới thực, nơi tiếng ồn nền và bối cảnh có thể làm cho nhận thức đàm thoại nói một nhiệm vụ khó khăn hơn. Như Geoffrey Zweig, giám đốc nhóm nghiên cứu Speech & Dialog của Microsoft, nói: "Các biên giới tiếp theo là chuyển từ công nhận sự hiểu biết."

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.