Ask not what your country can do fo

Ask not what your country can do for you; ask what you can do for your country.”
—John F. Kennedy, 1961

When it comes to political speeches, great ones are few and far between. But ordinary political speeches, those given in U.S. congressional floor debates, for example, are numerous.

They are also remarkably similar. These speeches tend to follow a standard format, repeat similar arguments, and even use the same phrases to indicate a particular political affiliation or opinion. It’s almost as if there is some kind of algorithm that determines their content.

That raises an interesting question. Is it possible for a machine to write these kinds of political speeches automatically?

Today, we get an answer thanks to the work of Valentin Kassarnig at the University of Massachusetts, Amherst, who has created an artificial intelligence machine that has learned how to write political speeches that are remarkably similar to real speeches.

The approach is straightforward in principle. Kassarnig used a database of almost 4,000 political speech segments from 53 U.S. Congressional floor debates to train a machine-learning algorithm to produce speeches of its own.

These speeches consist of over 50,000 sentences each containing 23 words on average. Kassarnig also categorized the speeches by political party, whether Democrat or Republican, and by whether it was in favor or against a given topic.

Of course, the devil is in the details of how to analyze this database. Having tried a number of techniques, Kassarnig settled on an approach based on n-grams, sequences of “n” words or phrases. He first analyzed the text using a parts-of-speech approach that tags each word or phrase with its grammatical role (whether a noun, verb, adjective, and so on).

He then looked at 6-grams and the probability of a word or phrase appearing given the five that appear before it. “That allows us to determine very quickly all words which can occur after the previous five ones and how likely each of them is,” he says.

The process of generating speeches automatically follows from this. Kassarnig begins by telling the algorithm what type of speech it is supposed to write—whether for Democrats or Republicans. The algorithm then explore the 6-gram database for that category to find the entire set of 5-grams that have been used to start one of these speeches.

The algorithm then chooses one of these 5-grams at random to start its speech. It then chooses the next word from all those that can follow this 5-gram. “Then the system starts to predict word after word until it predicts the end of the speech,” he says.

There are few tricks along the way, of course. The algorithm knows, for example, the probability that a particular topic will appear in a speech. It then chooses topics by working out what other topics the speech already contains and determining how well these are being covered.

The results are surprisingly good. Here is an example of an automatically generated Democratic speech:

“Mr. Speaker, for years, honest but unfortunate consumers have had the ability to plead their case to come under bankruptcy protection and have their reasonable and valid debts discharged. The way the system is supposed to work, the bankruptcy court evaluates various factors including income, assets and debt to determine what debts can be paid and how consumers can get back on their feet. Stand up for growth and opportunity. Pass this legislation.”

That’s impressive given that there is no training involved other than the initial parts of speech tags, the 6-gram analysis of the political speech database and a little bit of magic sauce. Kassarnig has evaluated these speeches against criteria such as grammatical correctness, sentence transition and speech structure and content and found that they generally perform well. “In particular, the grammatical correctness and the sentence transitions of most speeches were very good,” he says.

Nevertheless, Kassarnig is not optimistic about his algorithm’s chances of taking the political stage by storm. “Despite the good results it is very unlikely that these methods will be actually used to generate speeches for politicians,” he says, presumably because the kind of unscrupulous politician who might exploit his algorithm is so rare (cough).

However, the algorithm could be used to generate other kinds of texts. Kassarnig suggests that it could produce news stories, given other stories on the same incident. Another option could be to produce blog posts about arXiv papers, given a large database of similar stories (ahem).

And he encourages anybody to have a go, say that all of his source code is available on GitHub (https://github.com/valentin012/conspeech). “We explicitly encourage others to try using, modifying and extending it,” he says. “Feedback and ideas for improvement are most welcome.”

Ref: arxiv.org/abs/1601.03313 : Political Speech Generation

Ask not what your country can do for you; ask what you can do for your country.”
—John F. Kennedy, 1961

When it comes to political speeches, great ones are few and far between. But ordinary political speeches, those given in U.S. congressional floor debates, for example, are numerous.

They are also remarkably similar. These speeches tend to follow a standard format, repeat similar arguments, and even use the same phrases to indicate a particular political affiliation or opinion. It’s almost as if there is some kind of algorithm that determines their content.

That raises an interesting question. Is it possible for a machine to write these kinds of political speeches automatically?

Today, we get an answer thanks to the work of Valentin Kassarnig at the University of Massachusetts, Amherst, who has created an artificial intelligence machine that has learned how to write political speeches that are remarkably similar to real speeches.

The approach is straightforward in principle. Kassarnig used a database of almost 4,000 political speech segments from 53 U.S. Congressional floor debates to train a machine-learning algorithm to produce speeches of its own.

These speeches consist of over 50,000 sentences each containing 23 words on average. Kassarnig also categorized the speeches by political party, whether Democrat or Republican, and by whether it was in favor or against a given topic.

Of course, the devil is in the details of how to analyze this database. Having tried a number of techniques, Kassarnig settled on an approach based on n-grams, sequences of “n” words or phrases. He first analyzed the text using a parts-of-speech approach that tags each word or phrase with its grammatical role (whether a noun, verb, adjective, and so on).

He then looked at 6-grams and the probability of a word or phrase appearing given the five that appear before it. “That allows us to determine very quickly all words which can occur after the previous five ones and how likely each of them is,” he says.

The process of generating speeches automatically follows from this. Kassarnig begins by telling the algorithm what type of speech it is supposed to write—whether for Democrats or Republicans. The algorithm then explore the 6-gram database for that category to find the entire set of 5-grams that have been used to start one of these speeches.

The algorithm then chooses one of these 5-grams at random to start its speech. It then chooses the next word from all those that can follow this 5-gram. “Then the system starts to predict word after word until it predicts the end of the speech,” he says.

There are few tricks along the way, of course. The algorithm knows, for example, the probability that a particular topic will appear in a speech. It then chooses topics by working out what other topics the speech already contains and determining how well these are being covered.

The results are surprisingly good. Here is an example of an automatically generated Democratic speech:

“Mr. Speaker, for years, honest but unfortunate consumers have had the ability to plead their case to come under bankruptcy protection and have their reasonable and valid debts discharged. The way the system is supposed to work, the bankruptcy court evaluates various factors including income, assets and debt to determine what debts can be paid and how consumers can get back on their feet. Stand up for growth and opportunity. Pass this legislation.”

That’s impressive given that there is no training involved other than the initial parts of speech tags, the 6-gram analysis of the political speech database and a little bit of magic sauce. Kassarnig has evaluated these speeches against criteria such as grammatical correctness, sentence transition and speech structure and content and found that they generally perform well. “In particular, the grammatical correctness and the sentence transitions of most speeches were very good,” he says.

Nevertheless, Kassarnig is not optimistic about his algorithm’s chances of taking the political stage by storm. “Despite the good results it is very unlikely that these methods will be actually used to generate speeches for politicians,” he says, presumably because the kind of unscrupulous politician who might exploit his algorithm is so rare (cough).

However, the algorithm could be used to generate other kinds of texts. Kassarnig suggests that it could produce news stories, given other stories on the same incident. Another option could be to produce blog posts about arXiv papers, given a large database of similar stories (ahem).

And he encourages anybody to have a go, say that all of his source code is available on GitHub (https://github.com/valentin012/conspeech). “We explicitly encourage others to try using, modifying and extending it,” he says. “Feedback and ideas for improvement are most welcome.”

Ref: arxiv.org/abs/1601.03313 : Political Speech Generation

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Yêu cầu không quốc gia của bạn có thể làm gì cho bạn; hỏi những gì bạn có thể làm cho quốc gia của bạn."— John F. Kennedy năm 1961Khi nói đến bài phát biểu chính trị, những người lớn rất ít và xa giữa. Nhưng bài phát biểu chính trị thông thường, những người được đưa ra trong cuộc tranh luận Quốc hội sàn Mỹ, ví dụ, rất nhiều.Họ cũng là đáng kể tương tự. Các bài phát biểu có xu hướng để làm theo một định dạng chuẩn, lặp lại lập luận tương tự, và thậm chí có thể sử dụng các cụm từ tương tự để chỉ ra một liên kết chính trị cụ thể hoặc ý kiến. Nó là gần như nếu như có một số loại thuật toán xác định nội dung của họ.Mà làm tăng một câu hỏi thú vị. Có thể cho một máy tính để viết các loại bài phát biểu chính trị tự động?Hôm nay, chúng tôi nhận được một câu trả lời nhờ có công việc của Valentin Kassarnig tại Đại học Massachusetts tại Amherst, những người đã tạo ra một máy trí tuệ nhân tạo đã học được làm thế nào để viết bài phát biểu chính trị rõ rệt tương tự như bài phát biểu thực sự.Phương pháp tiếp cận là đơn giản về nguyên tắc. Kassarnig sử dụng cơ sở dữ liệu của gần 4.000 bài phát biểu chính trị các phân đoạn từ 53 các cuộc tranh luận Quốc hội sàn Mỹ để đào tạo một thuật toán máy-học để sản xuất các bài phát biểu của riêng của mình.Các bài phát biểu bao gồm hơn 50.000 câu mỗi chữ 23 chứa trung bình. Kassarnig cũng phân loại các bài phát biểu của đảng chính trị, cho dù Đảng dân chủ hay Đảng Cộng hòa, và cho dù đó là ủng hộ hoặc chống lại một chủ đề nhất định.Tất nhiên, the devil là tại các chi tiết về làm thế nào để phân tích cơ sở dữ liệu này. Có thử một số kỹ thuật, Kassarnig định cư trên một cách tiếp cận dựa trên n-gam, trình tự của các "n" từ hoặc cụm từ. Ông lần đầu tiên phân tích văn bản bằng cách sử dụng một cách tiếp cận các bộ phận của ngôn luận tags mỗi từ hoặc cụm từ với vai trò ngữ pháp của mình (cho dù là một danh từ, động từ, tính từ, và như vậy).Ông sau đó nhìn 6 gam và xác suất của một từ hoặc cụm từ xuất hiện năm xuất hiện trước khi nó được đưa ra. "Mà cho phép chúng tôi để xác định rất nhanh chóng tất cả các từ mà có thể xảy ra sau khi những năm trước đó và có khả năng như thế nào, mỗi người trong số họ là," ông nói.Quá trình tạo ra các bài phát biểu tự động sau này. Kassarnig bắt đầu bằng cách nói với các thuật toán những gì loại của bài phát biểu đó là nghĩa vụ phải viết — dù cho đảng dân chủ hay cộng hòa. Các thuật toán sau đó khám phá cơ sở dữ liệu 6-gam cho danh mục đó để tìm các thiết lập toàn bộ 5 gram đã được sử dụng để bắt đầu một trong những bài phát biểu.Các thuật toán sau đó chọn một trong những 5 gram ngẫu nhiên để bắt đầu bài phát biểu của mình. Nó sau đó chọn từ tiếp theo từ tất cả những người mà có thể làm theo này 5-gam. "Sau đó hệ thống bắt đầu để dự đoán từ sau từ từ cho đến khi nó dự báo kết thúc bài phát biểu," ông nói.Có vài thủ thuật dọc theo đường đi, tất nhiên. Các thuật toán biết, ví dụ: xác suất một chủ đề cụ thể sẽ xuất hiện trong một bài phát biểu. Nó sau đó chọn các chủ đề bằng cách làm việc hiểu những gì các chủ đề khác bài phát biểu đã chứa và xác định tốt như thế nào chúng có được che phủ.Kết quả là đáng ngạc nhiên tốt. Dưới đây là một ví dụ về một bài phát biểu chủ tự động tạo ra:"Ông loa, trong nhiều năm qua, Trung thực, nhưng không may người tiêu dùng đã có khả năng để plead trường hợp của họ đến dưới sự bảo hộ phá sản và có khoản nợ hợp lý và hợp lệ của họ thải ra. Cách hệ thống này là nghĩa vụ phải làm việc, các tòa án phá sản đánh giá các yếu tố khác nhau bao gồm cả thu nhập, tài sản và nợ để xác định các khoản nợ những gì có thể được trả tiền và làm thế nào người tiêu dùng có thể nhận được trở lại trên đôi chân của mình. Đứng lên cho sự tăng trưởng và cơ hội. Vượt qua pháp luật này."Đó là ấn tượng cho rằng đó là không có đào tạo liên quan khác với các thẻ ban đầu phần của bài phát biểu, các phân tích 6-gam của bài phát biểu chính trị cơ sở dữ liệu và một chút của nước sốt ma thuật. Kassarnig đã đánh giá các bài phát biểu chống lại các tiêu chí như ngữ pháp đúng đắn, cấu trúc câu chuyển tiếp và bài phát biểu, nội dung và nhận thấy rằng họ thường hoạt động tốt. "Đặc biệt, sự đúng đắn về ngữ pháp và quá trình chuyển đổi câu của hầu hết các bài phát biểu đã rất tốt," ông nói.Tuy nhiên, Kassarnig không phải là lạc quan về thuật toán của mình cơ hội tham gia sân khấu chính trị của cơn bão. "Mặc dù các kết quả tốt nó là rất khó mà những phương pháp này sẽ thực sự được sử dụng để tạo ra bài phát biểu cho các chính trị gia," ông nói, có lẽ là bởi vì các loại vô đạo đức chính trị gia có thể khai thác các thuật toán của mình là rất hiếm (ho).Tuy nhiên, các thuật toán có thể được sử dụng để tạo ra các loại văn bản. Kassarnig cho thấy rằng nó có thể sản xuất tin tức stories, đưa ra những câu chuyện khác về sự cố tương tự. Một tùy chọn khác có thể sản xuất bài viết blog về arXiv giấy tờ, được đưa ra một cơ sở dữ liệu lớn của câu chuyện tương tự (ahem).Và ông đã khuyến khích bất kỳ người nào để có một đi, nói rằng tất cả các của ông mã nguồn có sẵn trên GitHub (https://github.com/valentin012/conspeech). "Chúng tôi rõ ràng khuyến khích những người khác cố gắng sử dụng, sửa đổi và mở rộng nó," ông nói. "Thông tin phản hồi và ý tưởng để cải thiện chào đón nhất."Ref: arxiv.org/abs/1601.03313: chính trị phát biểu thế hệ

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Đừng hỏi tổ quốc có thể làm cho bạn; hỏi những gì bạn có thể làm cho đất nước của bạn. "
-John F. Kennedy, 1961

Khi nói đến các bài diễn văn chính trị, những người lớn rất ít và xa giữa. Nhưng bài diễn văn chính trị bình thường, những người được đưa ra trong các cuộc tranh luận Mỹ sàn của Quốc hội, ví dụ, là rất nhiều.

Họ cũng gần tương tự. Những bài diễn văn có xu hướng theo một định dạng chuẩn, lặp lại lập luận tương tự, và thậm chí sử dụng các cụm từ giống nhau để chỉ ra một liên kết chính trị cụ thể hoặc ý kiến. Nó gần như là nếu có một số loại thuật toán xác định nội dung của họ.

Điều đó đặt ra một câu hỏi thú vị. Là nó có thể cho một máy tính để viết các loại diễn văn chính trị tự động?

Hôm nay, chúng tôi nhận được một câu trả lời nhờ công việc của Valentin Kassarnig tại Đại học Massachusetts, Amherst, người đã tạo ra một máy trí tuệ nhân tạo đã được học cách viết chính trị bài phát biểu đó là đáng kể tương tự như bài phát biểu thực sự.

phương pháp là đơn giản về nguyên tắc. Kassarnig sử dụng một cơ sở dữ liệu của gần 4.000 phân đoạn bài phát biểu chính trị từ 53 quốc hội Mỹ tranh luận sàn để đào tạo một thuật toán học máy để sản xuất các bài phát biểu của riêng mình.

Những phát biểu bao gồm hơn 50.000 câu từng chứa 23 chữ trên trung bình. Kassarnig cũng phân loại các bài phát biểu của đảng chính trị, cho dù đảng Dân chủ hay đảng Cộng hòa, và cho dù đó là ủng hộ hoặc chống lại một chủ đề nhất định.

Tất nhiên, ma quỷ là trong các chi tiết về làm thế nào để phân tích cơ sở dữ liệu này. Sau khi đã thử một số kỹ thuật, Kassarnig giải quyết trên một cách tiếp cận dựa trên n-gram, trình tự của các từ hoặc cụm từ "n". Ông lần đầu tiên phân tích các văn bản sử dụng một cách tiếp cận phần-of-speech rằng thẻ mỗi từ hoặc cụm từ có vai trò ngữ pháp của nó (cho dù là một danh từ, động từ, tính từ, vv).

Sau đó ông nhìn 6-gram và xác suất của một từ hoặc cụm từ đảng xuất hiện cho năm xuất hiện trước đó. "Điều đó cho phép chúng tôi xác định rất nhanh chóng tất cả các từ mà có thể xảy ra sau năm trước những người thân và làm thế nào có khả năng mỗi trong số họ," ông nói.

Quá trình phát biểu tạo ra tự động sau từ này. Kassarnig bắt đầu bằng cách nói với các thuật toán loại ngôn luận nó là vụ phải viết thư cho dù cho đảng Dân chủ hay đảng Cộng hòa. Các thuật toán sau đó khám phá những cơ sở dữ liệu 6-gram cho thể loại đó để tìm toàn bộ các 5-gram đã được sử dụng để bắt đầu một trong những bài diễn văn.

Các thuật toán sau đó chọn một trong những 5 gram ngẫu nhiên để bắt đầu bài phát biểu của mình. Sau đó chọn từ kế tiếp từ tất cả những điều đó có thể làm theo 5 gram. "Sau đó, hệ thống bắt đầu dự đoán từng từ cho đến khi nó dự đoán kết thúc bài phát biểu," ông nói.

Có vài thủ thuật trên đường đi, tất nhiên. Các thuật toán biết, ví dụ, xác suất mà một chủ đề cụ thể sẽ xuất hiện trong một bài phát biểu. Sau đó chọn chủ đề bằng cách làm việc ra những chủ đề khác phát biểu đã được chứa và xác định như thế nào này đang được bảo hiểm.

Các kết quả đáng kinh ngạc. Dưới đây là một ví dụ về một bài phát biểu của đảng Dân chủ tự động tạo ra:

"Ông Loa, trong nhiều năm qua, người tiêu dùng trung thực nhưng không may đã có khả năng biện hộ của họ để đi theo bảo hộ phá sản và có khoản nợ hợp lý, hợp lệ của họ thải ra. Cách hệ thống là làm việc, tòa án phá sản đánh giá các yếu tố khác nhau bao gồm cả thu nhập, tài sản và các khoản nợ để xác định những khoản nợ có thể được thanh toán và cách thức người tiêu dùng có thể nhận được trở lại trên đôi chân của mình. Hãy đứng lên cho sự tăng trưởng và cơ hội. Thông qua dự luật này. "

Đó là ấn tượng cho rằng không có đào tạo liên quan đến khác hơn so với các bộ phận ban đầu của các thẻ bài phát biểu, phân tích 6-gram của các cơ sở dữ liệu bài phát biểu chính trị và một chút nước sốt ảo thuật. Kassarnig đã đánh giá những bài phát biểu chống lại các tiêu chí như chính xác ngữ pháp, quá trình chuyển đổi câu và cấu trúc luận và nội dung và thấy rằng họ thường thực hiện tốt. "Đặc biệt, tính chính xác về ngữ pháp và quá trình chuyển đổi câu của hầu hết các bài diễn văn rất tốt," ông nói.

Tuy nhiên, Kassarnig không lạc quan về cơ hội của thuật toán mình lấy sân khấu chính trị của cơn bão. "Mặc dù các kết quả tốt nó là rất không chắc rằng các phương pháp này sẽ được thực sự sử dụng để tạo ra các bài phát biểu cho các chính trị gia," ông nói, có lẽ vì các loại chính trị gia vô đạo đức có thể khai thác các thuật toán của mình là rất hiếm (ho).

Tuy nhiên, thuật toán có thể được sử dụng để tạo ra các loại văn bản. Kassarnig cho thấy rằng nó có thể tạo ra những câu chuyện tin tức, đưa những câu chuyện khác về sự cố tương tự. . Một lựa chọn khác có thể là để sản xuất bài viết blog về các giấy tờ arXiv, đưa ra một cơ sở dữ liệu lớn các câu chuyện tương tự (ahem)

Và ông khuyến khích bất cứ ai để có một đi, nói rằng tất cả các mã nguồn của mình là có sẵn trên GitHub (https: // github. com / valentin012 / conspeech). "Chúng tôi rõ ràng khuyến khích người khác hãy thử sử dụng, sửa chữa và mở rộng nó," ông nói. "Phản hồi và ý tưởng để cải thiện được chào đón nhất."

Ref: arxiv.org/abs/1601.03313: Chính trị Speech hệ

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.