emphasis on analytics, as has been the case in many other related tech dịch - emphasis on analytics, as has been the case in many other related tech Việt làm thế nào để nói

emphasis on analytics, as has been

emphasis on analytics, as has been the case in many other related technical application
areas (e.g., consumer analytics, completive analytics, visual analytics, social analytics, and
so forth), the text field has also wanted to get on the analytics bandwagon. While the
term text analytics is more commonly used in a business application context, text mining
is frequently used in academic research circles. Even though they may be defined somewhat
differently at times, text analytics and text mining are usually used synonymously,
and we (the authors of this book) concur with this.
Text mining (also known as text data mining or knowledge discovery in textual
databases) is the semi-automated process of extracting patterns (useful information and
knowledge) from large amounts of unstructured data sources. Remember that data mining
is the process of identifying valid, novel, potentially useful, and ultimately understandable
patterns in data stored in structured databases, where the data are organized in records
structured by categorical, ordinal, or continuous variables. Text mining is the same as
data mining in that it has the same purpose and uses the same processes, but with text
mining the input to the process is a collection of unstructured (or less structured) data
files such as Word documents, PDF files, text excerpts, XML files, and so on. In essence,
text mining can be thought of as a process (with two main steps) that starts with imposing
structure on the text-based data sources, followed by extracting relevant information and
knowledge from this structured text-based data using data mining techniques and tools.
The benefits of text mining are obvious in the areas where very large amounts of
textual data are being generated, such as law (court orders), academic research (research
articles), finance (quarterly reports), medicine (discharge summaries), biology (molecular
interactions), technology (patent files), and marketing (customer comments). For example,
the free-form text-based interactions with customers in the form of complaints (or praises)
and warranty claims can be used to objectively identify product and service characteristics
that are deemed to be less than perfect and can be used as input to better product development
and service allocations. Likewise, market outreach programs and focus groups
generate large amounts of data. By not restricting product or service feedback to a codified
form, customers can present, in their own words, what they think about a company’s
products and services. Another area where the automated processing of unstructured text
has had a lot of impact is in electronic communications and e-mail. Text mining not only
can be used to classify and filter junk e-mail, but it can also be used to automatically prioritize
e-mail based on importance level as well as generate automatic responses (Weng and
Liu, 2004). The following are among the most popular application areas of text mining:
• Information extraction. Identification of key phrases and relationships within
text by looking for predefined objects and sequences in text by way of pattern
matching. Perhaps the most commonly used form of information extraction is
named entity extraction. Named entity extraction includes named entity recognition
(recognition of known entity names—for people and organizations, place names,
temporal expressions, and certain types of numerical expressions, using existing
knowledge of the domain), co-reference resolution (detection of co-reference and
anaphoric links between text entities), and relationship extraction (identification of
relations between entities).
• Topic tracking. Based on a user profile and documents that a user views, text
mining can predict other documents of interest to the user.
• Summarization. Summarizing a document to save time on the part of the reader.
• Categorization. Identifying the main themes of a document and then placing the
document into a predefined set of categories based on those themes.
• Clustering. Grouping similar documents without having a predefined set of
categories.
0/5000
Từ: -
Sang: -
Kết quả (Việt) 1: [Sao chép]
Sao chép!
nhấn mạnh vào phân tích, như đã là trường hợp trong nhiều khác liên quan đến kỹ thuật ứng dụngkhu vực (ví dụ như, người tiêu dùng analytics, nỗ analytics, trực quan phân tích, xã hội phân tích, vàvv), trường văn bản có cũng muốn có được trên analytics bandwagon. Trong khi cáchạn văn bản phân tích thường được sử dụng trong một bối cảnh ứng dụng kinh doanh, văn bản khai khoángthường được sử dụng trong vòng tròn nghiên cứu học tập. Ngay cả mặc dù họ có thể xác định phần nàomột cách khác nhau vào các thời điểm, phân tích văn bản và khai thác mỏ văn bản được thường được sử dụng synonymously,và chúng tôi (tác giả của cuốn sách này) đồng tình với điều này.Khai thác văn bản (còn được gọi là văn bản dữ liệu khai thác hoặc kiến thức phát hiện trong văn bảncơ sở dữ liệu) là quá trình bán tự động trích xuất mô hình (thông tin hữu ích vàkiến thức) từ một lượng lớn các nguồn dữ liệu không có cấu trúc. Hãy nhớ rằng khai thác dữ liệuquá trình xác định là hợp lệ, tiểu thuyết, có khả năng hữu ích, và cuối cùng dễ hiểuCác mô hình trong dữ liệu được lưu trữ trong cơ sở dữ liệu có cấu trúc, nơi dữ liệu được tổ chức trong hồ sơcấu trúc của các biến categorical, tự hoặc liên tục. Khai thác văn bản là giống nhưdữ liệu khai thác mỏ ở chỗ nó có cùng một mục đích và sử dụng các quá trình tương tự, nhưng với văn bảnkhai thác các đầu vào cho quá trình là một tập hợp các dữ liệu không có cấu trúc (hay ít cấu trúc)các tập tin như Word, tập tin PDF, trích đoạn văn bản, file XML, và như vậy. Về bản chất,khai thác văn bản có thể được dùng như một quá trình (với hai bước chính) mà bắt đầu với áp đặtcấu trúc trên văn bản dựa trên dữ liệu nguồn, sau đó là trích xuất thông tin có liên quan vàkiến thức từ này cấu trúc dữ liệu dựa trên văn bản bằng cách sử dụng kỹ thuật khai thác dữ liệu và các công cụ.Những lợi ích của văn bản khai thác là hiển nhiên trong các lĩnh vực trong trường hợp rất lớn các số tiền củavăn bản dữ liệu đang được tạo ra, chẳng hạn như luật (lệnh tòa án), nghiên cứu học tập (nghiên cứuBài viết), tài chính (báo cáo hàng quý), y (tóm lược xả), sinh học (phân tửtương tác), công nghệ (bằng sáng chế tập tin), và tiếp thị (ý kiến khách hàng). Ví dụ,văn bản dựa trên hình thức miễn phí tương tác với khách hàng trong các hình thức khiếu nại (hoặc ca ngợi)và bảo hành yêu cầu bồi thường có thể được sử dụng để khách quan xác định đặc tính sản phẩm và dịch vụđiều đó được coi là hoàn hảo ít hơn và có thể được sử dụng như đầu vào để phát triển sản phẩm tốt hơnvà dịch vụ phân bổ. Tương tự như vậy, thị trường chương trình tiếp cận và các nhóm tâm điểmtạo ra một lượng lớn dữ liệu. Không hạn chế các sản phẩm hoặc dịch vụ thông tin phản hồi để một biên soạnhình thức, khách có thể trình bày, nói cách riêng của họ, họ nghĩ gì về một công tysản phẩm và dịch vụ. Một khu vực nơi mà tự động xử lý văn bản có cấu trúcđã có rất nhiều tác động là trong liên lạc điện tử và thư điện tử. Khai thác mỏ không chỉ văn bảncó thể được sử dụng để phân loại và lọc e-mail rác, nhưng nó cũng có thể được sử dụng để tự động ưu tiênthư điện tử dựa trên mức độ quan trọng cũng như tạo ra tự động trả lời (Weng vàLiu, 2004). The following are among the most popular application areas of text mining:• Information extraction. Identification of key phrases and relationships withintext by looking for predefined objects and sequences in text by way of patternmatching. Perhaps the most commonly used form of information extraction isnamed entity extraction. Named entity extraction includes named entity recognition(recognition of known entity names—for people and organizations, place names,temporal expressions, and certain types of numerical expressions, using existingknowledge of the domain), co-reference resolution (detection of co-reference andanaphoric links between text entities), and relationship extraction (identification ofrelations between entities).• Topic tracking. Based on a user profile and documents that a user views, textmining can predict other documents of interest to the user.• Summarization. Summarizing a document to save time on the part of the reader.• Categorization. Identifying the main themes of a document and then placing thedocument into a predefined set of categories based on those themes.• Clustering. Grouping similar documents without having a predefined set ofcategories.
đang được dịch, vui lòng đợi..
Kết quả (Việt) 2:[Sao chép]
Sao chép!
nhấn mạnh vào phân tích, như là trường hợp trong nhiều ứng dụng liên quan kỹ thuật khác
khu vực (ví dụ, phân tích tiêu dùng, phân tích bổ xung, phân tích trực quan, phân tích xã hội, và
vv), các lĩnh vực văn bản cũng muốn có được vào cuộc phân tích. Trong khi
phân tích văn bản hạn thường được sử dụng trong một ngữ cảnh ứng dụng kinh doanh, khai thác văn bản
thường được sử dụng trong giới nghiên cứu học thuật. Mặc dù họ có thể được định nghĩa hơi
khác nhau vào những thời điểm, phân tích văn bản và khai thác văn bản thường được sử dụng đồng nghĩa,
và chúng tôi (tác giả của cuốn sách này) đồng tình với điều này.
khai thác Text (còn được gọi là khai thác dữ liệu văn bản hoặc khám phá tri thức trong văn bản
cơ sở dữ liệu) là quá trình bán tự động giải nén hình mẫu (thông tin hữu ích và
kiến thức) từ một lượng lớn các nguồn dữ liệu phi cấu trúc. Hãy nhớ rằng khai thác dữ liệu
là quá trình xác định giá trị, tiểu thuyết, khả năng hữu dụng, và cuối cùng hiểu
các mẫu trong dữ liệu được lưu trữ trong cơ sở dữ liệu có cấu trúc, nơi dữ liệu được tổ chức trong các hồ sơ
có cấu trúc của phân loại, thứ tự, hoặc các biến liên tục. Khai thác văn bản là giống như
dữ liệu khai thác trong đó nó có cùng mục đích sử dụng và các quá trình tương tự, nhưng với văn bản
khai thác các đầu vào cho quá trình này là một tập hợp các cấu trúc (hoặc ít hơn có cấu trúc) dữ liệu
tập tin như văn bản Word, file PDF, trích đoạn văn bản, file XML, và như vậy. Về bản chất,
khai thác văn bản có thể được coi như là một quá trình (với hai bước chính) bắt đầu bằng việc áp đặt
cơ cấu trên các nguồn dữ liệu dựa trên văn bản, sau đó giải nén thông tin có liên quan và
kiến thức từ dữ liệu văn bản dựa trên cấu trúc này bằng cách sử dụng các kỹ thuật khai thác dữ liệu và công cụ.
Những lợi ích của việc khai thác văn bản là hiển nhiên trong các lĩnh vực mà một số lượng rất lớn các
dữ liệu văn bản được tạo ra, chẳng hạn như luật (lệnh của tòa án), nghiên cứu khoa học (nghiên cứu
các bài báo), tài chính (báo cáo hàng quý), y học (tóm tắt xả), sinh học (phân tử
tương tác), công nghệ (file bản quyền), và tiếp thị (ý kiến của khách hàng). Ví dụ,
các tương tác dựa trên văn bản dạng tự do với các khách hàng trong các hình thức khiếu nại (hoặc khen ngợi)
và yêu cầu bảo hành có thể được sử dụng để xác định một cách khách quan về sản phẩm và dịch vụ đặc trưng
được coi là ít hơn hoàn hảo và có thể được sử dụng như là đầu vào phát triển sản phẩm tốt hơn
và phân bổ các dịch vụ. Tương tự như vậy, các chương trình tiếp cận cộng đồng thị trường và các nhóm tập trung
tạo ra một lượng lớn dữ liệu. Bằng cách không hạn chế sản phẩm hoặc dịch vụ để phản hồi một hệ thống hóa
đơn, khách hàng có thể trình bày, theo lời của họ, những gì họ nghĩ về một công ty
sản phẩm và dịch vụ. Một lĩnh vực khác mà tự động xử lý các văn bản có cấu trúc
đã có rất nhiều tác động có liên lạc điện tử và e-mail. Khai thác văn bản không chỉ
có thể được sử dụng để phân loại và lọc rác e-mail, nhưng nó cũng có thể được sử dụng để tự động ưu tiên
e-mail dựa trên mức độ quan trọng cũng như tạo ra phản ứng tự động (Weng và
Liu, 2004). Sau đây là những lĩnh vực ứng dụng phổ biến nhất của khai phá văn bản:
• Khai thác thông tin. Xác định các cụm từ khóa và các mối quan hệ trong
văn bản bằng cách tìm kiếm cho các đối tượng được xác định trước và các chuỗi trong văn bản bằng cách mô hình
phù hợp. Lẽ là hình thức phổ biến nhất được sử dụng khai thác thông tin được
đặt tên thác thực thể. Khai thác thực thể có tên bao gồm nhận dạng tên thực thể
(công nhận tên-cho thực thể gọi người dân và các tổ chức, tên địa điểm,
thời gian biểu, và một số loại biểu thức số, sử dụng hiện có
kiến thức về tên miền), độ phân giải đồng tham chiếu (phát hiện của đồng tham chiếu và
liên kết giữa các thực thể anaphoric văn bản), và khai thác mối quan hệ (xác định các
mối quan hệ giữa các thực thể).
• Theo dõi Chủ đề. Căn cứ vào hồ sơ người dùng và tài liệu mà người dùng xem, văn bản
khai thác mỏ có thể dự đoán được các tài liệu khác của người dùng quan tâm.
• Tổng kết. Tổng kết một tài liệu để tiết kiệm thời gian trên một phần của người đọc.
• Phân loại. Xác định những chủ đề chính của một tài liệu và sau đó đưa các
tài liệu vào một tập hợp được xác định trước của loại dựa trên những chủ đề.
• Clustering. Nhóm các tài liệu tương tự mà không có một thiết lập ban
trù.
đang được dịch, vui lòng đợi..
 
Các ngôn ngữ khác
Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.

Copyright ©2024 I Love Translation. All reserved.

E-mail: