The discrete wavelet transform (DWT

The discrete wavelet transform (DWT) is a linear signal processing technique that,
when applied to a data vector X, transforms it to a numerically different vector, X
0
, of
wavelet coefficients. The two vectors are of the same length. When applying this technique
to data reduction, we consider each tuple as an n-dimensional data vector, that
is, X = (x1,x2,...,xn), depicting n measurements made on the tuple from n database
attributes.3
“How can this technique be useful for data reduction if the wavelet transformed data are
of the same length as the original data?” The usefulness lies in the fact that the wavelet
transformed data can be truncated. A compressed approximation of the data can be
retained by storing only a small fraction of the strongest of the wavelet coefficients.
For example, all wavelet coefficients larger than some user-specified threshold can be
retained. All other coefficients are set to 0. The resulting data representation is therefore
very sparse, so that operations that can take advantage of data sparsity are computationally
very fast if performed in wavelet space. The technique also works to remove
noise without smoothing out the main features of the data, making it effective for data
3
In our notation, any variable representing a vector is shown in bold italic font; measurements depicting
the vector are shown in italic font.
HAN 10-ch03-083-124-9780123814791 2011/6/1 3:16 Page 101 #19
3.4 Data Reduction 101
cleaning as well. Given a set of coefficients, an approximation of the original data can be
constructed by applying the inverse of the DWT used.
The DWT is closely related to the discrete Fourier transform (DFT), a signal processing
technique involving sines and cosines. In general, however, the DWT achieves better
lossy compression. That is, if the same number of coefficients is retained for a DWT and
a DFT of a given data vector, the DWT version will provide a more accurate approximation
of the original data. Hence, for an equivalent approximation, the DWT requires less
space than the DFT. Unlike the DFT, wavelets are quite localized in space, contributing
to the conservation of local detail.
There is only one DFT, yet there are several families of DWTs. Figure 3.4 shows
some wavelet families. Popular wavelet transforms include the Haar-2, Daubechies-4,
and Daubechies-6. The general procedure for applying a discrete wavelet transform uses
a hierarchical pyramid algorithm that halves the data at each iteration, resulting in fast
computational speed. The method is as follows:
1. The length, L, of the input data vector must be an integer power of 2. This condition
can be met by padding the data vector with zeros as necessary (L ≥ n).
2. Each transform involves applying two functions. The first applies some data smoothing,
such as a sum or weighted average. The second performs a weighted difference,
which acts to bring out the detailed features of the data.
3. The two functions are applied to pairs of data points in X, that is, to all pairs of
measurements (x2i
,x2i+1). This results in two data sets of length L/2. In general,
these represent a smoothed or low-frequency version of the input data and the highfrequency
content of it, respectively.
4. The two functions are recursively applied to the data sets obtained in the previous
loop, until the resulting data sets obtained are of length 2.
5. Selected values from the data sets obtained in the previous iterations are designated
the wavelet coefficients of the transformed data.
0 2 4 6
0.8
0.6
0.4
0.2
0.0
1.0 0.5 0.0 0.5
(a) Haar-2 (b) Daubechies-4
1.0 1.5 2.0
0.6
0.4
0.2
0.0
Figure 3.4 Examples of wavelet families. The number next to a wavelet name is the number of vanishing
moments of the wavelet. This is a set of mathematical relationships that the coefficients must
satisfy and is related to the number of coefficients.
HAN 10-ch03-083-124-9780123814791 2011/6/1 3:16 Page 102 #20
102 Chapter 3 Data Preprocessing
Equivalently, a matrix multiplication can be applied to the input data in order to
obtain the wavelet coefficients, where the matrix used depends on the given DWT. The
matrix must be orthonormal, meaning that the columns are unit vectors and are mutually
orthogonal, so that the matrix inverse is just its transpose. Although we do not have
room to discuss it here, this property allows the reconstruction of the data from the
smooth and smooth-difference data sets. By factoring the matrix used into a product of
a few sparse matrices, the resulting “fast DWT” algorithm has a complexity of O(n) for
an input vector of length n.
Wavelet transforms can be applied to multidimensional data such as a data cube. This
is done by first applying the transform to the first dimension, then to the second, and so
on. The computational complexity involved is linear with respect to the number of cells
in the cube. Wavelet transforms give good results on sparse or sk

0/5000

Từ: -

Sang: -

Kết quả (Việt) 1: [Sao chép]

Sao chép!

Biến đổi bề mặt rời rạc (DWT) là một kỹ thuật xử lý tín hiệu tuyến tính,Khi áp dụng cho dữ liệu vectơ X, biến đổi nó cho một vector số lượng khác nhau, X0, củaHệ số bề mặt. Hai vectơ có cùng chiều dài. Khi áp dụng kỹ thuật nàydữ liệu giảm, chúng tôi xem xét mỗi tuple là một vectơ n chiều dữ liệu, mà, X = (x1, x2,..., xn), miêu tả n đo đạc được thực hiện trên tuple từ cơ sở dữ liệu nattributes.3"Làm thế nào kỹ thuật này có thể hữu ích cho các dữ liệu giảm nếu dữ liệu bề mặt chuyểnđộ dài tương tự như là dữ liệu gốc?" Tính hữu dụng này nằm trong một thực tế rằng bề mặtchuyển dữ liệu có thể được cắt ngắn. Một xấp xỉ nén dữ liệu có thểgiữ lại bằng cách lưu trữ chỉ là một phần nhỏ của mạnh nhất của hệ số bề mặt.Ví dụ, tất cả các hệ số bề mặt lớn hơn một số ngưỡng quy định người sử dụng có thểgiữ lại. Tất cả các hệ số khác được đặt về 0. Cách trình bày dữ liệu kết quả là do đórất thưa thớt, do đó hoạt động có thể tận dụng lợi thế của dữ liệu sparsity là computationallyrất nhanh nếu thực hiện trong không gian bề mặt. Kỹ thuật này cũng hoạt động để loại bỏtiếng ồn mà không làm mịn ra các tính năng chính của dữ liệu, làm cho nó hiệu quả cho các dữ liệu3Trong ký hiệu của chúng tôi, bất kỳ biến đại diện cho một vector được hiển thị trong chữ in nghiêng in đậm; Các đo đạc miêu tảvector được hiển thị trong chữ in nghiêng.HAN 10-ch03-083-124-9780123814791 2011/6/1 3:16 trang 101 #193.4 dữ liệu giảm 101làm sạch cũng. Cho một tập hợp các hệ số, một xấp xỉ của dữ liệu gốc có thểđược xây dựng bằng cách áp dụng nghịch đảo của DWT được sử dụng.DWT là chặt chẽ liên quan đến biến đổi Fourier rời rạc (DFT), xử lý tín hiệukỹ thuật liên quan đến sines, cos. Nói chung, Tuy nhiên, DWT đạt tốt hơnnén lossy. Đó là, nếu cùng một số hệ số giữ lại cho một DWT vàmột DFT của vectơ cho trước dữ liệu, phiên bản DWT sẽ cung cấp một ước tính chính xác hơncác dữ liệu ban đầu. Do đó, cho một xấp xỉ tương đương, DWT đòi hỏi ít hơnkhông gian hơn DFT. Không giống như DFT, wavelets khá bản địa hoá trong không gian, góp phầnđể bảo tồn các chi tiết của địa phương.Có chỉ có một DFT, nhưng vẫn có rất nhiều gia đình cho thấy DWTs. hình 3.4một số gia đình có bề mặt. Biến đổi bề mặt phổ biến bao gồm Haar-2, Daubechies-4,và Daubechies-6. Quy trình chung cho việc áp dụng một biến đổi rời rạc bề mặt sử dụngmột thuật toán kim tự tháp bậc halves dữ liệu tại mỗi lặp đi lặp lại, kết quả nhanh chóngtốc độ tính toán. Phương pháp này là như sau:1. độ dài L, của vector dữ liệu đầu vào phải có một sức mạnh nguyên 2. Tình trạng nàycó thể được đáp ứng bằng cách đệm dữ liệu vectơ với Zero khi cần thiết (L ≥ n).2. mỗi biến đổi liên quan đến việc áp dụng hai chức năng. Lần đầu tiên áp dụng một số dữ liệu làm phẳng, mịnchẳng hạn như một tổng hay trọng số trung bình. Thứ hai thực hiện một sự khác biệt trọng,mà hoạt động để đưa ra các tính năng chi tiết của dữ liệu.3. hai chức năng được áp dụng cho cặp điểm dữ liệu trong X, đó là, để tất cả các cặpđo lường (x2ix2i + 1). Kết quả là hai tập dữ liệu chiều dài L/2. Nói chung,những đại diện cho một phiên bản smoothed hoặc tần số thấp đầu vào dữ liệu và highfrequencynội dung của nó, tương ứng.4. hai chức năng là đệ quy áp dụng cho các bộ dữ liệu thu được trong trước đóLoop, cho đến khi các bộ dữ liệu kết quả thu được có chiều dài 2.5. lựa chọn giá trị từ các bộ dữ liệu thu được trong lặp trước đó được chỉ địnhHệ số bề mặt của các dữ liệu chuyển đổi.0 2 4 60.80,60.40,20.01.0 0.5 0.0 0.5(a) Haar-2 (b) Daubechies-41,0 1,5 2,00,60.40,20.0Hình 3.4 các ví dụ về bề mặt gia đình. Số bên cạnh một tên bề mặt là số biến mấtnhững khoảnh khắc của bề mặt. Đây là một tập hợp các mối quan hệ toán học các câu phảiđáp ứng và có liên quan đến số lượng các hệ số.HAN 10-ch03-083-124-9780123814791 2011/6/1 3:16 trang 102 #20102 chương 3 dữ liệu tiền xử lýTương tự, một phép nhân ma trận có thể được áp dụng cho các dữ liệu đầu vào đểcó được hệ số bề mặt, nơi các ma trận sử dụng phụ thuộc vào DWT. cho cácma trận phải là Kronecker, có nghĩa là các cột là đơn vị vectơ và là loại trừ lẫn nhautrực giao, do đó nghịch đảo của ma trận là chỉ transpose của nó. Mặc dù chúng tôi không cóPhòng để thảo luận về nó ở đây, tài sản này cho phép xây dựng lại các dữ liệu từ cácmịn màng và mịn-khác biệt bộ dữ liệu. By bao thanh toán ma trận sử dụng thành một sản phẩm củamột vài các ma trận thưa thớt, các thuật toán "nhanh DWT" kết quả có một phức tạp của O(n) chomột vectơ nhập chiều dài n.Biến đổi bề mặt có thể được áp dụng cho các dữ liệu đa chiều như một khối dữ liệu. Điều nàyđược thực hiện bởi đầu tiên áp dụng phép biến đổi chiều đầu tiên, sau đó cho lần thứ hai, và như vậytrên. Độ phức tạp tính toán tham gia là tuyến tính đối với số lượng tế bàotrong khối. Bề mặt biến đổi cho các kết quả tốt về thưa thớt hoặc sk

đang được dịch, vui lòng đợi..

Kết quả (Việt) 2:[Sao chép]

Sao chép!

Các wavelet rời rạc (DWT) là một kỹ thuật xử lý tín hiệu tuyến tính rằng,
khi áp dụng cho một vector dữ liệu X, biến nó thành một vector số lượng khác nhau, X
0
, các
hệ số wavelet. Hai vectơ có cùng chiều dài. Khi áp dụng kỹ thuật này
để giảm dữ liệu, chúng tôi xem xét từng tuple như là một vector dữ liệu n-chiều, đó
là, X = (x1, x2, ..., xn), miêu tả n các phép đo được thực hiện trên cơ sở dữ liệu tuple từ n
attributes.3
"làm thế nào kỹ thuật này có thể hữu ích để giảm dữ liệu nếu dữ liệu wavelet chuyển là
chiều dài tương tự như các dữ liệu ban đầu?" sự hữu ích nằm trong thực tế rằng các wavelet
dữ liệu chuyển đổi có thể được rút ngắn. Một xấp xỉ nén các dữ liệu có thể được
giữ lại bằng cách lưu trữ chỉ là một phần nhỏ trong những mạnh nhất của các hệ số wavelet.
Ví dụ, tất cả các hệ số wavelet lớn hơn một ngưỡng định người sử dụng có thể được
giữ lại. Tất cả các hệ số khác được thiết lập là 0. do đó kết quả của biểu diễn dữ liệu là
rất thưa thớt, do đó hoạt động có thể tận dụng lợi thế của dữ liệu thưa thớt là tính toán
rất nhanh nếu thực hiện trong không gian wavelet. Kỹ thuật này còn có tác dụng loại bỏ
tiếng ồn mà không làm mịn ra các tính năng chính của dữ liệu, làm cho nó có hiệu quả cho các dữ liệu
3
Trong ký hiệu của chúng tôi, bất kỳ biến đại diện cho một vector được thể hiện trong phông chữ nghiêng đậm; đo miêu tả
các vector được thể hiện trong phông chữ in nghiêng.
HAN 10 ch03-083-124-9780123814791 2011/06/01 03:16 Trang 101 # 19
3.4 Dữ liệu giảm 101
làm sạch là tốt. Cho một tập các hệ số, một xấp xỉ của các dữ liệu ban đầu có thể được
xây dựng bằng cách áp dụng các nghịch đảo của DWT sử dụng.
Các DWT có liên quan chặt chẽ đến sự đổi Fourier rời rạc (DFT), một xử lý tín hiệu
kỹ thuật liên quan đến sin và cosin. Tuy nhiên, nhìn chung, các DWT đạt được tốt hơn
nén lossy. Đó là, nếu cùng một số các hệ số được giữ lại cho một DWT và
một DFT của một vector dữ liệu nhất định, phiên bản DWT sẽ cung cấp một xấp xỉ chính xác hơn
của dữ liệu gốc. Do đó, đối với một xấp xỉ tương đương, DWT đòi hỏi ít
không gian hơn DFT. Không giống như các DFT, wavelets khá cục bộ trong không gian, góp phần
vào việc bảo tồn các chi tiết của địa phương.
Chỉ có một DFT, nhưng vẫn có một số gia đình của DWTs. Hình 3.4 cho thấy
một số gia đình wavelet. Biến đổi wavelet phổ biến bao gồm các Haar-2, Daubechies-4,
và Daubechies-6. Các thủ tục chung để áp dụng một wavelet rời rạc sử dụng
một thuật toán kim tự tháp thứ bậc mà giảm một nửa lượng dữ liệu ở mỗi lần lặp, kết quả nhanh
tốc độ tính toán. Phương pháp này là như sau:
1. Chiều dài, L, của vector dữ liệu đầu vào phải được một sức mạnh nguyên 2. Tình trạng này
có thể được đáp ứng bằng việc đệm vector dữ liệu với số không cần thiết (L ≥ n).
2. Mỗi biến đổi liên quan đến việc áp dụng hai chức năng. Việc đầu tiên áp dụng một số làm mịn dữ liệu,
chẳng hạn như một khoản tiền hay bình quân gia quyền. Việc thứ hai thực hiện một sự khác biệt trọng,
có tác dụng để đưa ra các tính năng chi tiết của dữ liệu.
3. Hai chức năng này được áp dụng cho các cặp điểm dữ liệu trong X, có nghĩa là, để tất cả các cặp
số (x2i
, x2i + 1). Điều này dẫn đến hai bộ dữ liệu có độ dài L / 2. Nhìn chung,
các đại diện cho một phiên bản được làm nhẵn hoặc tần số thấp của các dữ liệu đầu vào và highfrequency
nội dung của nó, tương ứng.
4. Hai chức năng được đệ quy áp dụng cho các bộ dữ liệu thu được trong các trước
vòng lặp, cho đến khi các bộ dữ liệu kết quả thu được có chiều dài 2.
5. Giá trị được lựa chọn từ các bộ dữ liệu thu được trong các lần lặp lại trước đó được chỉ định
các hệ số wavelet của dữ liệu chuyển đổi.
0 2 4 6
0,8
0,6
0,4
0,2
0,0
1,0 0,5 0,0 0,5
(một) Haar-2 (b) Daubechies-4
1.0 1.5 2.0
0.6
0.4
0.2
0.0
Hình 3.4 Ví dụ về gia đình wavelet. Số bên cạnh một tên wavelet là số biến mất
khoảnh khắc của wavelet. Đây là một tập hợp các mối quan hệ toán học rằng các hệ số phải
đáp ứng và có liên quan đến số lượng các hệ số.
HAN 10 ch03-083-124-9780123814791 2011/06/01 03:16 Page 102 # 20
102 Chương 3 dữ liệu tiền xử lý
tương đương, một phép nhân ma trận có thể được áp dụng cho các dữ liệu đầu vào để
có được các hệ số wavelet, nơi ma trận sử dụng phụ thuộc vào DWT nhất định. Các
ma trận phải trực giao, có nghĩa là các cột là đơn vị vectơ và lẫn nhau
trực giao, để nghịch đảo ma trận chỉ là transpose của nó. Mặc dù chúng tôi không có
phòng để thảo luận về nó ở đây, khách sạn này cho phép việc xây dựng lại các dữ liệu từ
các tập dữ liệu mịn và trơn khác biệt. Bằng cách phân ma trận sử dụng vào một sản phẩm của
một vài ma trận thưa thớt, kết quả "nhanh DWT" thuật toán có độ phức tạp O (n) cho
một vector đầu vào có độ dài n.
Biến đổi Wavelet có thể được áp dụng cho dữ liệu đa chiều như một khối dữ liệu . Điều này
được thực hiện bằng cách đầu tiên áp dụng các biến đổi đến chiều đầu tiên, sau đó đến lần thứ hai, và do đó
trên. Các tính toán phức tạp có liên quan là tuyến tính đối với số lượng tế bào với
trong khối lập phương. Biến đổi Wavelet cho kết quả tốt trên thưa thớt hoặc sk

đang được dịch, vui lòng đợi..

Kết quả (Việt) 3:[Sao chép]

Sao chép!

đang được dịch, vui lòng đợi..

Các ngôn ngữ khác

Hỗ trợ công cụ dịch thuật: Albania, Amharic, Anh, Armenia, Azerbaijan, Ba Lan, Ba Tư, Bantu, Basque, Belarus, Bengal, Bosnia, Bulgaria, Bồ Đào Nha, Catalan, Cebuano, Chichewa, Corsi, Creole (Haiti), Croatia, Do Thái, Estonia, Filipino, Frisia, Gael Scotland, Galicia, George, Gujarat, Hausa, Hawaii, Hindi, Hmong, Hungary, Hy Lạp, Hà Lan, Hà Lan (Nam Phi), Hàn, Iceland, Igbo, Ireland, Java, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Kurd, Kyrgyz, Latinh, Latvia, Litva, Luxembourg, Lào, Macedonia, Malagasy, Malayalam, Malta, Maori, Marathi, Myanmar, Mã Lai, Mông Cổ, Na Uy, Nepal, Nga, Nhật, Odia (Oriya), Pashto, Pháp, Phát hiện ngôn ngữ, Phần Lan, Punjab, Quốc tế ngữ, Rumani, Samoa, Serbia, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenia, Somali, Sunda, Swahili, Séc, Tajik, Tamil, Tatar, Telugu, Thái, Thổ Nhĩ Kỳ, Thụy Điển, Tiếng Indonesia, Tiếng Ý, Trung, Trung (Phồn thể), Turkmen, Tây Ban Nha, Ukraina, Urdu, Uyghur, Uzbek, Việt, Xứ Wales, Yiddish, Yoruba, Zulu, Đan Mạch, Đức, Ả Rập, dịch ngôn ngữ.