3.4 cây tự tổ chức3.4.1 clustering khám phá với quan hệ phân cấpMục đích là để thêm một chiều hướng thứ bậc mới vào bản đồ SOM (xem hình 3,10). Nócó nghĩa là để tạo ra một tập các cây sắp xếp theo cấu trúc liên kết nhất định. Bản đồbảo tồn cấu trúc liên kết dữ liệu trong khi dữ liệu giống nhau nằm trên cấu trúc phân cấp.Các nút mạng đại diện cho nguyên mẫu trong lưới điện. Không giống như các phân cấpđại diện nơi chỉ có nút lá có chứa dữ liệu thông tin, mỗi nút cây trongCấu trúc soT tương ứng với đầu vào dữ liệu. Các thuật toán được đề xuất có thể phát hiệncụm và đại diện cho cụm các cấu trúc tô pô và phân cấp.Ở đây cây mỗi là không chỉ là một cụm sao nhưng một cây-con từ bất kỳ chi nhánh cũng là một phụ-cụm. Condence của mỗi nhóm có thể dễ dàng thấy vì phân cấpmối quan hệ giữa các dữ liệu đầu vào.Trong cấu trúc phân cấp và tô pô, giống nhau giữa một cặp của dữ liệulà avaiable thông qua liên kết thứ bậc, trong khi khoảng cách giữa hai cụm phụ thuộcvào các liên kết tô pô. 3.4.2 soT - tô pô và phân cấp cụmTừ thời điểm này, các notations: một đầu vào dữ liệu đối tượng hoặc vector xi và một nút câyXiare tất cả như nhau. A cụm tôi, một nút mạng Ci, mẫu thử nghiệm wiare quá.Kích thước của lưới điện W biểu hiện bằng K = p × q phải được cung cấp một tiên nghiệm.Mỗi nút mạng Ck∈ W liên kết với một mẫu thử nghiệm và một treek. Vì vậysau initalization, chúng ta nên có K cây trong mạng. Cho mỗiCặp treecandtreeronW, của inuence lẫn nhau là dened bởi các chức năngKT (δ (Cc, Cr)) = exp (−δ(CTc,Cr)). Dựa trên phương trình 3.1, các chức năng mới chi phí làtái viết bằng phương trình 3.2. K K R (Φ, W) = ∑ ∑ ∑ KT(δ(φ(subtreexi), Cr)) kxi− wrk2 (3.2) c = 1 i∈treec r = 1 3.4. tự tổ chức câynơi φ là chức năng chuyển nhượng được thể hiện như sau:K∑Φ (subtreexi) = arg min KT (d (xi, Ck)) kxi− wkk2 31(3,3) k k = 1 nơi subtreexicontains xi và tất cả cây nút đệ quy kết nối đến nó. Nó nênlưu ý rằng dữ liệu trong cây-con được tương tự do các quy tắc tự assembly. Chúng tôicó điều này như là một lợi thế để giảm độ phức tạp thuật toán. Cho thấy bổ đề 3.4.1làm thế nào để chỉ định cùng một lúc một nhóm dữ liệu.Định lý 3.4.1 ∀XJ∈ subtreexi, φ(xj) = φ(xi) (3,4) Bằng chứng cho d (xi, Cc) là khoảng cách từ xitowc và giả sử rằng Cc = φ(xi)sau đó chúng tôi có:d (xi, Cc) < d (xi, Ck), ∀k = [1,..., K]Khi xj∈ subtreexi = ⇒ xiand xiare tương tự, khoảng cách của họ nên có xu hướng 0.Lim d (xi, xj) = 0XJ→xiChúng ta suy ra rằng:d (xj, Cc) ≈ d (xi, Cc) + d (xj, xi) < d (xi, Ck) + d (xj, xi) ≈ d (xj, Ck)= ⇒ φ(xj) = Ccor φ(xj) = φ(xi) = CcGiảm thiểu chi phí chức năng R (φ, L) là một vấn đề tối ưu hóa tổ hợp. Ởcông việc này, chúng tôi đề xuất để giảm thiểu các chức năng chi phí trong cùng một cách như là "hàng loạt" ver-Sion sử dụng thống kê đặc điểm cung cấp bởi cây để thúc đẩy sự hội tụcủa thuật toán. Những đặc điểm được sử dụng trong gán chức năng 3.3.3.4.3 thuật toán lôỞ đây chúng tôi muốn hiển thị làm thế nào để thích ứng với các quy tắc tự assembly cung cấp bởi AntTreetrong thuật toán 2 để tô pô mô hình bao gồm SOM. Trong quá trình học tập,tình trạng của một nút cây có thể khác nhau do các kết nối hoặc ngắt kết nối quy tắc.Vì vậy, chúng tôi dene ba khả năng cho trạng thái nút:1. Ban đầu: tình trạng mặc định trước khi đào tạo;2. kết nối: các nút cây kết nối với một nút;3. ngắt kết nối: các nút cây đã được kết nối ít nhất một lần nhưng bây giờ được dis-kết nối. 32 Chương 3. Tự tổ chức các cây và các ứng dụng cho đồ thịTổng hợp Thuật toán 6 SoT lô thuật toán1: khởi tạo mẫu thử nghiệm k2: trong khi dừng lại tiêu chí đã không là fullled làm3: khởi tạo danh sách4: trong khi danh sách không phải là sản phẩm nào 5: xiis các rst dữ liệu từ danh sách 6: c = φ(xi) Tìm tốt nhất phù hợp với mạng nút 7:8:9: Nếu xiis đầu tiên sau đótreec = constructT ree (treec, xi)khác kết nối xito treec 10:11: subtreexi = {xiand tất cả cây nút đệ quy và tạm thời được kết nốiđể xi}Nếu xiisdisconnected sau đó 12:13: treec = constructT ree (treec, subtreexi)subtreexitotreeckhác nếu xiisconnected và c6 = coldthen kết nối hoặc xior 14: subtreexi = ngắt kết nối subtreexi từ treecold 15:16:17:18:19:20: treec = constructT ree (treec, subtreexi)treeckết thúc nếukết thúc nếuNếu xi không kết nối sau đódanh sách = {danh sách, xi} / / đặt xiat cuối cùng của danh sáchkhác kết nối subtreexito 21:22: danh sách = danh sách subtreexikết thúc nếu hủy bỏ subtreexifrom danh sách 23: kết thúc trong khi24: cho c = 1 → KTdo 25: ∑K r=1K(δ(c,r)) ∑ j∈Crxj Cập Nhật mẫu vectơ nơi nris các WC = ∑K T nr r=1K(δ(c,r))số lượng dữ liệu được tìm thấy trong cụm r26: kết thúc cho27: kết thúc trong khi. Hãy để chúng tôi biểu thị xpos là sự hỗ trợ (gốc cây) hoặc vị trí nút cây nơi xicó vị trí. Lúc đầu, xi nằm trên sự hỗ trợ và sẽ di chuyển trong cây(đối với các nút cây khác) trong đặt hàng để nd vị trí tốt nhất của nó; x + và x− hai cây nútkết nối với xpos mà là tương ứng nút cây đặt tương tự và không giống nhauđể xi. Cho danh sách biểu thị một danh sách các nút cây. Trước khi đào tạo, danh sách chứa chỉ ban đầucác nút cây, bất cứ khi nào một nút cây trở thành kết nối, nó ngay lập tức gỡ bỏtừ danh sách; Ngoài ra bất cứ khi nào một nút cây và trẻ em của nó nhận được kết nối từmột cây, chúng tôi đặt chúng trở lại vào danh sách. Sau khi lặp đi lặp lại một số, danh sách có thể chứa cả haicác nút cây ban đầu và bị ngắt kết nối.Thuật toán lô Hiển thị trong thuật toán 6. Các thuật toán bao gồm ba 3.4. tự tổ chức cây 33 bước như trong các thuật toán SOM (phần 3.2). Bên cạnh đó, SoT có một bước bổ sungxây dựng cây. Trong khi khởi tạo được giống như một trong SOM,những người khác phải modied để thích ứng với cấu trúc mới. Sau đó SoT có thể tiến hànhbởi Luân phiên giữa ba bước: phân công, xây dựng cây và Cập Nhật.Chuyển nhượngTừ phương trình 3.3 và 3,4, nó có thể được suy luận rằng không có hai trường hợp riêng biệtassignment:1. For one single object xi. This can be considered as a sub-tree with one singlenode. It may happen when xiis either initial (see Line 6 in Algorithm 6) ordisconnected (see Line 11 in Algorithm 6). It can be assigned by developpingEquation 3.3:∑ φ(xi) = arg min KT(δ(xi, Ck)) kxi− wkk2 r k=1..K 2. For a subtreexi(subtreexiconsists of the sub-tree with xi as the root) , it willbe assigned by Equation 3.3 and see Line 16 in Algorithm 6.Figure 3.7: Group assignment from treecoldtotreecAn example where multiple tree nodes are simultaneously assigned is shown inFigure 3.7. Due to the last update, subtreex consists of three violet tree nodes thatare no longer connected to treecold. Now we have to determine the new best matchtreecfor the tree node x using φ(subtreex). As in Equation 3.4 the assignments ofchild nodes of x follow automatically the one of x using the statistical characteristicsof tree. Even though these three nodes are now found in the new network node Cc,their hierarchy in new cell remains in the old network node Ccold.Tree constructionThis step is realized by the function constructTree in which we use the rules fromAlgorithm 2. This function is to nd the best position in the tree structure towhich the learning node xi is connected. In the case of this function being called to 34 Chapter 3. Self-Organizing Trees and its applications for graphsummarization assign subtreexi, only xi will be learnt with those three rules dened in Algorithm2. One subtree to be re-connected must be disconnected before. Concerning todisconnection, there is two distinct cases:1. disconnect tree node(s) due to the assignment (Line 14 in Algorithm 6),2. disconnect tree node when a node comes into play (Line 7 in Algorithm 2).Figure 3.8: Disconnect subtreexfrom treecold and put it in listWhenever a tree node gets disconnected from a tree, we have to check whether itdoes exist other child nodes in subtreexi or not? If it's the case, we disconnect all ofthem or for more specic subtreexi. A simple example of disconnection for a groupof nodes (or sub-tree) is depicted in Figure 3.8. Given treecold as in this example,the tree node x consisting of three violet nodes is to disconnect from this tree. Allthe nodes connected to x must be recursively disconnected too; it applies to twochild nodes of x. Therefore subtreexhave disconnected status and are immediatelyput back onto the pool list.After being disconnected, these nodes will be connected again by the functionconstructTree. Suppose that xibecomes connected at a moment, we will keep thissub-tree structure by re-connecting these child nodes together, hence this way canaccelerate the learning process. For example, let's re-take the example in Figure 3.8.After getting new assignment, x is going to connect to treec. It leads to that thechild node of x have treecas their best match tree too. We systematically connectthis sub-tree to treec and the result is shown in Figure 3.9. We remind that thissubtree is not kept till the end of learning. There is possiblity that the nodes in thesubtree will be disconnected in next iterations.UpdateThis step is necessary to compute the new prototypes. We can easily adapt ouralgorithm to choose a representative prototype. In order to update the prototypevectors, we can use the same way as in the batch version of the SOM algorithm. 3.4. Self-organizing TreesFigure 3.9: Re-connect subtreexto treec3.4.4 Computational complexity 35 Lemma 3.4.2 SoT has a complexity of θ(NiterN log N ) where Niter is the numberof total iterations when the learning has been terminated.Proof Algorithm 6 requires Niter iterations to reach stopping criteria. During oneiteration, an operation includes three iterative steps: assignment, tree constructionand updating support. The number of assignme
đang được dịch, vui lòng đợi..
