Abstract
Background luật Zipf và luật Heaps 'được quan sát thấy trong các hệ thống phức tạp khác nhau. Các lợi ích đặc biệt, hai luật này thường xuyên xuất hiện cùng nhau. Nhiều mô hình lý thuyết và phân tích được thực hiện để hiểu họ đồng xảy ra trong hệ thống thực tế, nhưng vẫn còn thiếu một bức tranh rõ ràng về mối quan hệ của họ. Phương pháp / Kết quả chính Chúng tôi thấy rằng pháp luật 'Heaps có thể được coi là một hiện tượng phái sinh nếu hệ thống tuân pháp luật của Zipf. Hơn nữa, chúng tôi tinh chỉnh các giải pháp gần đúng được biết đến của số mũ của Heaps cung cấp số mũ của Zipf. Chúng tôi thấy rằng các giải pháp gần đúng thực sự là một giải pháp tiệm cận cho các hệ thống vô hạn, trong khi ở các hệ thống hữu hạn kích thước mũ của Heaps là nhạy cảm với các kích thước của hệ thống. Phân tích thực nghiệm rộng rãi trên hàng chục hệ thống khác nhau chứng minh rằng kết quả tinh của chúng ta có thể nắm bắt tốt hơn mối quan hệ giữa các nhân Zipf và Heaps 'mũ. Kết luận / Ý nghĩa Phân tích hiện nay cung cấp một bức tranh rõ ràng về mối quan hệ giữa pháp luật của Zipf và Heaps 'luật mà không cần sự giúp đỡ của bất kỳ mô hình ngẫu nhiên cụ thể, cụ thể là pháp luật 'Heaps thực sự là một hiện tượng sinh từ pháp luật của Zipf. Các phương pháp số được trình bày cho dự toán tốt hơn đáng kể của số mũ của Heaps cho số mũ của Zipf và kích thước hệ thống. Phân tích của chúng tôi cung cấp một số hiểu biết và những tác động của các hệ thống phức tạp thật. Ví dụ, một cách tự nhiên có thể thu được một lời giải thích rõ hơn về sự phát triển ngày càng nhanh của các mạng quy mô-miễn phí. Số liệu Hình 6 Hình 1 Hình 2 Hình 3 Hình 4 Bảng 1 Hình 5 Hình 6 Hình 1 Hình 2 Hình 3 Citation: Lu L, Zhang ZK , Zhou T (2010) Luật Zipf của Dẫn đến Luật Heaps ': Phân tích quan hệ của họ trong hệ thống hữu hạn-Size. PLoS ONE 5 (12): e14139. doi: 10,1371 / journal.pone.0014139 Editor: Olaf Sporns, Đại học Indiana, Hoa Kỳ đã nhận: Tháng Hai 21, 2010; Được chấp nhận: October 20, 2010; Được đăng: 02 Tháng mười hai 2010 Copyright: © 2010 Lu et al. Đây là một bài báo mở được phân phối theo các điều khoản của Giấy phép Creative Commons Ghi công, cho phép sử dụng không hạn chế, phân phối và sinh sản bằng mọi phương tiện, cung cấp các tác giả gốc và nguồn tài liệu được. Kinh phí: Các khoa học quốc gia Thụy Sĩ Foundation (200020- 121.848) và các quốc gia Quỹ khoa học tự nhiên của Trung Quốc (10.635.040). . Các nhà tài trợ không có vai trò trong thiết kế nghiên cứu, thu thập và phân tích dữ liệu, quyết định công bố, hoặc chuẩn bị bản thảo Cạnh tranh lợi ích: Các tác giả đã tuyên bố rằng không có lợi ích cạnh tranh tồn tại. Giới thiệu những bước tiến khổng lồ trong ngành khoa học phức tạp đã được các kết quả trực tiếp của những nỗ lực để phát hiện ra những quy luật chi phối hệ thống khác nhau. [1] luật Zipf và luật Heaps '[2] là hai ví dụ tiêu biểu. Trong năm 1940, Zipf tìm thấy một luật rộng nhất định trong việc phân phối các tần số từ. Bảng xếp hạng tất cả các từ trong thứ tự giảm dần của tần số xuất hiện và biểu thị bằng tần số của từ với cấp bậc, pháp luật của Zipf đọc, mà là tần số tối đa và là cái gọi là số mũ của Zipf. Điện-pháp luật liên quan tần số hạng này cho thấy một phân bố xác suất điện theo pháp luật của các tần số riêng của mình, nói với bằng (xem Vật liệu và phương pháp). Như một chữ ký của các hệ thống phức tạp, pháp luật của Zipf được quan sát thấy ở khắp mọi nơi [3]: bao gồm các bản phân phối của các kích cỡ công ty [4], wealths và thu nhập [5], trích dẫn bài báo [6], biểu gen [7], kích thước của mất điện [8], tên gia đình [9], kích thước thành phố [10], đóng góp cá nhân [11], mở cờ vua [12], tải giao thông gây ra bởi các video YouTube [13], và như vậy. Theo đó, nhiều cơ chế được đưa ra để giải thích sự xuất hiện của pháp luật của Zipf [14], [15], chẳng hạn như những người giàu có trở nên phong phú hơn [16], [17], criticality tự tổ chức [18], Markov Quy trình [19 ], tập hợp của các cá nhân tương tác [20], thiết kế tối ưu hóa [21] và các nguyên tắc nỗ lực ít nhất [22]. Để đặt tên chỉ là một vài. pháp luật Heaps '[2] cũng có thể được áp dụng trong việc mô tả xử lý ngôn ngữ tự nhiên, theo đó các kích thước từ vựng phát triển trong một chức năng sublinear với kích thước tài liệu, nói với, nơi biểu thị tổng số các từ và các số lượng các từ riêng biệt. Một thành phần gây ra như một sự tăng trưởng sublinear có thể là bộ nhớ và tính chất bùng phát của ngôn ngữ con người [23] - [25]. Một hiện tượng thú vị đặc biệt là sự cùng tồn tại của pháp luật của Zipf và pháp luật Heaps '. Gelbukh và Sidorov [26] quan sát thấy hai luật này bằng tiếng Anh, Nga và Tây Ban Nha, với số mũ khác nhau tùy thuộc vào ngôn ngữ. Kết quả tương tự gần đây đã được báo cáo cho các tập văn của văn bản web [27], bao gồm cả các cơ sở dữ liệu ngành Công nghiệp, Open Directory và Wikipedia tiếng Anh. Bên cạnh các quy tắc thống kê của văn bản, các lần xuất hiện của các thẻ cho tài nguyên trực tuyến [28], [29], từ khóa cho các ấn phẩm khoa học [30], từ chứa của các trang web kết quả từ việc tìm kiếm [31], và các định dạng Java hiện đại, C web ++ và các chương trình C [32] cũng đồng thời hiển thị pháp luật của Zipf và pháp luật Heaps '. Benz et al. [33] đã báo cáo pháp luật của Zipf về sự phân bố của các tính năng của các phân tử hữu cơ nhỏ, cùng với pháp luật 'Heaps về số lượng các tính năng độc đáo. Đặc biệt, pháp luật của Zipf và pháp luật Heaps 'liên quan chặt chẽ đến các mạng phát triển. Nó là nổi tiếng mà một số mạng lưới phát triển một cách tăng tốc [34], [35] và có cấu trúc mô-free (xem ví dụ về WWW [36] và Internet [37]), trên thực tế, những tài sản tương ứng với cựu . pháp luật 'Heaps rằng số lượng các nút lớn lên trong một hình thức sublinear với tổng mức độ của các nút, trong khi sau này là tương đương với pháp luật của Zipf cho phân phối độ Baeza-Yates và Navarro [38] cho thấy rằng hai luật có liên quan: khi, nó có thể được bắt nguồn mà pháp luật nếu cả của Zipf và giữ luật Heaps ',. Bằng cách sử dụng một cách tiếp cận tinh vi hơn, Leijenhorst và Weide [39] khái quát kết quả này từ pháp luật của Zipf pháp luật của Mandelbrot [40] nơi và là một hằng số. Dựa trên một biến thể của mô hình Simon [16], Montemurro và Zanette [41], [42] cho thấy rằng luật pháp của Zipf là một kết quả từ pháp luật 'Heaps với tùy thuộc vào và tham số mô hình. Ngoài ra dựa trên một mô hình ngẫu nhiên, Serrano et al. [27] cho rằng pháp luật của Zipf có thể dẫn đến việc Heaps 'pháp luật khi, và Heaps' mũ là. Trong bài báo này, chúng tôi chứng minh rằng đối với một hệ thống phát triển với số mũ một Zipf ổn định của, pháp luật 'Heaps có thể được bắt nguồn trực tiếp từ pháp luật của Zipf mà không cần sự giúp đỡ của bất kỳ mô hình ngẫu nhiên cụ thể. Các mối quan hệ chỉ là một giải pháp giữ tiệm cận cho hệ thống rất lớn kích thước với. Chúng tôi sẽ tinh chỉnh kết quả này cho các hệ thống hữu hạn kích thước với và bổ sung cho nó với. Đặc biệt, chúng tôi phân tích những ảnh hưởng của kích thước hệ thống về số mũ của Heaps, được hoàn toàn bị bỏ qua trong các tài liệu. Phân tích thực nghiệm rộng rãi trên hàng chục hệ thống khác nhau, từ lần xuất hiện từ khóa trong các tạp chí khoa học để truyền bá mẫu của virus cúm A mới (H1N1) đã chứng minh rằng kết quả tinh tế trình bày ở đây có thể nắm bắt tốt hơn mối quan hệ giữa số mũ Heaps 'của Zipf và. Đặc biệt, kết quả của chúng tôi đồng ý tốt với các qui luật phát triển của các mạng lưới thúc đẩy và đề nghị rằng tốc độ tăng là cần thiết để giữ một sức mạnh-luật phân bố mức độ ổn định. Trong khi phần lớn các nghiên cứu về pháp luật 'Heaps được giới hạn trong ngôn ngữ học, công việc của chúng tôi mở ra cánh cửa đến một chân trời rộng lớn hơn nhiều mà bao gồm nhiều hệ thống phức tạp. Kết quả Kết quả phân tích Để đơn giản mô tả, chúng tôi sử dụng ngôn ngữ của số liệu thống kê từ trong văn bản, nơi biểu thị tần số của từ với cấp bậc. Tuy nhiên, kết quả không giới hạn hệ thống ngôn ngữ. Lưu ý là số lượng rất các từ riêng biệt với tần số lớn hơn. Biểu thị bằng tổng số lần xuất hiện từ (tức là, kích thước của văn bản) và các số tương ứng của các từ riêng biệt, sau đó (1) Chú ý rằng với một hằng số. Theo các điều kiện bình thường, khi nào và (hai điều kiện là giữ cho hầu hết các hệ thống thực tế),. Thay vào phương trình. 1 bởi, chúng ta có (2) Theo luật của Zipf và mối quan hệ giữa các số mũ của Zipf và quyền lực-pháp luật, phần bên phải của phương trình. 2 có thể được thể hiện trong thời hạn từ, như (3) Kết hợp phương. 1 và Eq. 3, chúng ta có thể có được các ước lượng, như (4) Rõ ràng, kích thước văn bản là tổng hợp của tất cả các từ xuất hiện, nói (5) Chú ý rằng tổng là lớn hơn so với hội nhập. Các sai số tương đối của xấp xỉ này, cho, làm tăng với sự gia tăng của và giảm với sự gia tăng của (xem Hình S1 các kết quả bằng số vào sự nhạy cảm của các lỗi liên quan đến các thông số và). Thay thế bởi Eq. 4, nó đến với mối quan hệ giữa và: (6) Sự so sánh trực tiếp giữa các quan sát thực nghiệm và phương. 6, cũng như một phiên bản cải tiến của phương trình. 6, được thể hiện trong Vật liệu và phương pháp. Rõ ràng, Eq. 6 không phải là một hình thức quyền lực pháp luật đơn giản như mô tả của pháp luật 'Heaps. Chúng ta sẽ thấy rằng pháp luật 'Heaps là một kết quả gần đúng có thể được bắt nguồn từ biểu thức. 6. Trên thực tế, khi là lớn hơn đáng kể so với 1, và; trong khi nếu là nhỏ hơn đáng kể so với 1, và. Kết quả xấp xỉ này có thể được tóm tắt như (7), phù hợp với các kết quả phân tích trước đó [29], [38], [39] và đã bổ sung cho các trường hợp. Mặc dù phương. 6 là khác nhau từ một định luật nghiêm ngặt, kết quả số chỉ ra rằng mối quan hệ giữa và có thể được trang bị tốt bởi các chức năng điện rể (lắp thường là tốt hơn nhiều so với các quan sát thực nghiệm về pháp luật 'Heaps, xem liệu và phương pháp cho một số ví dụ điển hình). Trong hình. 1, chúng tôi báo cáo kết quả bằng số với tổng số cố định của các lần xuất hiện từ đó. Khi là lớn hơn đáng kể hoặc nhỏ hơn 1, kết quả số đồng ý tốt với các giải pháp phân tích được biết đến trong phương. 7, tuy nhiên, một sự sai lệch rõ ràng được quan sát cho (xem Vật liệu và phương pháp về cách để có được kết quả bằng số cho). thumbnail Download: PPT PowerPoint trượt PNG hình ảnh lớn hơn (63KB) TIFF hình ảnh ban đầu (368KB) Hình 1. Mối quan hệ giữa các Heaps 'hội chợ
đang được dịch, vui lòng đợi..