Polymorphisms (SNPs) > haplotypes(Polymorphisms trong cùng một locus mà đi tiêu chí ngưỡng) > kiểu gen(Các Haplotypes vượt qua ngưỡng tiêu chuẩn)6 - sửa chữa, xuất khẩu và tải lại dữ liệu với ngăn xếp (tùy chọn)6A-ngăn xếp - Export_sql.plChương trình này sẽ cho phép để xuất dữ liệu từ cơ sở dữ liệu MySQL vào một tập tin Excel hoặc TSV.Các bộ lọc tương tự có thể truy cập từ các trang web có thể được nhập vào dòng lệnh.6A.1-tạo thư mục "db_export" trong thư mục"stacks_analysis" để đầu ra tệp catalô được tạo ra từ export_sql.pl.export_sql.pl 6A.2-chạy bằng cách sử dụng dòng lệnh (3 chiếc)Để có được một phổ đầy đủ của dữ liệu cho tất cả mẫu, 3 tập tin nên được xuất khẩu: (1) để có được cáchaplotype, (2) để có được số lần đọc một haplotype (3) để có được kiểu gen. Loci tốt nhấtđược sử dụng như dấu hiệu phải tìm thấy trong một đa số con cháu và có chỉ có 1 allele trong cácphụ huynh. Hai loại riêng biệt của các dấu hiệu có thể sử dụng có thể là chiết xuất từ các dữ liệu: (I) kiểu gen AA /--(không liệt kê như là kiểu gen của ngăn xếp) mà tương ứng với haplotypes với 1 allele hiện diện trong 1phụ huynh và khoảng 75% con cháu F2. (II) kiểu gen AA/BB mà tương ứng với 2allele mỗi trình bày trong một phụ huynh khác nhau và khoảng 75% con cháu F2.> cd /usr/local/share/stacks/scripts(1) > export_sql.pl -D db_name_radtags -b 1 - một haplo được viết bởi admin-f /path/to/db_export/db_name_radtags_export_haplo được viết bởi admin-o xls -L 3 -F snps_u = 1 -F alle_u = 2 -F pare_l = 1 -F prog = 50(2) > export_sql.pl -D db_name_radtags -b 1 - một haplo được viết bởi admin-f /path/to/db_export/db_name_radtags_export_haplo_depth được viết bởi admin-o xls -L 3 -F snps_u = 1 -F alle_u = 2 -F pare_l = 1 -F prog = 50 -d(3) > export_sql.pl -D db_name_radtags -b 1 - một geno -f /path/to/db_export/db_name_radtags_export_geno được viết bởi admin-o xls -m GEN - c được viết bởi admin-F snps_u = 1 -F alle_u = 2 -F pare_l = 1 -F prog = 50• D-cơ sở dữ liệu để xuất khẩu từ.• b-hàng loạt các ID của bộ dữ liệu để xuất khẩu.• một — loại dữ liệu để xuất khẩu, 'geno' hay 'haplo', cho kiểu gen hoặc quan sát haplotypes.• f-các tập tin dữ liệu đầu ra (chỉ định tên của tập tin đầu ra mới).• o-loại dữ liệu để xuất khẩu: 'tsv' hoặc 'xls'.• d — Nếu xuất khẩu haplotype, đầu ra chiều sâu của alen thay vì các giá trị allele.• L — nếu xuất khẩu haplotypes, chỉ định một giới hạn độ sâu ngăn xếp.• m — nếu xuất khẩu kiểu gen, chỉ định các loại bản đồ.• c — nếu xuất khẩu kiểu gen, bao gồm hướng dẫn sử dụng sửa chữa được thực hiện trực tuyến.• F-bao gồm bộ lọc định dạng tên = giá_trị.Quan trọng các bộ lọc (nhiều hơn nữa có sẵn trên hướng dẫn ngăn xếp):[-F snps_u = 5]-locus với không quá 5 SNPs.[-F snps_l = 2]-locus với ít nhất 2 SNPs.[-F alle_u = 1]-locus với không quá 1 allele.[-F alle_l = 2]-locus với ít nhất 2 allele.[-F pare_u = 1]-locus hiện diện trong không quá 1 phụ huynh.[-F pare_l = 2]-locus hiện diện trong ít nhất 2 phụ huynh.[-F prog = 50]-rlocus trình bày trong ít nhất 50 con cháu.[-F mark = aa/bb]-xuất khẩu chỉ là một loại đặc biệt đánh dấu.6B-ngăn xếp-kiểu genChương trình genotypes.pl có thể được thực hiện trên các tập tin vào cửa hàng gây ra bởi một denovo_maphoặc một phân tích ref_map. Nó sẽ thực hiện các chỉnh sửa theo tiêu chuẩn mới cho các cuộc gọicủa kiểu gen tại mỗi indiv_locus. Các tiêu chí này được dựa trên chất lượng haplotypes (chủ yếuxác định bởi số lượng các trình tự sáng tác alen mỗi). Nó sẽ tạo ra một danh sách mớiCác đánh dấu mappable trong thư mục chứa các tập tin ban đầu của các cửa hàng(stacks_denovo hoặc stacks_ref) mà có thể là sử dụng sau đó tải lên vào cơ sở dữ liệu mới.denovo_map/ref_map > kiểu gen > load_radtags > index_radtagskiểu gen 6B.1-chạy bằng cách sử dụng dòng lệnh> cd/usr/local/share/ngăn xếp /> kiểu gen -P /path/to/stacks_ref -b 1 - r 50 - m 3 -t GEN - c -s-min_hom_seqs 3--min_het_seqs 0,1# Trong ví dụ này: tối thiểu ngăn xếp chiều sâu của 3 lần đọc + dấu hiệu giới hạn được tìm thấy ở tối thiểu50 con cháu + tối thiểu 3 lần đọc để tạo thành một màu locus + MAF tối thiểu để gọimàu nâng cao để 0,1 (nếu MAF trên locus sẽ là cuộc gọi dị, vì vậy không có nhiều không rõ)• P-đường dẫn đến thư mục chứa các tập tin của các cửa hàng để kiểm tra.• b-lô ID để kiểm tra.• r-số lượng tối thiểu của con cháu phải in một điểm đánh dấu.• ngăn xếp m-tối thiểu chiều sâu để xem xét một locus..• s-đầu ra tập tin cần nhập kết quả vào một cơ sở dữ liệu SQL.• t-bản đồ loại: 'CP', 'DH', 'F2', 'BC1' và 'GEN'. Lưu ý rằng để tải lên đánh dấu trở lại vào cáccơ sở dữ liệu, họ phải loại chung, "GEN".• c-thực hiện các sửa chữa tự động để các dữ liệu.Tự động chỉnh tùy chọn:•--min_hom_seqs [số] — tối thiểu số lần đọc để gọi một kiểu gen màu(mặc định 5).•--min_het_seqs [số] — Nếu MAF dưới đây, locus được gọi là màu (mặc định 0,05).•--max_het_seqs [số] — Nếu MAF trên đây, locus được gọi là hổ (mặc định 0.1).MAF = nhỏ Allele tần số = nb nhỏ alen / nb lớn allele. Lưu ý rằng nếu MAFlà giữa min_het_seqs và max_het_seqs, locus được gọi là không rõ.Bộ lọc tùy chọn:•--lnl_lim [số] — lọc loci với giá trị khả năng đăng nhập dưới ngưỡng này.6B.2 – tải danh sách đánh dấu mới vào cơ sở dữ liệu> cd /usr/local/share/stacks/scripts> load_radtags.pl -p/path/to/stacks_ref / -D db _name_radtags -b 2 -e "Ref bản đồ mớiKiểu gen"- c -B• p-đường dẫn đến nhập tệp catalô• D-cơ sở dữ liệu tên.• b-lô của bạn.• e-cửa hàng mô tả.• c-tải các cửa hàng vào cơ sở dữ liệu.• B-tải thông tin lô bàn.6B.3-chỉ số cơ sở dữ liệu> cd /usr/local/share/stacks/scripts> index_radtags.pl -D db_name_radtags - c• c-tạo mục danh mục• D-cơ sở dữ liệu tên6c-ngăn xếp-rxstacksKhi trình tự lỗi là hiện nay tại một trang web cụ thể, nó có thể được khó khăn để phân biệt mộtThứ hai allele từ lỗi. Tuy nhiên, bằng cách nhìn vào cùng một trang nucleotide trên mộtdân số cá nhân là dễ dàng hơn nhiều để cho biết nếu một lỗi được trình bày. Chương trình RXstacksChính xác genotypse và haplotypes dựa trên dân toàn kiểm tra. RXstacks có thểthực hiện sau khi phân tích denovo_map hoặc ref_map. Sửa chữa dữ liệu được sử dụng để tạo ra mộtcác cửa hàng mới của các dấu hiệu bằng cách sử dụng Cstacks > Sstacks và sau đó nạp vào cơ sở dữ liệu mới.Denovo_map/Ref_map > RXstacks > Cstacks > Sstacks > load_radtags > index_radtags6c.1-tạo thư mục "stacks_denovo_corr" trong thư mục"stacks_analysis" với sản lượng các tập tin vào cửa hàng sửa chữa được tạo ra từ rxstacks.rxstacks 6c.2 – chạy từ dòng lệnh> cd /usr/local/share/stacks> rxstacks -b 1 -t 15 - P/path/to/stacks_denovo / -o/path/to/stacks_denovo_corr / --prune_haplo--model_type bao bọc --lnl_lim-10.0--conf_lim 0,5· b-lô ID để kiểm tra khi xuất khẩu từ các cửa hàng.· P-các đường dẫn đến tập tin đầu ra denovo_map/ref_map.· o-đầu ra đường dẫn đến viết kết quả.· t-số của chủ đề để chạy trong song song phần của mã.Quan trọng các bộ lọc (nhiều hơn nữa có sẵn trên hướng dẫn ngăn xếp):[-prune_haplo] Cắt tỉa Haplotype: chương trình rxstacks sẽ loại bỏ dư thừa củahaplotypes từ cá nhân loci theo của phổ biến trong dân số. Một ngưỡngcó thể được xác định bằng cách sử dụng [-max_haplo].[--model_type bao bọc] Trình tự lỗi được loại bỏ bằng cách sử dụng các SNP bị chặnMô hình và SNPs đang nhớ lại. RXstacks sử dụng các cửa hàng để xem xét alen cho một đặc biệtnucleotide position in the population, filter out putative sequencing errors in each individualand finally recall the nucleotide position as a heterozygote or homozygote using the boundedSNP model. –model_type [type] can be either ‘snp’ (default), ‘bounded’ or ‘fixed’.[--lnl_lim -10.0] Catalog loci with an average log likelihood below -10.0 will beremoved. A log likelihood is assign for each stacks (by Ustacks or Pstacks) based on depthof coverage (number of reads) and presence of sequencing errors. Good log likelihoods areclose to zero, bad log likelihoods are highly negative. A log likelihood limit can be set in therxstacks program to remove loci that have a log likelihood below the threshold. To helpdetermining the threshold, the set of mean log likelihoods for each catalog locus can beprinted using RXstacks by specifying the [--lnl_dist] parameter (which will create thebatch_X.rxstacks_lnls.tsv file in the output directory).[--conf_lim 0.5] Any catalog locus in which 50% or more individuals have aconfounded match to the catalog will be removed. For each catalog in the locus, we expecteach individual in the analysis to have a single, matching locus. When multiple loci from anindividual match a single catalog locus, we refer to the locus as confounded. These loci aretypically composed of repetitive sequence. By giving a percentage limit of confoundedindividuals for each catalog locus, the program will remove the loci that exceed this limit.6c.3- Redoing the catalog (Cstacks, Sstacks)> cd /usr/local/share/stacks> cstacks -b 1 -n 3 -p 15 -o /path/to/stacks_denovo_corr -s /path/to/stacks_denovo_corr/parent1 -s /path/to/stacks_denovo_corr/parent2 -s /path/to/stacks_denovo_corr/progeny1 -s /path/to/stacks_denovo_corr/progeny2 …… enter all samples......• b ! — batch.!ID• s! — TSV!file!from!which!to!load!radtags.!• o! — output!path!to!write!results.!• n! — number!of!mismatches!allowed!between!sample!tags!when!generating!the!catalog.• P! – enable!parallel!execution!with!num_threads> cd /usr/local/share/stacks> sstacks -b 1 -p 15-c ./path/to/stacks_denovo_corr/batch_1 -o /path/to/stacks_denovo_corr -s /path/to/stacks_denovo_corr/parent1 -s /path/to/stacks_denovo_corr/parent2 -s /path/to/stacks_denovo_corr/progeny1 -s /path/to/stacks_denovo_corr/progeny2 …… enter all samples......• b! — MySQL!ID!of!this!batch.!• c! — TSV!file!from!which!to!load!the!catalog!RADFTags.!• s! — TSV!file!from!which!to!load!sample!RADFTags.!• o! — output!path!to!write!results.• P! – enable!parallel! execution!with!num_threads6c.4- Loading and Indexing the database
đang được dịch, vui lòng đợi..
