Xếp chồng các bước của bước(Để sử dụng cùng với hướng dẫn sử dụng ngăn xếp có sẵn tạihttp://creskolab.uoregon.edu/Stacks/Manual/)0-đầu vào, đầu ra và phần mềmĐóng góp:-tập tin có chứa các chuỗi radtags ở định dạng fastq (raw_seq.fq)-Tệp chứa danh sách các trình tự mã vạch của cùng một chiều dài (barcode8nt.txt)-Các tập tin có chứa chuỗi bộ gen (genome.fa; ref_map phân tích chỉ)Đầu ra: Tạo ra một thư mục, ví dụ: "stacks_analysis", mà sẽ bao gồm tất cả trong tương laiđầu ra thư mục và tập tin.Phần mềm: Ngăn xếp chạy có thể yêu cầu việc sử dụng các chương trình khác chẳng hạn như FastQC, mySQL,Bowtie và Samtools.1 - FastQC: để kiểm tra chất lượng trình tự (tùy chọn)FastQC sẽ cho phép để hình dung chất lượng lần đọc và xác định việc cắt giảm tắt (= chiều dài tạimà lần đọc các nên được trimmed).1.1 quản FastQC từ dòng lệnh> /home/bmb/Analysis_Tools/FastQC/fastqc1.2 - mở tập tin raw_seq.fq trong FastQC giao diện để bắt đầu phân tích.>>>> Ví dụ với MungBean:Số liệu thống kê "một nội dung cơ sở chuỗi" cho thấy rằng các thành phần cơ bản (A, T, Choặc G) tại điểm khác nhau có vẻ ngẫu nhiên một cách chính xác cho đến vị trí 70.Số liệu thống kê "mỗi chuỗi cơ sở chất lượng" cho thấy rằng số điểm chất lượng trung bình trênTất cả các căn cứ của các lần đọc bắt đầu giảm sau khi vị trí 40. Trong các căn cứ đầu tiên 70, số điểmở lại cao (> 28, trong khu vực màu xanh lá cây) 90% của lần đọc (thấp hơn thác).Trong đó, cho dữ liệu chất lượng tối đa các chuỗi nên được tỉa lúc về70nt (bao gồm cả mã vạch)2 - ngăn xếp - process_radtags - để làm sạch các dữ liệu thô (đọc đơn-kết thúc)process_radtags sẽ lọc lần đọc (theo chất lượng, mã vạch và hạn chế của họTrang web), tập hợp lần đọc bởi mã vạch (1 tập tin cho mỗi), mã vạch cắt và cắt lần đọc để mong muốnchiều dài.2.1 - tạo thư mục "mẫu" trong thư mục "stacks_analysis" để đầu racác tập tin trình tự của tất cả mẫu (cha mẹ + con cháu)2.2 do process_radtags bằng cách sử dụng dòng lệnh> cd /path/to/stacks> process_radtags -f /path/to/raw_seq.fq -o /path/to/stacks_analysis/samples -b/Path/to/barcode8nt.txt -e apeKI -s 20 -t 62 - c - q - r -D• f-đường dẫn đến tập tin đầu vào nếu (single-end đoạn). Sử dụng "-p" nếu nhiều tập tin trong mộtthư mục.• o-đường dẫn đến sản lượng các tập tin xử lý.• b-đường dẫn đến một tập tin có chứa các mã vạch cho dài này. Một tập tin cho mỗi chiều dài mã vạch, một chạycho mỗi file.• e-tên enzyme được sử dụng để làm cho thư viện radtags• s-tập trung bình điểm giới hạn (của Phred giá trị) trong vòng một cửa sổ trượt chiều dài mà làxác định bằng các cờ "-w" (mặc định w = 0,15, s = 10).• t-truncate cuối cùng đọc các chiều dài để giá trị này (theo dữ liệu FastQC).• c-loại bỏ bất kỳ đọc với một cơ sở chưa bôi ("N").• q-loại bỏ các lần đọc có chất lượng thấp điểm (theo giá trị của Phred).• r-cứu mã vạch và RAD-Tags (chính xác mã vạch và hạn chế enzyme trang web).• D — nắm bắt các lần đọc bị loại bỏ vào một tập tin (hữu ích nếu xử lý nhiều file mã vạch).Khi sử dụng nhiều danh sách có chứa chiều dài của mã vạch khác nhau, sử dụng đọc bị loại bỏ từprocess_radtags danh sách mã vạch đầu tiên (raw_seq.fq.discards) để thực hiện phân tích củaThứ hai, và như vậy. Bắt đầu process_radtags bằng cách sử dụng mã vạch dài nhất và kết thúc với cácnhỏ nhất.Ví dụ: > process_radtags được viết bởi admin-f /path/to/raw_seq.fq được viết bởi admin-o /path/to/stacks_analysis/samples được viết bởi admin/path/to/barcode8nt.txt -b được viết bởi admin-e apeKI -s 20 -t 62 - c - q-D> process_radtags được viết bởi admin-f /path/to/stacks_analysis/samples/raw_seq.fq.discards.fq được viết bởi admin-o /path/to/stacks_analysis/samples được viết bởi admin/path/to/barcode6nt.txt -b được viết bởi admin-e apeKI -s 20 -t 62 - c - q-D>>>> Ví dụ bằng cách sử dụng MungBean:Tùy chọn "-r" đã giúp để giải cứu một thêm 10% của các chuỗi tất cả bởicho phép các chỉnh sửa của mismatches trong mã vạch.Khi sử dụng nhiều mã vạch tập tin. Khoảng cùng một chuỗi được giữ lại khisử dụng nguyên seq hoặc seq bị loại bỏ như là đầu vào. Điều này tuy nhiên ít đúng cho nhỏ hơnmã vạch mà việc sử dụng các loại bỏ trình tự như đầu vào có vẻ để cải thiện dữ liệu đặc trưng(ví dụ: "GATT" nhóm hiện tại 50% ít giữ lại trình tự khi sử dụng trình tự huỷnhư là đầu vào so sánh với các chuỗi nguyên như đầu vào). Ngăn xếp hiệu quả phân biệt giữamã vạch khác nhau đối với chiều dài và trình tự của họ. Tuy nhiên, sử dụng các bị loại bỏseq như đầu vào trình bày lợi thế là nhanh hơn (xử lý) và tránh sự hiện diện củaquá trình tự trong nhóm "Chuỗi không ghi lại".Để tăng giảm hợp trình tự lỗi, giảm kích thước cửa sổ trượt (w),đọc chiều dài (t) hoặc tăng là điểm giới hạn trong cửa sổ (s). trong ví dụ trung bìnhđiểm chất lượng là 20 và kích thước cửa sổ là [0,15 x t (93)] = 14 nucleotide. Điều này có nghĩa là nếuđiểm trung bình trong một cửa sổ 15nt dài giảm xuống dưới 99% của các xác suất đượcchính xác, đọc được bỏ đi.Phred chất lượng được điểm xác suất không chính xác cơ sở gọi căn cứ gọi chính xác10 1 trong 10 90%20 1 trong 100 99%30 1 trong 1000 99,9%3 - mySQL cơ sở dữ liệu: để hình dung dữ liệu trong giao diện webCơ sở dữ liệu mySQL như được tạo trước khi chạy denovo_map hoặc ref_map, đểthu thập dữ liệu.3.1 - tạo một cơ sở dữ liệu mySQL> sudo su> [sudo] mật khẩu cho bmb: # nhập "VA903m"> mysql -p> Nhập mật khẩu: # nhập "gốc"> mysql > tạo cơ sở dữ liệu db_name_radtags; #Always sử dụng cùng một hậu tố "_radtags"3.2 - tạo một nội dung bảng và lĩnh vực trong cơ sở dữ liệu mySQL mới> mysql > sử dụng db_name_radtags;> mysql > tạo bảng lô ()………………);kịch bản (trong màu xanh lá cây) được sao chép từ tập tin "stacks.sql" và dán trong cửa sổ thiết bị đầu cuối.> mysql > q hoặc thoát4 - tạo một danh mục của các dấu hiệu với ngăn xếpBằng cách sử dụng denovo_map hoặc ref_map, ngăn xếp sẽ tạo ra một cửa hàng của tiềm năng alen và locimà có thể được tìm thấy ở các bậc cha mẹ và một số các con cháu. Chương trình sẽ tạo ra mộtloạt các tập tin: cho mỗi mẫu: sample1.alleles|matches|snps|tags.tsv; và cho toàn bộdân số: batch.catalog.alleles|snps|tags.tsv, batch.genotypes.txt, batch.haplotypes.tsv,Batch.Markers.tsv. những tập tin này có thể là sử dụng như vậy hoặc là tải lên thành một cơ sở dữ liệu MySQL chodễ dàng hơn phân tích bằng cách sử dụng giao diện web.4A-ngăn xếp - denovo_map (không có trình tự bộ gen)Chương trình sẽ chạy một loạt các thành phần ngăn xếp (Ustacks > Cstacks > Sstacks >kiểu gen > load_radtags.pl > index_radtags.pl > kiểu gen) để tạo ra mộtdanh mục của loci và alen (SNPs). Trong sự vắng mặt của chuỗi bộ gen để sắp xếp các radtagstrình tự, ngăn xếp của lần đọc được tạo ra dựa trên của chiều sâu của bảo hiểm (sốlần đọc giống hệt nhau) và kết hợp để tạo ra loci dựa trên của chuỗi tương tự. Dữ liệu có thểlà xem thông qua giao diện web mySQL hoặc xuất khẩu ở định dạng tsv hoặc xls.4A.1-tạo thư mục "stacks_denovo" trong thư mục"stacks_analysis" để đầu ra tệp catalô được tạo ra từ phân tích denovo.denovo_map.pl 4A.2A-chạy bằng cách sử dụng dòng lệnh> cd /usr/local/share/stacks/scripts> denovo_map.pl -m 3 - M 1 - n 1 -T 15 -B db_name_radtags -b 1 -A F2 -t được viết bởi admin-D "Denovo bản đồ" được viết bởi admin-o /path/to/stacks_analysis/stacks_denovo được viết bởi admin-p /path/to/stacks_analysis/samples/parent1.fq được viết bởi admin-p /path/to/stacks_analysis/samples/parent2.fq được viết bởi admin-r /path/to/stacks_analysis/samples/progeny1.fq được viết bởi admin-r /path/to/stacks_analysis/samples/progeny2.fq được viết bởi admin-r /path/to/stacks_analysis/samples/progeny3.fq được viết bởi admin... nhập tất cả mẫu...• m — tối thiểu số lần đọc nguyên cần thiết để tạo ra một ngăn xếp trong vòng một cá nhân vàtạo ra indiv_alleles (mặc định giá trị = 3). Mô tả như là độ sâu tối thiểu bảo hiểm, cáctùy chọn là cần thiết để xác định mức độ stringency. Các giá trị cao hơn của m sẽ bảo đảm rằng íttrình tự lỗi sẽ bị coi là đa hình, nhưng cũng sẽ làm giảm tổng sốđánh dấu được xác định.• M-số lượng tối đa của mismatches giữa các ngăn xếp để tạo thành một haplotype trong vòng mộtcá nhân và xây dựng indiv_loci (mặc định giá trị = 2). Nó có thể được xem như là số lượng SNPscho phép một locus trong cùng một cá nhân. Việc tăng [M] sẽ tăng số lượng alenvà heterozygote loci.• n-số lượng tối đa của mismatches giữa bất kỳ hai haplotypes (loci) trong cácdân để xây dựng danh mục-loci (mặc định giá trị = 0). Nếu [n] > 0, sự đồng thuận chuỗi từQuỹ tích mỗi sẽ được sử dụng để cố gắng hợp nhất chúng lại với nhau trên mẫu. Vì vậy, nếulocus A từ cha mẹ 1 là màu và locus B từ cha mẹ 2 cũng là màu, nhưnghọ là X nucleotide ngoài, [n] sẽ quản cho dù họ sẽ được hợp nhất khi xây dựng cácdanh mục. Để có được thêm AAxBB đánh dấu, tăng [n]. Tất nhiên như là một bên có hiệu lực khi [n]tăng, nhiều hơn về thể chất riêng biệt loci sẽ sáp nhập sai lầm.• N-chỉ định số mismatches được cho phép khi việc xếp thẳng lần đọc thứ cấp đểngăn xếp chính (mặc định giá trị = M + 2). Điều này là chạy thứ hai của liên kết. Các mismatchesở đây sẽ không tính là đa hình nhưng sẽ được chỉ đơn giản là bỏ qua, vì vậy, về cơ bản nó sẽ chỉtăng độ sâu ngăn xếp. Lưu ý rằng giải cứu này lần đọc có thể có tác động tiêu cực bởitạo ra một biến thể trong locus và incertitude vào locus là màu hoặchổ.• T-số của chủ đề hoặc lõi để chạy ngăn xếp trên.• t-loại bỏ hoặc chia tay, lặp đi lặp lại rất RAD-Tags.• B-tên của cơ sở dữ liệu mySQL để tải dữ liệu vào.• b-batch ID đại diện cho số liệu này (phải là một số). Ngăn xếp có thể được chạy nhiều lầntrên cùng một bộ dữ liệu và kết quả sẽ được thêm vào cơ sở dữ liệu tương tự bằng cách xác địnhkhác nhau lô ID. Nếu sử dụng một đã tồn tại hàng loạt ID, dữ liệu sẽ không xóa cácquý giá dữ liệu trình bày trong lô này nhưng sẽ được thêm vào chúng).• D — hàng loạt các mô tả.• H — vô hiệu hoá bản đồ của lần đọc thứ cấp.• Một — nếu xử lý bản đồ di truyền, chỉ định các loại chéo, 'CP' (qua Pollinated = F1 chéo),'F2' (F2 chéo, với F0 gửi như là cha mẹ), 'BC1' (backcross F1x cha mẹ), 'DH'(Tăng gấp đôi Haploids), hoặc 'GEN' (chung, để có được một danh sách tất cả có thể đánh dấu independently củaloại chéo). Chương trình sẽ ném ra alen có thể không xảy ra trong các quy định vượt qualoại tình huống (Ex.1: trong một F2 qua, chúng tôi có thể có AA/BB đánh dấu fr
đang được dịch, vui lòng đợi..
