کنترل کیفیت و آماده کردن دیتاهای NGS

ارزیابی کیفیت اولین مرحله در مسیر بیوانفورماتیک RNA-seq می باشد. اغلب، برای فیلتر کردن داده، حذف توالی با کیفیت پایین و یا بازها (پیرایش)، آداپتورها ، آلودگی ها ، overrepresented و یا تصحیح اشتباهات و برای اطمینان از داشتن نتیجه نهایی دقیق ، لازم است.

 

ارزیابی کیفیت اولین مرحله در مسیر بیوانفورماتیک RNA-seq می باشد. اغلب، برای فیلتر کردن داده، حذف توالی با کیفیت پایین و یا بازها (پیرایش)، آداپتورها ، آلودگی ها ، overrepresented و یا تصحیح اشتباهات و برای اطمینان از داشتن نتیجه نهایی دقیق ، لازم است.

 (2-1) معرفی ابزار های کنترل کیفیت Quality control

پکیج dupRadar  : یک پکیج R برای کنترل کیفیت و انالیز میزان Duplication برای دیتا های RNA-seq

ابزار FastQC : ابزار جامعی برای کنترل کیفیت دیتا های NGS بر پایه جاوا .  نسخه ویندوز لینوکس و مک موجود می باشد. فرمت فایل های ورودی میتواند BAM, SAM و FASTQ باشد

ابزار RNA-SeQC : ابزار کنترل کیفیت دیتا های RNA-seq که بر پایه جاوا می باشد. ورودی نرم فزار یک یا چند فایل BAM می باشد

  (2-2) حذف اداپتور ها و فیلتر کردن

ابزار Trimmomatic : نرم افزار بر پایه جاوا که برروی هر دو نوع (single or pair-ended) فایل های fastq عمل Trimming و حذف اداپتور ها را انجام می دهد

ابزار clean_reads : ابزاری برای تمیز کردن دیتا های NGS  . حذف نواحی با کیفیت پایین، اداپتور ها و..

ابزار cutadapt :  ابزاری برای حذف اداپتور ها از  دیتا های NGS  

ابزار FASTX : بسته نرمافزاری جهت تبدیل فرمت FASTQ به FASTA ، دریافت اطلاعات کیفیت فایل و حذف و فیلتر کردن باز ها و توالی ها

پکیج ShortRead :  یک پکیج R برای کنترل کیفیت دیتا ها و دستکاری و فیلتر کردن آن ها می باشد.

    آزمایشگاه بیوانفورماتیک پارس سیلیکو

NGS