آیا دعوا بر سر توالی یابی با خوانش های بلند پایان یافته است؟

از اشتیاق من به توالی یابی نانوحفره (nanopore) مطلع هستید. ما تعدادی نرم افزار برای کار کردن با داده های آن داریم. ما یک بودجه ی پژوهشی برای این کار را دریافت کردیم و یک ژنوم باکتریایی بسیار مشکل را با موفقیت اسمبل کردیم. این موارد باعث شد تا من یک مقاله برای Nature Methods بنویسیم. بنابراین مقداری طرفداری نسبت به MinION از سوی من وجود دارد.


با MinION که اینقدر انقلابی و شگفت آور بود ما در هر run نزدیک 100 Mb را توالی یابی می کردیم! یک تکنولوژی بسیار حیرت آور، یک توالی یاب سیار، قابلیت tricorder، که محصول یک مهندسی غیر قابل باور است. اما 100 Mb نمی تواند دنیا را تغییر دهد. برای بعضی اهداف مفید است، اما برای اهداف دیگر نیاز به داده های بیشتری داریم.
در عین حال از اینکه PacBio برای معرفی Sequel اعلان عمومی داده است، واقعا هیجان زده هستم.
خب به Sequel بپردازیم.
ظاهرا معلوم شده است که Sequel به قول هایی که داده بود عمل نکرده است. بجای run های ده گیگا بازی، استفاده کنندگان بین 3 تا 5 گیگا باز را از Sequel بدست آورده اند.
در همین حال MinION با توپ پر به میدان آمده است: رسیدن به سطح توالی یابی 5-10 گیگاباز در هر run !!!
در همین حال که ما در مورد ادعاهای ONT درباره ی توالی یاب شان مشکوک هستیم، افراد دیگری که از MinION استفاده کردند این ادعاها را تایید کرده اند و گفته اند که نمودارهایی شبیه به این را بدست آورده اند. اگر باور نمی کنید، به این آدرس بروید و اولین داده های انسانی توالی یابی نانوحفره در جهان را ببینید:
https://goo.gl/G21hsi
همچنین PacBio هم مقداری داده ی بدست امده از Sequel را در اینجا قرار داده است:

https://goo.gl/6KEw0f

بیایید این دو را با هم مقایسه کنیم. فعلا کاری با دقت نداریم. اما می توانیم نگاهی به readها، read length و توان عملیاتی بیندازیم. ما این دسته داده ها را با هم مقایسه کردیم:

https://goo.gl/1n94fO

https://goo.gl/dPRhR4

https://goo.gl/GnoZFr

هیستوگرام طول های خوانده شده :

 

minion vs pacbio1
همانطوری که می بینید read های بلند تر در هر دو نمودار تقریبا طول برابری دارند، اما MinION در میان readهای کوتاه، تعداد بسیار بیشتری read دارد. من می دانم که نمونه های PacBio روی Blue Pippin از نظر اندازه غربال می شوند، اما در مورد داده های MinION مطمئن نیستم.
مجموعه داده ی MinION دربرگیرنده ی 466,325 است یعنی بیش از دو برابر تعدادی که مجموعه داده ی Sequel با 208,573 عدد read دارد.
در رابطه با توان عملیاتی، MinION دوباره بالاتر است، با 2.4Gbase داده در مقایسه با فقط 2Gbase برای Sequel.
می توانیم برای readها محدودیت >1000 bp بگذاریم و کمی دقیقتر نگاه کنیم:(تصویر 2 )
• داده های MinION دارای 326,466 عدد read بالاتر از 1000 bp است با مجموع 2.3Gb.
• داده های Sequel دارای 192,718 عدد read بالاتر از 1000 bp است با مجموع 2Gb.
در نهایت، برای READهای بالای 10000 bp:
• داده های MinION دارای 84,803 عدد read بالاتر از 10000 bp است با مجموع 1.36Gb.
• داده های Sequel دارای 83,771 عدد read بالاتر از 10000 bp است با مجموع 1.48Gb.
اینها امارهای بسیار جالبی هستند.
این خبر بدی برای PacBio است. اگر شما قیمت های پایین تر MinION ، و قیمت 300 هزار یورویی Sequel را هم به موارد بالا بیفزایید، این حقیقت که MinION عملکردی با همان کیفیت Sequel دارد،بسیار جالب توجه است. هر دو دستگاه راه درازی را پیش رو دارند. PacBio به نقشه راهش تاکید می کند، برنامه ریزی برای readهای طویل تر و بهبود بخش شیمیایی و flowcells.
در مقابل، ONT به گسترش باورنکردنی مسیر MinION، افزایش سرعت توالی یابی و flowcell های بزرگتر اشاره می کند. و در ادامه PromethION را معرفی خواهد کرد.
پس آیا جنگ تمام شده است؟ نه هنوز! اما PacBio برای بقا می جنگد!

نویسنده : دکتر مایک واتسون