بيت سمعي لماذا hadoop هي مباراة مثالية لتسلسل الجينوم

لماذا hadoop هي مباراة مثالية لتسلسل الجينوم

جدول المحتويات:

Anonim

علم الجينوم السريري هو موضوع رائع ، حيث يعمل الناس على التقنيات الحديثة لمعالجة نتائج سريعة ودقيقة. هناك الكثير من متسلسلات الجينوم المتاحة في السوق ، وهم ينتجون بايتات من بيانات التسلسل ، وسيؤدي النمو في التسلسل إلى إنتاج إكسبايتات من البيانات في المستقبل القريب. هنا ، Hadoop هي المنصة المثالية لمعالجة تدفق عمل الجينوميات المعقدة. يمكن Hadoop تخزين وفرز كميات هائلة من المعلومات ويمكن أيضا تقديم تحليل هادف. (للحصول على فكرة حول مقدار البيانات التي يستلزمها هذا حقًا ، اقرأ فهم البتات والبايت ومضاعفاتها.)

حاضر ومستقبل الجينوم

اليوم ، وصل رسم خرائط الجينوم ذروته في التنمية. كثير من الأشخاص المرتبطين بصناعة الجينوم يكتظون بالفضول ، وبما أن الفرص الجديدة تقدم أنفسهم ، فإن التكنولوجيا الأفضل هي حاجة الساعة. تسلسل الجينوم هو مهمة متكررة للغاية وكثيفة الموارد. في عام 2013 وحده ، تم إنتاج حوالي 15 بيتابايت من البيانات ، وفقط 2000 جهاز تسلسل. تضمن مقدار إسقاط الفك 300 كيلوبايت من بيانات الجينوم البشري المتسلسل. على هذا المعدل لإنتاج البيانات ، يمكن تقدير أنه بحلول عام 2018 ، سيتم إنتاج حوالي واحد بايت من البيانات. سيكون هذا بسبب نمو أجهزة التسلسل ، والتي ستنتج المزيد والمزيد من البيانات لكل تشغيل. سبب آخر هو ظهور آلات تسلسل الجينوم قوية للغاية ومنخفضة التكلفة. منذ عام 2008 ، انخفض سعر هذه الآلات بشكل مطرد. هذا بسبب آلات الجيل التالي القوية التي دخلت السوق.

احتياجات صناعة رسم الخرائط الجينومية

تستخدم الخوارزميات المعقدة لمعالجة البيانات التي يتم جمعها من الجينوم البشري. ثم ، يجب تخزين هذه المعلومات. قد تتم مراجعته في المستقبل للمقارنة مع البيانات الأصلية. مهمة معالجة وتخزين 100 غيغابايت من البيانات ليست صعبة للغاية ، لا سيما عندما تفعل ذلك مع الآلات القوية المستخدمة في مراكز التسلسل. تشير الدراسات إلى أن هذه الكمية من البيانات يمكن معالجتها في حوالي 1000 ساعة من وحدة المعالجة المركزية ، لذلك فهي سهلة للغاية. على هذا المعدل من التقدم التقني ، من الواضح أن صناعة الجينوم ستقوم قريباً بمعالجة آلاف الجيجابايت في ثوان معدودة.

لماذا hadoop هي مباراة مثالية لتسلسل الجينوم