بواسطة Techopedia Staff ، 8 يونيو 2016
الوجبات الجاهزة: يناقش المضيف إريك كافانوغ الابتكارات في تكنولوجيا قواعد البيانات مع الخبراء ديز بلانشفيلد وروبن بلور وبيرت سكالزو.
أنت لم تسجل الدخول حاليًا. يرجى تسجيل الدخول أو التسجيل لمشاهدة الفيديو.
إريك كافانا: سيداتي وسادتي ، إنه الأربعاء ، الساعة الرابعة بالتوقيت الشرقي. أنا في نيو أورليانز ، الصيف قادم ، وهذا يعني أن الجو حار! حان الوقت لتكنولوجيات Hot ، نعم بالفعل ، نعم بالفعل. اسمي إريك كافانا ، سأكون مضيفك. انا ذاهب لركل الكرة هنا لتكنولوجيا Hot. الموضوع اليوم هو "الزخم الأمامي: الانتقال إلى ما وراء التقليدية". الناس ، لدينا ثلاثة خبراء في قاعدة البيانات على الهاتف اليوم ، لذلك أي أسئلة لديك ، وإرسالها لهم من الصعب ، لا تخجل. لدينا مجموعة من المحتوى الجيد اصطف لك اليوم. هناك بقعة لك حقا ، بما فيه الكفاية عني. بالطبع ، هذا العام حار. نتحدث عن التقنيات الساخنة في هذا المعرض ، وهي شراكة مع أصدقائنا من Techopedia. ونحن نمضي على طول الطريق حتى تأسيس إدارة المعلومات اليوم ، والتي هي بالطبع قاعدة البيانات. سوف نتحدث عن كيف وصلنا إلى هنا ، وما يحدث اليوم ، وما يحدث في المستقبل. الكثير من الأشياء المثيرة للاهتمام للغاية يحدث.
من الواضح أن لدينا بعض الابتكار الجاد في مساحة قاعدة البيانات. كان نوعًا من الهدوء لفترة من الوقت. إذا كنت تتحدث مع بعض المحللين في مجال الأعمال ، فأنا سأقول على الأرجح من عام مثل ، 2005 إلى 2009 أو '10 ، لا يبدو أنه كان هناك الكثير مما يحدث من حيث الابتكار. وفجأة اندلعت للتو ، مثل الهروب من السجن أو أي شيء ، والآن هناك كل أنواع الأشياء المثيرة التي تحدث. يرجع الكثير من ذلك إلى حجم الويب ، وجميع خصائص الويب الرائعة التي تقوم بأشياء مختلفة ومثيرة للاهتمام. من هنا جاء مفهوم NoSQL. وهذا يعني شيئين مختلفين: هذا يعني عدم وجود SQL ، لأنه لا يدعم SQL ، بل يعني أيضًا SQL فقط. هناك مصطلح "NewSQL" استخدمه بعض الأشخاص. لكن من الواضح أن SQL - لغة الاستعلامات الهيكلية - هي في الحقيقة الأساس ، إنها قاعدة الاستفسار.
ومن المثير للاهتمام أن كل هذه المحركات NoSQL ، ماذا حدث؟ حسنًا ، لقد خرجوا ، وكان هناك الكثير من الإثارة حول هذا الموضوع ، وبعد ذلك بسنوات قليلة ، ماذا بدأنا جميعًا في السماع؟ أوه ، SQL على Hadoop. حسنًا ، بدأت جميع هذه الشركات في فرض واجهات SQL على أدوات NoSQL الخاصة بها ، ويعرف أي شخص في عالم البرمجة أن هذا سيؤدي إلى بعض التحديات وبعض الصعوبات ، وبعض الأسلاك المتقاطعة وما إلى ذلك. لذلك سنكتشف الكثير من هذه الأشياء اليوم.
يوجد ثلاثة من مقدمي العروض: تلقينا دعوة من Dez Blanchfield من سيدني ، وروبن بلور الخاص بنا الموجود في تكساس ، وكذلك بيرت سكالزو ، وهو في تكساس أيضًا. لذلك ، بادئ ذي بدء ، سوف نسمع من Dez Blanchfield. الناس ، سنغرد على علامة التجزئة #HotTech ، لذلك لا تتردد في إرسال تعليقاتك ، أو إرسال أسئلتك من خلال عنصر الأسئلة والأجوبة في وحدة التحكم في البث الشبكي ، أو حتى من خلال نافذة الدردشة. ومع ذلك ، ديز بلانشفيلد ، خذها بعيدا.
ديز بلانشفيلد: شكرًا ، إيريك. مرحباً بالجميع. لذلك سأحاول إعداد المشهد من وجهة نظر 30،000 قدم من نوع ما حدث في العقد الماضي ، والتحولات المهمة التي شهدناها - أو على الأقل عقد ونصف العقد على أي حال - من أنظمة إدارة قواعد البيانات ، وبعض التأثيرات من وجهة نظر تجارية أو تقنية ، وبعض الاتجاهات التي تحملناها في وقت متأخر ، وتقودنا إلى المحادثة التي نوشك أن نجريها اليوم حول الموضوع.
صورة الغلاف الخاصة بي هنا هي كثبان رملية ، وهناك ريح تهب قطعًا صغيرة صغيرة من الرمال أعلىها. ونتيجة لذلك ، ما يحدث هو أن الكثبان الرملية تسير ببطء من مكان إلى آخر. إنها ظاهرة مدهشة ، حيث تتحرك هذه الجبال الضخمة الضخمة التي يتراوح ارتفاعها بين 40 و 50 قدمًا بشكل فعال. وهم يتحركون ببطء شديد ، لكنهم يتحركون بثبات ، وبينما يتحركون ، يغيرون المشهد. وهو شيء يجب مراقبته إذا كنت تقضي أي وقت على الإطلاق في منطقة تعد الكثبان الرملية فيها أمرًا طبيعيًا. نظرًا لأنك تستطيع أن تنظر إلى النافذة في يوم من الأيام ، وتدرك أن هذا الجبل الضخم من الرمال ، تحركت حبيبات صغيرة صغيرة من تلقاء نفسها ، وأن الريح تنقلها ببطء من مكان إلى آخر.
وأعتقد من نواح كثيرة أن هذا هو عالم أنظمة قواعد البيانات لبعض الوقت. حتى وقت قريب جدًا ، كان هذا التحول الصغير جدًا في شكل حبيبات رملية يحرك جبلًا كبيرًا من الرمال على شكل كثيب رملي. ظهرت بعض التحولات في منصات قواعد البيانات على مر السنين ، وكانت بيئة مستقرة إلى حد ما ومتينة حول أنظمة ومنصات قواعد البيانات ، من خلال الإطار الرئيسي للعصر المتوسط المدى. ولكن في الآونة الأخيرة ، كان لدينا بعض الأشياء المهمة إلى حد ما تحدث لاحتياجاتنا التجارية والسائقين الفنية لدينا. انا ذاهب الى المشي لنا من خلال هؤلاء.
لدي رأي مفاده أن المفهوم الأساسي لقاعدة البيانات ، كما عرفناها لسنوات عديدة ، وكما قد تكون سمعت في المزاح السابق للعرض ، فإن خبرائنا اللذين كانا على اتصال معي اليوم أمضينا فترة حياة في هذا الفضاء وهم محقون في مشاركة حقوق المفاخرة للوجود عندما بدأ كل شيء في أوائل الثمانينيات. لكننا رأينا هذا التحول الهائل في العقد الماضي وقليلا ، وسأقوم بمتابعتنا بسرعة قبل تسليمها إلى الدكتور روبن بلور.
لقد مررنا بهذا ما أسميه "تجربة أكبر وأفضل وأسرع وأرخص". كما قلت ، لقد تغير تعريف قاعدة البيانات. المناظر الطبيعية التي كان على منصات قواعد البيانات لمعالجة الأداء ، والمتطلبات الفنية والتجارية قد تحولت كذلك. لقد رأينا هذه الزيادة في الطلب على حلول للتعامل مع المتطلبات التجارية المعقدة أو المتطلبات الفنية الأكثر تعقيدًا. وهكذا فإن نظرة سريعة حقًا من خلال ما يعنيه هذا في الواقع ، في رأيي ، هي أننا وصلنا إلى فترة التسعينيات ، ورأينا تقنية قواعد البيانات تتأثر بإدخال الإنترنت ، ونوع ما نسميه آنذاك الإنترنت مقياس. لم نكن نتحدث فقط عن الأشخاص الذين يجلسون أمام المحطات الطرفية ، في الأساس أمثال المحطات الطرفية التي تحتوي على طابعات فعلية مدمجة فيها و 132 عمودًا من النصوص تظهر في ورقة. ثم محطات الشاشة الخضراء في وقت مبكر ، واللكم مع لوحات المفاتيح.
لكنك تعلم أن عالمنا كان عبارة عن محطات وكابلات تسلسلية أو كابلات شبكة تتحدث إلى أجهزة الكمبيوتر لفترة طويلة. ثم جاء الإنترنت ، وهذا النمو الهائل في الاتصال ، الذي لم يعد بحاجة إلى توصيله بالكمبيوتر بعد الآن. للوصول إلى نظام قاعدة البيانات ، كنت بحاجة فقط إلى متصفح ويب. لذلك كان يتعين على تقنية قاعدة البيانات أن تتغير بشكل كبير ، للتعامل مع حجم كل شيء من تقنيات محرك البحث الأساسية التي كانت تستخدم لفهرسة العالم ، وتخزين فهرس المعلومات ، في مثال مقياس تنسيق قاعدة البيانات. وقدم أشخاص مثل Google وغيرهم منصة للقيام بذلك. وتم إنتاج جميع الأنواع الجديدة من تخزين قواعد البيانات والاستعلام عنها وفهرستها. ثم كان لدينا مواقع الموسيقى ومواقع الأفلام تأتي جنبا إلى جنب.
ثم في العقد الأول من القرن العشرين ، شهدنا طفرة dot-com ، والتي أحدثت انفجارًا دراماتيكيًا أكبر في عدد الأشخاص الذين يستخدمون أنظمة كانت تعمل دائمًا بواسطة قاعدة بيانات من بعض الأشكال. في هذه المرحلة ، لا تزال قواعد البيانات العلائقية تتعامل مع معظم العبء ، لقد وضعناها في صفائح أكبر ، وذهبنا إلى حد كبير في الأنظمة متوسطة المدى الكبيرة جدًا التي تشغل منصات Unix من أشخاص مثل IBM و Sun وما إلى ذلك. . جعل ازدهار dot-com الأشياء أكبر وأسرع من الأجهزة ، وجهة نظر الأداء ، وكانت هناك بعض التغييرات المهمة في محركات قاعدة البيانات ، ولكن بالنسبة للجزء الأفضل ، كان لا يزال نفس الشيء الذي رأيناه وقت طويل.
وبعد ذلك وصلنا إلى عصر الويب 2.0 ، كما نشير إليه. وكان هذا تحولا وحشيا ، لأننا فجأة كنا بحاجة إلى منصات قاعدة بيانات أبسط بكثير ، وكان لابد من وجود مقياس في شكل أفقي. وكان هذا تحولًا كبيرًا في الطريقة التي تناولنا بها فكرة قاعدة البيانات. نحن ما زلنا حقا اللحاق بالركب الآن في رأيي. والآن نحن نتعامل مع هذا المستنقع برمته ، وأقول أنه مع تدور إيجابي ، وليس دلالة سلبية ، هذا المستنقع لما نشير إليه على أنه بيانات كبيرة ، وانفجار هائل ، وأعني انفجار. هذا التحول الفاحش عموديًا على الرسم البياني لعدد الخيارات المتاحة لدينا عندما نتحدث عن قاعدة بيانات ، وشكل من أشكال القدرة على الاستعلام العلائقي.
ومن المثير للاهتمام ، أنا شخصياً أرى أن البيانات الضخمة هي في الحقيقة مجرد قمة جبل الجليد. نحن نميل إلى التحمس قليلاً بشأن تأثير البيانات الضخمة وأنواع الخيارات المتاحة لدينا الآن. لدينا كل شيء من محركات NoSQL ، ولدينا محركات الرسوم البيانية ، ولدينا كل هذه الأنواع المختلفة من المنصات التي يمكننا رمي البيانات عليها والقيام بها. حتى إلى الحد الذي كان في الواقع ، كان أحد المحادثات الأولى التي أجريتها مع إريك كافاناغ ، الموجود معنا اليوم ، حول محادثة تتعلق بشيء يسمى Apache Drill ، وهو مشروع مفتوح المصدر يسمح لك بالاستعلام البيانات داخل طراز أنواع البيانات المختلفة: كل شيء بدءًا من ملفات CSE الخام الموجودة على القرص الصلب ، وصولاً إلى أنظمة ملفات HDFS على مقياس بيتابايت. كما تعلمون ، إنها تتيح لك القيام بهذه الاستعلامات على غرار SQL الخاصة بالبيانات المنظمة وغير المهيكلة لجميع أنواع النباتات المثيرة.
نحن على وشك أن نرى "المبنى الذكي" يصبح شيئًا ، ونود أن نعتقد أن لدينا مباني ذكية للأمن وإدارة الحرارة ، لكنني أتحدث عن مبان ذكية تعرف الكثير عن شخصيتك وأين أنت عندما تدخل ، وتنفذ جميع أنواع الأشياء الدقيقة على هذا المستوى ، وصولاً إلى المدن الذكية - النظم الإيكولوجية بأكملها على مستوى المدينة - التي تعرف كيفية القيام بالأشياء بذكاء. علاوة على ذلك ، لدينا هذا الشيء المدهش الذي لا أعتقد أن أي شخص في العالم قد اغتنامه تمامًا ، وهذا هو شكل إنترنت الأشياء. كانت هناك كل هذه التغييرات المختلفة خلال العقد الماضي وقليلا ، ربما عقدين تقريبًا ، إذا قمنا بتجميعها ، فقد أثر هذا في عالم ما نعتبره قواعد البيانات ، في رأيي.
كان هناك بضعة أشياء مهمة جعلت هذا ممكنًا. لقد انخفضت تكلفة محركات الأقراص الصلبة بشكل كبير ، وهذا من خلال العديد من الطرق هو الذي جعل من الممكن قيادة بعض بنيات المرجع مثل طراز Hadoop ، حيث نأخذ الكثير من البيانات ونشرها على الكثير من محركات الأقراص الصلبة ، و تفعل أشياء ذكية معها. وفي الواقع ، ما أصبح يتقاسم ، في رأيي ، قاعدة البيانات العلائقية أو نموذج وحدة DB التقليدية. لقد حصلت ذاكرة الوصول العشوائي (RAM) على تكلفة رخيصة للغاية ، مما أتاح لنا فرصة جديدة تمامًا للعب مع بنى مرجعية مختلفة مثل الذاكرة ، والقيام بأشياء مثل تقسيم مجموعات كبيرة جدًا من البيانات.
وهذا أعطانا هذه الصورة الصغيرة التي ننظر إليها الآن ، وهو رسم بياني يوضح أنواع الأنظمة الأساسية المتاحة إذا كنت في مشهد البيانات الكبير. ومن الصعب للغاية قراءتها ، والسبب في ذلك ، هناك الكثير من المعلومات حول هذا الموضوع. هناك الكثير من خيارات التصميم والنماذج والتصنيع الخاصة بطرق وضع البيانات في أنظمة قواعد البيانات بأي شكل من الأشكال ، والاستعلام عنها ، والقيام بالكتابة التقليدية. وهي ليست جميعها متوافقة ، في الواقع عدد قليل جدا منهم يتوافق مع أي معيار نمط أساسي ، لكنهم ما زالوا يعتبرون أنفسهم قاعدة بيانات. وسأعرض عليك شاشتين في الثانية لإعطائك بعض السياق حول ما أعنيه بالتحول من التسعينيات ومقياس الإنترنت ، إلى الويب 2.0 ، ثم النمو الكامل من خلال البيانات الضخمة. إذا كنا نعتقد أن هذا الرسم البياني لتكنولوجيا البيانات الضخمة يعد أمرًا مثيرًا نظرًا لوجود العديد من الخيارات عليه ، فلنلقِ نظرة فقط على مفتاح رأسي واحد.
دعونا ننظر في تكنولوجيا التسويق. فيما يلي الخيارات لأنظمة إدارة قواعد البيانات ، أو إدارة البيانات داخل مساحة التكنولوجيا الفائقة ، وكذلك التكنولوجيا المتعلقة بالتسويق. الآن كان هذا في عام 2011 ، منذ بضع سنوات ؛ قبل خمس سنوات ، هذا ما بدا عليه المشهد. إذا عدت مرة أخرى شريحة واحدة لفترة وجيزة ، هذا ما يبدو عليه مشهد البيانات اليوم في مختلف العلامات التجارية والعروض التي لدينا في تقنيات قواعد البيانات. هذا ما بدا عليه شكل رأسي قبل خمس سنوات ، فقط في تكنولوجيا التسويق.
الآن إذا ذهبت إلى وجهة نظر اليوم ، هذا ما يبدو عليه ، وهو لا يمكن اختراقه تمامًا. إنه مجرد جدار من العلامات التجارية والخيارات ، والآلاف والآلاف من مجموعات البرامج التي تعتبر نفسها في فئة قاعدة البيانات ، والتي يمكنها التقاط البيانات أو إنشائها أو تخزينها واستردادها في أشكال مختلفة. وأعتقد أننا ندخل الآن وقتًا ممتعًا للغاية وشيقًا للغاية ، حيث يمكنك أن تعرف ذات مرة العلامات التجارية الكبرى ، ويمكنك معرفة خمسة أو ستة منصات مختلفة من Oracle و Informix و DB2 وما إلى ذلك ، وتكون تقريبا خبير في جميع العلامات التجارية التي كانت متاحة منذ حوالي 20 عاما. قبل عشر سنوات ، أصبح الأمر أسهل بعض الشيء لأن بعض العلامات التجارية سقطت ، ولم تستطع جميع العلامات التجارية التعامل مع حجم طفرة dot-com ، وانتهت بعض الشركات للتو.
اليوم ، من المستحيل تمامًا أن تكون خبيرًا في كل تكنولوجيا قواعد البيانات الموجودة ، سواء أكانت قواعد بيانات علائقية ، أو منصات أساسية لإدارة قواعد البيانات التي عرفناها خلال العقدين الماضيين. أو على الأرجح ، فإن المحركات الأكثر حداثة مثل Neo4j وتلك الأنواع. لذلك أعتقد أننا ندخل في عالم شجاع للغاية حيث تتوفر الكثير من الخيارات ، ولدينا منصات على نطاق واسع على أساس أفقي ، إما في الذاكرة أو على القرص الآن. لكنني أعتقد أن هذا وقت مليء بالتحديات بالنسبة لصانعي القرار في مجال التكنولوجيا والأعمال ، لأنهم بحاجة إلى اتخاذ بعض القرارات الكبيرة جدًا بشأن مجموعات التكنولوجيا ، والتي كانت موجودة في بعض الحالات فقط لمدة شهور أساسية. عمر ثمانية عشر شهراً ليس رقمًا مخيفًا الآن بالنسبة لبعض منصات قواعد البيانات مفتوحة المصدر الأكثر إثارة وجديدة. ويبدأون في دمج المنصات ويصبحون أكثر حداثة وأكثر إثارة.
أعتقد أننا سنجري محادثة رائعة اليوم حول كيفية تأثير هذا كله على منصات قواعد البيانات التقليدية وكيف يستجيبون لها ، وأنواع التقنيات التي يتم طرحها على ذلك. ومع أخذ ذلك في الاعتبار ، سأنتقل الآن إلى الدكتور روبن بلور ، وأحصل على أفكاره. روبن ، أكثر لك.
روبن بلور: حسنًا ، شكرًا على ذلك. نعم ، هذا موضوع كبير جدًا. أعني ، إذا كنت قد التقطت للتو قطعة من الرسوم التوضيحية التي أظهرها لك Dez للتو ، يمكنك إجراء محادثة طويلة حول أحد الشظايا. لكنك تعلم أنه يمكنك الذهاب إلى قاعدة بيانات - لقد كنت أبحث في قواعد البيانات ، وأنا لا أعرف ، منذ الثمانينات ، ويمكنك البحث في قاعدة البيانات بطرق مختلفة. وأحد الأشياء التي اعتقدت أنني سأفعلها ، مجرد إلقاء نظرة على المحادثة اليوم ، كان الحديث عن سبب حدوث أشياء مزعجة على مستوى الأجهزة. وعليك أن تضع في اعتبارك أن هناك الكثير من الأشياء المدمرة التي حدثت بالفعل على مستوى البرامج أيضًا ، لذلك ليست هذه هي الصورة الكاملة لأي شيء ، إنها مجرد شيء يتعلق بالأجهزة.
لم أكن أتحدث لفترة طويلة أيضًا ، أردت فقط أن أعطيك صورة الأجهزة. كانت قاعدة البيانات هي قدرات استرداد البيانات التي تغطي وحدة المعالجة المركزية والذاكرة والقرص ، وهذا يتغير بشكل كبير. والسبب في ذلك هو أنني تعلمت أن أفهم قاعدة البيانات من منظور ما قمت به بالفعل. كما تعلم ، هناك اختلاف في زمن الوصول بين البيانات الموجودة فعليًا على وحدة المعالجة المركزية والبيانات التي يتم سحبها إلى وحدة المعالجة المركزية من الذاكرة والبيانات التي يتم سحبها من القرص إلى الذاكرة ومن خلال وحدة المعالجة المركزية. وكانت هياكل قاعدة البيانات القديمة تحاول فقط موازنة ذلك. كما تعلمون ، لقد كانوا يقولون فقط ، "حسنًا ، هذا أمر بطيء جدًا ، وسنقوم بتخزين البيانات الموجودة على القرص في ذاكرة مؤقتة. سنحاول القيام بذلك بطريقة دقيقة بالفعل بحيث تكون نسبة جيدة من البيانات التي نطلبها موجودة بالفعل في الذاكرة. وسنقوم بنقل البيانات إلى وحدة المعالجة المركزية بأسرع ما يمكن ".
وقواعد البيانات كانت مكتوبة في الأيام الخوالي تمت كتابة آلات للمجموعات الصغيرة. والآن ، لجهل التوازي. لأنه إذا كنت ستحصل على بعض الأداء من مجموعة ، فسوف يتعين عليك القيام بأشياء مختلفة بشكل متوازٍ. التوازي جزء من اللعبة ، لا يشبه ما هو عليه الآن. أنا فقط نوع من المشي من خلال ما حدث.
بادئ ذي بدء ، القرص. حسنا القرص قد انتهى ، حقا. لقد انتهى الأمر إلى حد كبير فيما يتعلق بقواعد البيانات. أعتقد أن هناك عددًا من السياقات لأرشفة البيانات ، وحتى بحيرات البيانات الكبيرة جدًا التي تعمل على Hadoop ، من المحتمل أن يكون قرص الغزل الأسوأ قابلاً للتطبيق في الوقت الحاضر. حقًا ، كانت مشكلة القرص الدوار هي أن سرعات القراءة لم تتحسن كثيرًا بشكل خاص. وعندما كانت وحدة المعالجة المركزية ترتفع بسرعة قانون مور ، نوع من الحجم ، أسرع كل ست سنوات. وكانت الذاكرة من نوع ما في أعقابها ، ثم كان الاثنان يواكبان بعضهما البعض بشكل معقول ، لم يكن الأمر سلسًا تمامًا ، لكنهما فعلا ذلك.
لكن القراءة العشوائية إلى القرص حيث يطير الرأس حول القرص ، أعني ، بصرف النظر عن أي شيء آخر ، أنها حركة فعلية. وإذا كنت تقوم بالقراءة العشوائية للقرص ، فسيكون بطيئًا بشكل لا يصدق مقارنة بالقراءة من الذاكرة ، فهو أبطأ بمقدار 100000 مرة. ومؤخراً ، كانت معظم بنيات قواعد البيانات التي نظرت إليها بأي عمق قد تم قراءتها بشكل تسلسلي من الأقراص. تريد حقًا ، بطريقة أو بأخرى ، تخزين ذاكرة التخزين المؤقت قدر الإمكان من القرص ، وقم بسحبه من هذا الجهاز البطيء ووضعه على جهاز سريع. وهناك الكثير من الأشياء الذكية التي يمكنك القيام بها مع ذلك ، لكنها أكثر من ذلك.
وأقراص الحالة الصلبة ، أو محركات أقراص الفلاش ، في الحقيقة ، ما هي عليه بالفعل ، تحل بسرعة كبيرة محل القرص الدوار. وهذا يتغير مرة أخرى تمامًا ، نظرًا لأن الطريقة التي يتم بها تنظيم البيانات على القرص ، يتم تنظيمها وفقًا للطريقة التي يعمل بها القرص. يتعلق الأمر في الواقع برأس يتحرك عبر سطح دوار ، ورؤوس متعددة تتحرك في الواقع عبر أسطح متعددة الغزل ، وتلتقط البيانات أثناء التنقل. محرك الحالة الصلبة هو مجرد كتلة من الأشياء التي يمكنك قراءتها. أعني ، أول شيء هو أن جميع قواعد البيانات التقليدية تم تصميمها من أجل قرص الغزل ، ويتم الآن إعادة تصميمها من أجل SSD. ربما يمكن لقواعد البيانات الجديدة - أي شخص يكتب قاعدة بيانات جديدة في الوقت الحالي ، يمكنه على الأرجح تجاهل قرص الغزل ، وليس التفكير فيه على الإطلاق. لكن Samsung ، الشركة المصنعة الكبرى لمحركات أقراص الحالة الثابتة ، تخبرنا أن محركات أقراص الحالة الثابتة هي بالفعل في منحنى قانون مور.
أعتقد أنهما كانا أسرع بثلاث أو أربع مرات من القرص الدوار ، لكنهما سيحصلان الآن بشكل أسرع كل 18 شهرًا ، بشكل أساسي. مضاعفة السرعة ، و 10 مرات بسرعة تصل إلى حوالي ست سنوات. ومع ذلك ، إذا كان الأمر كذلك ، فليس كذلك ، كما سأخبرك في لحظة. القرص الغزل بالطبع أصبح وسيلة أرشفة.
عن الذاكرة. أول الأشياء أولا ، ذاكرة الوصول العشوائي. تزداد نسبة وحدة المعالجة المركزية (RAM) بين ذاكرة الوصول العشوائي (RAM) لكل وحدة CPU في كل وقت. وهذا بالطبع ، بطريقة ما ، يوفر المزيد من السرعة الفظيعة ، لأن مساحة الذاكرة التي يمكن أن تمتلكها الآن يمكن أن تخزن الكثير. ما يفعله هذا في الواقع هو أنه يخفف الضغط على تطبيقات MLTP أو تطبيقات القراءة العشوائية ، لأنه من الأسهل تلبية هذه التطبيقات ، لأن لديك الآن الكثير من الذاكرة ، وبهذه الطريقة ، يمكنك تخزين أي شيء مخبأ من المرجح أن تقرأ في الذاكرة. لكنك تواجه مشكلات مع كومة بيانات أكبر ، لذا فإن البيانات الضخمة ليست بهذه البساطة في الحقيقة.
ثم لدينا Intel مع 3D Xpoint ، و IBM مع ما يسمونه PCM ، وهو ذاكرة التغيير التدريجي ، يقدمون شيئًا يعتقدون أنه - حسنًا ، إنه أسرع 10 مرات على الأقل من محركات الأقراص الصلبة الحالية ، ويعتقدون أنها ستحصل قريبة جدا من أن تكون بنفس سرعة RAM. وبالطبع أنها أقل تكلفة. في السابق ، كان لديك بنية قاعدة البيانات هذه من وحدة المعالجة المركزية والذاكرة والقرص ، ونحن الآن نتحرك نحو هيكل يحتوي على أربع طبقات. إنه يحتوي على وحدة المعالجة المركزية والذاكرة أو ذاكرة الوصول العشوائي ، ثم هذا النوع من الذاكرة الأسرع من SSD ، والتي هي في الواقع غير متقلبة ، ثم SSD. وهذه التقنيات الجديدة غير متقلبة.
كما أن هناك معبرة من HP ، والتي لم تعلن بعد ، لأنه تم الإعلان عنها منذ حوالي سبع سنوات ، لكنها لم تظهر بعد. لكن الشائعات التي أسمعها هي أن HP ستغير اللعبة قليلاً مع أحد المذكرات أيضًا ، بحيث يكون لديك وضع ذاكرة جديد. هذا ليس كما لو أن لدينا أشياء أسرع ، وهذا مثل أن لدينا طبقة جديدة كاملة. ثم لدينا حقيقة أن الوصول SSD ، يمكنك قراءتها بالتوازي. لا يمكنك قراءة قرص الغزل بشكل متوازٍ ، باستثناء وجود الكثير من أقراص الغزل المختلفة. لكن كتلة من SSD ، يمكنك أن تقرأ فعلا بالتوازي. ونظرًا لأنه يمكنك قراءة ذلك بشكل متوازٍ ، فإنه يتم بشكل أسرع من سرعات القراءة البسيطة ، إذا قمت بالفعل بإعداد عمليات متعددة عبر العمليات المختلفة على وحدة معالجة مركزية واحدة ، وقمت فقط باستخدام SSD.
تشير التقديرات إلى أنه يمكنك الوصول إلى سرعات RAM تقريبًا عن طريق القيام بذلك. وكل ما يقوله هذا هو أن مستقبل بنية الذاكرة غير واضح. أعني ، أن الواقع هو أن البائعين المهيمنين المختلفين ، أيا كان دورهم ، سيحددون على الأرجح اتجاه الجهاز. لكن لا أحد يعرف إلى أين يحدث في هذه المرحلة الزمنية. لقد تحدثت إلى بعض مهندسي قواعد البيانات الذين يقولون: "لست خائفًا مما يحدث" ، لكنهم لا يعرفون كيفية تحسينه من البداية. وأنت دائمًا ما فعلت ، لذلك هذا مثير للاهتمام.
ثم هناك وحدة المعالجة المركزية. حسنًا ، لم تكن وحدات المعالجة المركزية متعددة النواة مجرد وحدات معالجة متعددة النواة. لدينا أيضًا كميات كبيرة من ذاكرة التخزين المؤقت L1 و L2 و L3 ، خاصةً L3 ، والتي لا تصل إلى عشرات الميجابايت. يمكنك وضع الكثير هناك ، كما تعلمون. وبالتالي ، يمكنك بالفعل استخدام الشريحة كوسيلة للتخزين المؤقت. بحيث غيرت اللعبة. وبالتأكيد ، معالجة المتجهات وضغط البيانات ، قام عدد من البائعين بالفعل بذلك ، وسحبوا هذه الأشياء إلى وحدة المعالجة المركزية لجعلها تسير بشكل أسرع في وحدة المعالجة المركزية. ثم تحصل على حقيقة مفادها أن وحدات المعالجة المركزية (CPU) المزودة بوحدات معالجة الرسومات (GPU) جيدة حقًا في تسريع التحليلات. وهي جيدة حقًا في أنواع معينة من الاستعلامات ، وهذا يعتمد فقط على ماهية استفسارك.
يمكنك إما إنشاء لوحات مع وحدات المعالجة المركزية ووحدات معالجة الرسومات ، أو كما تفعل AMD الآن ، أنت تنتج شيئًا ما يسمى APU ، وهو نوع من الزواج بين وحدة المعالجة المركزية ووحدة معالجة الرسومات ؛ انها حصلت على كلا النوعين من القدرة على ذلك. لذلك هذا هو نوع مختلف من المعالج. وبعد ذلك الإعلان الأخير من شركة إنتل بأنها ستضع FPGA على الرقاقة ، هذا النوع من الأمور رأسي فيها. كنت أفكر ، "كيف يحدث هذا على الأرض؟" لأنك إذا حصلت على إمكانية وحدة المعالجة المركزية ، وحدة معالجة الرسومات ، وكنت قد حصلت على إمكانية وحدة المعالجة المركزية ، FPGA - وبالمناسبة ، إذا كنت تريد حقا ، على اللوحة نفسها ، يمكنك وضع وحدة المعالجة المركزية ، وحدة معالجة الرسومات ، و FPGA. ليس لدي أي فكرة عن كيفية تشغيل أي شيء بهذه الطريقة في الواقع ، لكنني أعرف الشركات التي تقوم بأشياء مثل هذه ، وأنها تحصل على إجابات سريعة للغاية للاستعلام. هذا ليس شيئًا سيتم تجاهله ، وهذا شيء سيُستخدم من قِبل البائعين المعروفين ، وربما من قِبل البائعين الجدد القادمين. كانت قواعد إدارة قواعد البيانات (DBMS) متوازية دائمًا ، ولكن الآن الإمكانيات المتوازية قد انفجرت للتو ، لأن هذا يسمح لك بموازاة ذلك مع ذلك ، مع ذلك بعدة طرق.
وأخيرا ، لتوسيع نطاق أو توسيع نطاق؟ إن التوسع هو الحل الأفضل حقًا ، ولكن لشيء واحد. يمكنك الحصول على أداء عقدة أفضل بكثير إذا كان يمكنك فقط تحسين أداء وحدة المعالجة المركزية والذاكرة الموجودة على القرص على عقدة واحدة. وسوف تستخدم عدد أقل من العقد ، لذلك سيكون أرخص ، أليس كذلك؟ وسيكون من الأسهل إدارتها. لسوء الحظ ، إنه تصميم يعتمد على الأجهزة ، ومع تغير الأجهزة ، يصبح القيام بذلك أقل وأقل ، ما لم يكن مهندسونك قادرين على العمل بأسرع ما يتغير الجهاز. وأنت تواجه مشكلات في عبء العمل ، لأنك عندما تقوم بالارتقاء ، فأنت تضع افتراضات مختلفة حول ما ستفعله عبء العمل.
إذا قمت بالتدريج ، أي إذا ركزت الهندسة المعمارية الخاصة بك على التدريج قبل التوسع - في الواقع عليك القيام بهما معًا ، فأنت فقط تؤكد على ذلك. ستحصل بعد ذلك على أداء أفضل للشبكة ، لأن البنية ستتعامل معها. سيكون أكثر تكلفة من حيث الأجهزة لأنه سيكون هناك المزيد من العقد ، ولكن سيكون هناك عدد أقل من مشاكل عبء العمل ، وسيكون هناك تصميم أكثر مرونة.
لقد ظننت أنني سأطرح هذا الأمر ، لأنه إذا كنت تفكر فعليًا في كل التغييرات في الأجهزة ، فقد أشرت للتو إلى إصبعي ، ثم فكرت في كيفية توسيع نطاق هذه الأشياء وتوسيع نطاقها؟ ثم تدرك أن مهندسي قاعدة البيانات ، في رأيي على الأقل ، يحصلون على رواتب جيدة. لذلك إذا كنت تفكر فقط في طبقة الأجهزة ، تكون تحديات قاعدة البيانات واضحة. أنتقل الآن إلى بيرت ، الذي سيجعلنا جميعًا نشعر بالتعليم.
إريك كافانا: هذا كل شيء! بيرت؟
بيرت سكالزو: شكرا جزيلا لك. اسمحوا لي فقط الحصول على مباشرة في هذه الشرائح. لدي الكثير من الشرائح التي يمكنني المرور بها ، لذا فقد أذهب بسرعة إلى عدد قليل منها. سنتحدث عن "الزخم الأمامي: الانتقال إلى ما وراء التقليدية". لم تعد قاعدة بيانات والدك بعد الآن. لقد تغيرت الأمور ، وكما قال متحدث سابق ، خلال السنوات الست إلى السبع الماضية ، تغير المشهد بشكل جذري.
بنفسي ، لقد كنت أفعل قواعد البيانات منذ منتصف الثمانينات. لقد كتبت كتبًا عن Oracle و SQL Server وقياس الأداء وغير ذلك الكثير من الأشياء الأخرى. "العالم يتغير بسرعة كبيرة. سوف كبيرة لا تغلب صغيرة بعد الآن. سيكون ذلك سريعًا في التغلب على البطيء. "لقد أضفت" للتكيف ". وكان ذلك من روبرت مردوخ. أعتقد حقا أن هذا سيكون صحيحا. لن تكون قادرًا على القيام بأشياء قاعدة البيانات بالطريقة التي فعلت بها منذ 10 أو 15 أو 20 عامًا. سيكون عليك القيام بذلك بالطريقة التي تريدها الشركة الآن.
سأحاول أن أبقى عامًا قليلاً في ما سأقدمه ، لكن معظم الميزات التي أتحدث عنها ستجدها في Oracle ، وستجدها في SQL Server ، و MySQL ، و MariaDB ، وبعض الميزات الأخرى الكبيرة اللاعبين. ثورة قاعدة البيانات العلائقية ، وأنا أتفق مرة أخرى مع المتحدثين السابقين. إذا نظرت جيدًا في حوالي عام 2010 ، فقد انتقلنا من سيارة السباق الحمراء إلى سيارة السباق الصفراء. كان هناك تغيير كبير ، ومع حلول عام 2020 ، أعتقد أنك سترى تغييراً جذرياً آخر. نحن في وقت مثير جدا للاهتمام.
الآن ، هذه الشريحة هي المفتاح ، ولهذا السبب وضعت مفتاح هناك. هناك كل هذا التغيير يحدث ، وعلى الجانب الأيسر لدي التكنولوجيا ، وعلى الجانب الأيمن لدي عمل. والسؤال هو ، ما الذي يسبب أي واحد ، وأي واحد يدعم أي؟ لدينا كل هذه التغييرات في الأجهزة: الأقراص تنخفض ، ارتفاع حجم القرص ، أنواع جديدة من الأقراص ، بحيث تمت تغطيتها بواسطة السماعات السابقة. سعر إسقاط الذاكرة ، كل هذه الإصدارات الأحدث من قواعد البيانات. ولكن على الجانب الأيمن ، لدينا حماية البيانات والامتثال ، تخزين البيانات ، ذكاء الأعمال ، التحليلات ، الاحتفاظ بالبيانات الإلزامية. كلا جانبي المعادلة يقودان ، وسيستخدم كلا جانبي المعادلة كل هذه الميزات الجديدة.
بادئ ذي بدء ، لدينا قرص SAS النموذجي للغزل ، فهو يصل إلى 10 تيرابايت الآن. إذا لم ترَ ، Western Digital ، فإن HGST لديها ما يسمونه محرك الهيليوم الخاص بهم ، والذي يصل إلى حوالي 10 تيرابايت في الوقت الحالي. تكاليف القرص الغزل أصبحت منخفضة جدا. كما ذكرنا سابقًا ، يمكنك الحصول على أقراص صلبة تصل إلى حوالي 2 تيرابايت ، ولكن لدى سامسونج وحدة 20 تيرابايت قريبًا. التكاليف أصبحت معقولة. شيء واحد سأتحدث عن الآخرين لم يكن هو مفهوم أقراص الفلاش. PCIe ، هذا هو PCI Express ، مقابل NVMe ، ربما تكون قد سمعت أو لم تسمع عن هذا التعبير السريع عن الذاكرة غير المتطايرة. في الأساس ، ستكون NVMe بديلاً عن SAS و SATA ، وهي بالفعل بروتوكول اتصال أكثر من أي شيء آخر. ولكن هذه الأقراص تصل إلى حوالي ثلاثة تيرابايت الآن.
ربما تكون قد رأيت أيضًا أن بعض محركات أقراص SAS تأتي الآن مع موصلات U.2 ، والتي هي عبارة عن موصل مختلف عن SAS أو SATA ، والتي تدعم NVMe مع قرص قياسي - على القرص أن يدعمها أيضًا بالطبع. ثم SATA مع موصلات M.2 ، وتلك التي بدأت في الحصول على NVMe. في الواقع ، هناك الآن بائعي أجهزة كمبيوتر محمولة يقومون ببيع أجهزة الكمبيوتر المحمولة التي تحتوي على قرص فلاش NVMe ، وستظهر هذه الأشياء مقارنة بالتكنولوجيا التي استخدمتها من قبل.
الكثير من الناس لا يعرفون ما هي كل هذه الهبات المختلفة. إذا نظرت إلى أسفل الزاوية اليمنى ، فهذا مثال على M.2. يمكنك القول ، "حسنًا ، يبدو الأمر أشبه بمحرك mSATA إلى يسارها." ولكن كما ترون ، توجد فجوات في المسامير مقابل واحدة ، وهي أكبر قليلاً. وأيضا ، يمكن أن يأتي M.2 بثلاثة أحجام مختلفة.
ثم فلاش PCI Express ، وفلاش NVMe. الآن ، يعد فلاش NVMe هو أيضًا PCI Express ، لكن PCI Express لا يزال عادةً خوارزمية تحكم SAS- أو SATA-type التي تمت كتابتها من أجل قرص الغزل ، و NVMe هي الخوارزميات أو التقنيات التي تمت كتابتها خصيصًا للفلاش. ومرة أخرى ، سترون كل هذه.
يقدم NVMe عددًا قليلاً من الأشياء. أعتقد أن أكبر اثنين من التحسينات ، في أعلى الزاوية اليمنى ، يتم تقليل الكمون بنسبة تصل إلى 70 في المائة. لقد رأيت بالفعل أعلى من ذلك. بالإضافة إلى ذلك ، إذا نظرت إلى الركن الأيمن السفلي ، عندما يتحدث نظام التشغيل الخاص بك إلى قرص NVMe ، فإنه يمر بمستويات أقل بكثير من البرامج. بشكل أساسي ، يمكنك الانتقال من خلال برنامج تشغيل NVMe المضمن الآن مع نظام التشغيل ، ويتحدث مباشرةً مع الوسائط. هناك الكثير من الأسباب التي تجعل هذه التقنية تغير جذريًا في عالم قواعد البيانات.
وفي كثير من الأحيان ، سيقول الناس ، "حسنًا ، ما مدى سرعة NVMe؟" كما تعلمون ، الأيام الخوالي ، قبل عام 2004 وما قبله ، شعرنا بالإثارة إذا كان لدينا Ultra-320 SCSI ، 300 ميجابايت في الثانية. سرعات اليوم ، الكثير منكم ربما على الألياف أو InfiniBand ، وهذا النوع من أعلى خارج. NVMe هناك على اليمين ، يبدأ من حيث تنتهي التقنيات الحالية. ما أحصل عليه هو ، PCI Express 3.0 مع وصلة ذات ثمانية حارات تبدأ في حوالي 8000 ، وسوف ترتفع عندما نحصل على إصدارات أحدث من PCI Express ، الإصدارات الأربعة وما إلى ذلك. NVMe ليس لديه مكان يذهبون إليه باستثناء ما يصل.
الآن ، ما هي بعض الأشياء المتغيرة في قاعدة البيانات؟ الآن في الركن الأيمن العلوي من الشرائح الخاصة بي ، وضعت أسباب العمل التي أعتقد أن التكنولوجيا ظهرت بها. في هذه الحالة ، وبسبب تخزين البيانات وبسبب الأسباب التنظيمية للاحتفاظ الإلزامي بالبيانات ، بدأت قواعد البيانات في توفير الضغط فيها. الآن ، توفر بعض قواعد البيانات ضغطًا كإضافة ، والبعض الآخر يقدمها مضمنًا في المعيار ، دعنا نقول إصدار المؤسسة من قاعدة البيانات الخاصة بهم ، وحتى بعض قواعد البيانات ، كما هو الحال في Oracle ، يمكن أن تحتوي حتى على نسخة أفضل من الضغط في ، على سبيل المثال ، منصة Exadata الخاصة بهم ، لذلك قاموا بالفعل ببناء أجهزة يمكن أن تدعم ضغطًا شديد التخصص وأن ذلك الموجود في Exadata ، على سبيل المثال ، يحصل على معدل ضغط 40x ، وهذا مهم جدًا. وأعتقد أنه الاحتفاظ الإلزامي بالبيانات ، فالناس يريدون فقط البيانات لفترة أطول. الشركات ، من أجل إجراء التحليلات و BI ، فإنها تحتاج إلى بيانات قيمتها 5 و 10 و 15 سنة الأخيرة.
الآن ميزة أخرى بدأت تظهر مباشرة في حوالي عام 2008 ، كانت فترة 2009 هي التقسيم. مرة أخرى ، ستجد هذا في قواعد البيانات مثل Oracle و SQL Server وفي كلتا القائمتين عليك دفع ثمنها. في Oracle ، يجب عليك شراء خيار التقسيم وفي SQL Server ، يجب أن تكون على إصدار مركز البيانات. إنها تقنية فرق تسد التقليدية الخاصة بك وما تفعله هو أن لديك مفهوم طاولة كبيرة منطقية في الجزء العلوي هناك وعندما يتم وضعها على القرص ، يتم تقسيمها بالفعل إلى مجموعات. ويمكنك أن ترى أن هذه المجموعات يتم تنظيمها بواسطة بعض معايير الفصل ، أو الرجوع إليها أو استدعاء وظيفة التقسيم الخاصة بك ، ثم يمكنك أيضًا تقسيم القسم الفرعي في بعض منصات قواعد البيانات ويمكنك الذهاب إلى أبعد من ذلك.
مرة أخرى ، أعتقد أن كل من تخزين البيانات والاحتفاظ بالبيانات الإلزامية دفعت هذا الأمر ، وفي بعض قواعد البيانات هذه يمكن أن يكون لديك ما يصل إلى 64000 قسم ، وأعتقد في بعض قواعد البيانات الأخرى حتى 64000 قسم فرعي. يسمح لك هذا بتقسيم بياناتك إلى أجزاء يمكن التحكم فيها. يمكنك أيضا تقسيم الفهارس. إنه خيار ، لست مضطرًا إلى ذلك ، ولكن يمكنك تقسيم فهارسك أيضًا. قد يكون أحد أسباب ذلك هو وجود نافذة منزلقة للبيانات. تحتاج إلى الاحتفاظ بقيمة 10 سنوات من البيانات ، ولكن من أجل إسقاط الفهارس لتشغيل تحميل الدُفعة الليلة ، لا ترغب في إسقاط الفهارس في كل صف ، فقط في الصفوف الموجودة في المجموعة الحالية. التقسيم هو في الواقع أداة إدارية جيدة للغاية على الرغم من أن معظم الناس يعتقدون أن فائدتها الكبرى تتمثل في تجنب إزالة الأقسام في خططك وبالتالي تسريع استفساراتك. هذا حقا نوع من الجليد على الكعكة.
الآن ربما سمعت عن التقسيم وربما تعتقد ، "حسنًا ، لماذا وضعت هذه الشريحة هنا؟" هذا أحد هذه NoSQL - هذه واحدة من بيئات Hadoop هذه. أصدر Oracle 12c اثنين ، وهو ليس G8 حتى الآن ، ولكن الذي يتم عرضه أو معاينته يحتوي بالفعل على مشاركة فيه. سيكون لديك نظام قاعدة بيانات تقليدية مثل Oracle وستكون قادرًا على المشاركة كما تفعل في نموذج Hadoop ، وبالتالي سيكون لديك تقنية فرق تسد أخرى ستقسم جدول الصف إلى مجموعات في كل عقدة وهذا سيكون - تماما مثل ما تراه في بعض قواعد بيانات NoSQL الخاصة بك. وفي الواقع ، MySQL ، يمكنك فعلاً إنجاز هذا إلى حد كبير باستخدام إحدى تقنيات التجميع الخاصة بها ، لكنها تأتي إلى قاعدة بيانات تقليدية وأعتقد أن Microsoft لن ترغب في أن تتخلف عن الركب. لعب هذان اللعبان قفزة الضفدع مع بعضهما البعض طوال الوقت لذا أتوقع رؤية مشاركة في الإصدار التالي من SQL Server.
إدارة دورة حياة البيانات ، مرة أخرى الاحتفاظ الإلزامي بالبيانات ، ولكن أيضًا من أجل ذكاء الأعمال والتحليلات. في الحقيقة ، هذه تقنية فرق تسد ، وعادة ما تقوم DBAs بذلك يدويًا ، وهذا هو ، "سأحتفظ ببيانات هذا العام على أقراص سريعة ، بيانات العام الماضي على أقراص أبطأ قليلاً ، ربما سأذهب للاحتفاظ بالعامين الأخيرين قبل ذلك على أقراص أبطأ ، ثم سأحصل على طريقة أرشيفية. "لم يتم تسجيلها بعد الآن بشكل معتاد ، إنها عادةً - لديك نوع من التخزين المتصل بالشبكة أو جهاز يحتوي على الكثير من التخزين وهو ، كما تعلمون ، فعالة من حيث التكلفة لكنه لا يزال الغزل القرص.
والآن يمكنك فعلاً - سواء على Oracle أو SQL Server - يمكنك شراء خيار حيث يمكنك تحديد القواعد وهذا يحدث تلقائيًا في الخلفية. لم تعد مضطرًا إلى كتابة البرامج النصية بعد الآن ، وليس عليك القيام بأي شيء. وإذا كنت قد شاهدت SQL Server 2016 ، الذي صدر للتو في الأول من يونيو ، فهناك ميزة جديدة تسمى "قواعد البيانات الممتدة" والتي تتيح لك القيام - أساسًا في الزاوية اليمنى هناك - يمكنك الانتقال من طبقات متعددة مباشرةً إلى السحابة ومرة أخرى ، هذه ميزة مضمنة في قاعدة البيانات ، فأنت تقول شيئًا مثل: "إذا كان عمر البيانات أكثر من 365 يومًا ، فالرجاء نقلها إلى السحابة ، كما تعلمون ، قم بذلك تلقائيًا بالنسبة لي"
ستكون هذه ميزة رائعة حقًا ، في الواقع ، أعتقد أنها قد تكون ما سنراه في المستقبل ، حيث سيكون لديك قواعد بيانات مختلطة حيث ستحتفظ ببعض البيانات المحلية والبعض في السحابة. قبل ذلك ، كان الناس يفكرون ، "أوه ، أنا إما سأفعل على أساس فرضي أو سأفعل على السحابة". الآن نرى زواج الزواج من التقنيتين بهذه الطريقة المختلطة. أعتقد أن هذا سيكون كبيرًا جدًا وقد حصلت Microsoft عليه أولاً.
التنقيح ، وهذا يرجع إلى حماية البيانات والامتثال. الآن في الأيام الخوالي ، ربما قلنا ، "مرحبًا ، مطور التطبيق ، عندما تعرض هذا في التقرير ، عندما تعرض هذا على الشاشة ، فهناك بعض الأشياء الأمنية التي يجب عليك فحصها والرجاء ، كما تعلمون ، عرض البيانات فقط من المفترض أن يروا أو يخفيوا أو يصقلوا البيانات التي لا يُفترض أن يراها. "حسنًا ، كما هو معتاد ، عندما تدفعها للخارج إلى التطبيق ، لا يتم تنفيذها في مكان واحد بحيث يتم تنفيذها بشكل مختلف أو لا يتم القيام به في بعض الأماكن. والآن لديك بالفعل هذه القدرة في أنظمة قواعد البيانات الخاصة بك.
الآن في SQL Server 2016 ، هذه الميزة مضمّنة ، لذا فهي ليست عنصر تكلفة اختياري حتى الآن في إضافة مركز البيانات ، على ما أعتقد ؛ وفي Oracle 12 ، يتعين عليك شراء الوظيفة الإضافية لإدارة دورة الحياة الخاصة بها ، ولكن هذا شيء جديد ومرة أخرى يتم توجيهه من قبل الشركة. خاصة وأنك تحتفظ بالكثير من البيانات الآن ، وتقوم بإجراء التنقيب عن البيانات ، وبالتالي BI والتحليلات ، عليك أن تعرف من الذي يصل إلى البيانات والتأكد من أنه لا يُسمح لها سوى برؤية ما يسمح لهم برؤيته.
وبالمثل ، انظر مرة أخرى في ذلك ، وحماية البيانات والامتثال. ستجد أن الكثير من أنظمة قواعد البيانات تقوم الآن ببناء الضغط ، أو أنا آسف ، التشفير مباشرة في قاعدة البيانات وما هو مهم حول هذا التشفير ، إذا نظرت إلى السهم لأسفل والسهم لأعلى في الرسم البياني الذي يكتبه وصولا الى القرص مشفر ثم يقرأها مرة أخرى في الذاكرة وفك تشفيرها. هذا في الواقع نموذج واحد ، وهناك نموذج آخر من شأنه ، كما تعلمون ، أن يفعل ذلك في الواقع فقط عندما ينقل تلك البيانات عبر الشبكة إلى تطبيق العميل الفعلي.
في هذه الحالة ، فإنه لا يزال حتى على خادم قاعدة البيانات في الذاكرة يمكن تشفيره وفك تشفيره فقط عند إرساله إلى تطبيق العميل. يوجد نموذجان مختلفان هنا وستجدهما في قواعد البيانات ، وفي الواقع واحدة من قواعد البيانات التي أضافت للتو هذا مؤخراً كانت MariaDB في الإصدار 10.X ؛ أعتقد أنهم في 10.1 أو 10.2 الآن. وفعلت بعض المعايير في هذا التشفير ، ومن أجل الحصول على هذا التشفير ، واجهت فقط انخفاضًا بنسبة 8 بالمائة في الإنتاجية أو السرعة. في اختبار القياس ، لم يتسبب التشفير بهذا القدر ، ولذا فهو ميزة مفيدة للغاية.
الآن ، ذكرنا سابقًا حول ذاكرة الفلاش ومحركات الأقراص الثابتة وأشياء من هذا القبيل. إحدى الميزات الموجودة لديك في Oracle و SQL Server والتي لا يدركها الكثير من الأشخاص هي أنه يمكنك أخذ فلاش أو SSD موجود على خادم قاعدة البيانات الخاصة بك ويمكنك أن تقول لقاعدة البيانات ، "استخدم هذا كما لو كانوا ذاكرة. تعامل مع ذاكرة الوصول العشوائي على أنها تفضيلية ، ولكن التظاهر مثل هذه هي الذاكرة البطيئة واستخدامها كذاكرة تخزين مؤقت ممتدة. "الآن في SQL Server 2014 ظهر هذا وكان يطلق عليه" Buffer Pool Extension "، إنه مجاني. في Oracle ، تم إصداره في 11g R2 وكان يطلق عليه "Database Flash Cache" وكان أيضًا مجانيًا هناك.
لكن نصيحتي هي اختبار قيادة هذه الميزة بعناية. في كل مرة تقوم فيها بزيادة ذاكرة التخزين المؤقت عندما تذهب لإجراء بحث ، يستغرق وقتًا أطول. إذا وضعت بطاقة فلاش بثلاث تيرابايت وقلت لقاعدة البيانات ، "أضف ذلك إلى ذاكرتك" ، فقد تجد في الواقع أن شيئًا ما قد تباطأ نظرًا لوقت النظر إليه ورؤيته في الفلاش ، هل هو متسخ أو نظيفة؟ هناك نقطة تناقص العودة. نصيحتي هي اختبار القيادة مرة أخرى هذا ، ومعرفة ما يصلح لك ، ولكن مرة أخرى ، إنها موجودة في قاعدة البيانات الخاصة بك وفي حالة Oracle ، في SQL Server و Oracle ، كانت موجودة هناك لبضع سنوات حتى الآن.
ثم يقودنا ذلك إلى الجد الذي كان قواعد البيانات الموجودة في الذاكرة وذلك لأن أسعار قاعدة البيانات انخفضت. السبب الآخر الذي من المحتمل أن تظن أن هذا قد حدث هو أن الكثير من التحليلات تتطلب أن يكون الوصول إلى البيانات سريعًا للغاية ، ولذا يجب أن تكون في الذاكرة. لاحظ أن الخوارزميات التي تستخدمها قواعد البيانات للوصول إلى هذه البيانات ، وضغطها ، وتشفيرها ، وتخزينها ، كما تعلمون في بعض الحالات ، قد تستمر بعض قواعد البيانات في تخزينها في صف واحد.
في بعض الحالات ، قد تقسم بعض قواعد البيانات هذا إلى عمود موجه والسبب في ذلك هو أنها تحصل على مستوى ضغط أعلى بكثير ، في مكان ما حول 11 إلى 12X عن طريق تخزينه في ترتيب الأعمدة مقابل ترتيب الصفوف. ظهر هذا لأول مرة في SQL Server 2014 ، وكان يطلق عليه "Hekaton". لقد تمت زيادته بشكل جذري في SQL Server 2016 ، وسوف يرون أنه تم الرجوع إليه بواسطة بعض الأسماء المختلفة ، وقد تم طرحه في Oracle 12c؛ أقول الإصدار الثاني هنا ، وليس R2. كان هناك إصداران مختلفان من Oracle 12c ، 12.1.0.1 و 12.1.0.2. إنه الإصدار الثاني من الإصدار R1 من قاعدة البيانات.
والطريقة التي تحددها ، يشبه الكائن الموجود في الذاكرة في كلا قواعد البيانات. هنا يمكنك أن ترى في الزاوية اليمنى العليا ، أنا بصدد إنشاء SQL Server ويمكنك أن ترى ذلك مع الذاكرة الأمثل والمتانة يجري مخطط فقط. لن أتجاوز جميع معاني بناء الجملة هذه ، وفي Oracle أصبح الأمر أبسط بالفعل ، يمكنك فقط تغيير الجدول والقول في الذاكرة أو لا ، ويمكنك تغيير ذلك. أستطيع أن أقول اليوم أنها في الذاكرة وغدا ليست كذلك ، وبالتالي فهي مرنة للغاية.
لقد أجريت بعض الاختبارات على Oracle مع جداول في الذاكرة ، وأجريت بعض الاختبارات التي استغرقت 40 دقيقة تقريبًا للتشغيل ، هناك في الصف العلوي. المهم الآن هو الوقت الذي وصلت فيه إلى الصفين السفليين ، لقد قمت بزيادة وقت التشغيل أو خفضته ، يجب أن أقول ، إلى خمس دقائق تقريبًا ، وعندما نظرت إلى عامل الضغط ، كانت البيانات الموجودة في الذاكرة في الواقع 3.6 إلى 4.6 مرات أصغر. هذا مهم لأنني في هذه الحالة كنت أستخدم تنسيقًا موجهًا للأعمدة وضغطًا. لذا خمن ماذا؟ كنت في الواقع أقوم بتركيب ما يقرب من أربعة إلى خمسة أضعاف البيانات الموجودة في ذاكرتي. لم أكن أحصل على ميزة الذاكرة فحسب ، بل ميزة الأعمدة ، ولكن أيضًا الاستفادة من بيانات أكثر بكثير - ما يصل إلى خمسة أضعاف البيانات الموجودة في ذاكرة التخزين المؤقت للذاكرة ، لذلك فهذه تقنية قوية جدًا. مرة أخرى Oracle و SQL Server ، تريد إلقاء نظرة على هذه ، إنها ميزات رائعة حقًا. ومع ذلك ، أعتقد أنني سأفتحه على الأسئلة.
إريك كافانا: حسناً بيرت ، أولاً وقبل كل شيء كنت نكران الذات في كل هذا التعليم الرائع. هل يمكنك التحدث لمدة دقيقة حول ما تفعله يا رفاق؟ لأن لديك بعض التكنولوجيا التمكينية التي يمكن أن تسهل ما كنت تتحدث عنه. تحدث فقط لمدة دقيقة حول ما تفعله يا رفاق ثم دعنا نجعل Dez و Robin في المعادلة هنا.
بيرت سكالزو: نعم ، أعمل في شركة تدعى IDERA. نحن في تكساس ، ومقرنا في هيوستن ، وأنا جالس بالفعل في أوستن الآن لكنني في دالاس. نحن نصنع أدوات قاعدة البيانات ونصنع أدوات قاعدة البيانات لمساعدتك في حل المشاكل. قد تكون هذه المشكلة بسيطة مثل الإنتاجية ، وفي هذه الحالة لدينا أداة تسمى DBArtisan تتيح لك القيام بالمهام الإدارية لقاعدة البيانات الخاصة بك وهي أداة واحدة تتيح لك إدارة 12 نظامًا أساسيًا مختلفًا لقواعد البيانات. يمكنني إدارة SQL Server ، يمكنني إدارة Oracle ، يمكنني إدارة MySQL ، DB2 ، Postgres ، وأنا أستخدم أداة واحدة ، واحدة قابلة للتنفيذ ، وتصميم GUI واحد ومجموعة واحدة متسقة من مهام العمل. نحن أيضًا نصنع أدوات للقيام بالامتثال ، ولدينا أداة تسمى SQL Compliance Manager لمساعدتك في تلبية احتياجات التوافق الخاصة بك. أداة أخرى تدعى SQL Security ، لذلك نحاول أن نجعل الأدوات التي من شأنها أن تساعدك على أن تكون فعالة وفعالة ، وما هو لطيف حقاً إذا ذهبت إلى موقعنا على شبكة الإنترنت ، لدينا مجموعة كاملة من البرامج المجانية هناك ، لذلك إذا لم يكن هناك شيء آخر ، فقم بالتنزيل - أعتقد أن لدينا مثل 20 أو 25 freewares. هناك بعض الأشياء المجانية الجيدة بالفعل مثل وجود SQL Server و Windows Help Check الذي سيبحث بشكل أساسي عما لديك ويخبرك ما إذا كان لديك مشكلات أو أشياء وهو مجاني تمامًا.
إريك كافاناغ: وأنت حقًا نوع من
بيرت سكالزو: بالتأكيد أول الأشياء -
إريك كافاناغ: أنت تتحدث إلى عدم التجانس في السوق اليوم ، كان هناك نوع من المعادلة يناسب الجميع ، وفي الحقيقة أتذكر إجراء مقابلة مع الدكتور مايكل ستونبراكر أثناء عودته في عام 2005 ، حيث استمر دفعة كبيرة تتحدث عن الحكم على حركة قاعدة البيانات الموجهة نحو العمود وكان يتحدث كل شيء عن كيف سيطر نموذج العلائقية مقاس واحد يناسب الجميع لسنوات عديدة ، وكان يتوقع أن يتغير كل شيء ، وكان الصبي على حق أن. الآن لدينا هذه البيئة المتنوعة والمثيرة للاهتمام مع الكثير من الخيارات والفرص المختلفة ، ولكنك تحتاج إلى شخص لإدارة كل ذلك ويبدو لي أن شركتك تركز بشكل كبير للغاية على حل مشاكل الرياضيات ، وبالتالي تكون عامل تمكين لل رأس التجانس ، أليس كذلك؟
بيرت سكالزو: بالتأكيد. أعني أنه سيكون هناك دائمًا DBAs الذين يقولون ، "لا أريد استخدام أداة واجهة المستخدم الرسومية ، أفعل كل شيء باستخدام البرامج النصية" ، كما تعلمون؟ يعتقدون أنهم نوع سوبرمان من ديسيبل ، وهذا أمر جيد ولكن بالنسبة لمعظمنا من الناس ، نريد فقط الانتهاء من العمل و - كما تعلمون ، أنا استخدم Microsoft Word لكتابة مستنداتي. أستخدم Microsoft Outlook للقيام بريدي الإلكتروني. أعني ، لدي أدوات للقيام بالمهام. نحن نبني نفس النوع من المفاهيم ، ونقوم ببناء أدوات لمسؤولي قواعد البيانات ومطوريها لمساعدتهم على التركيز على ما يريدون القيام به وليس على كيفية القيام بذلك.
إريك كافانا: هذا أمر منطقي ، لكن دعني أحيلك إلى خبرائنا ، والناس يشعرون بالحرية في الغوص. لقد تلقينا بضعة تعليقات من الجمهور. ربما ، ديز ، بضعة أسئلة وروبن بضعة أسئلة؟
ديز بلانشفيلد: بالتأكيد. أحد الأسئلة الأولى التي أود طرحها عليك ، بالنظر إلى المدى الهائل من الخبرة التي اكتسبتها ، هل ترى نقطة في وقت قريب عندما يتباطأ أي من هذا؟ أو هل تعتقد أننا بالفعل في نقطة بداية خط النمو المستمر للتغيير؟ أعتقد أن واحدة من أكبر المشكلات التي تواجهها الشركات ، ومن ثَمَّ الأشخاص الذين يحاولون دعم التكنولوجيا التي يتم توفيرها لتلك الشركات لإدارة أعمالهم ، هو أن معدل التغيير كبير جدًا لدرجة أنهم لا يستطيعون مواكبة الجميع تختلف الميزات والبرامج والأنظمة والأطر والبنى الجديدة والكود الجديد ، ثم هل ترى أن معدل التغير الحالي يتباطأ على الفور؟ أعني أنك تتعامل مع هذه المجموعة الواسعة من المنصات مع مجموعة IDERA بأكملها ، هل سنتباطأ قريبًا أم هل نحن في قطار الشحن السريع المجنون لفترة طويلة حتى الآن؟
بيرت سكالزو: أعتقد أننا في الـ 20 في المائة الأولى من منحنى النمو هذا ولدينا طريق طويل لنقطعه وهناك أمران يدفعان به. التكنولوجيا لا تزال تتطور. لقد ذكرت بعض أنواع الذاكرة الجديدة التي ستظهر ، وهذا سيكون رائعًا. ستحصل سامسونج على محرك أقراص فلاش بسعة 20 تيرابايت هنا في وقت قريب. هذا سوف يغير الأشياء. لدينا كل قواعد بيانات NoSQL وقواعد البيانات السحابية ، هذا سيستمر. الشيء الوحيد المضحك ، هو أنني عندما أنظر إلى قواعد البيانات مثل Oracle و SQL Server وبعض القواعد الأخرى ، فإنها لم تعد قواعد بيانات علائقية بعد الآن. يمكنني وضع بيانات غير منظمة في Oracle مع الحفاظ على توافق ACID. إذا كنت قد أخبرتني أنه قبل 20 عامًا ، قلت للتو إنك كنت تتناول المخدرات.
ديز بلانشفيلد: نعم ، نعم ، إنها رائعة. حسنًا ، حتى الآن تلك المحركات التي لديها رؤوس متخصصة لطيفة جدًا مثل GIS ، أفضل من القدرة المحلية الآن. لقد قدمت بعض التعليقات الرائعة حول التحديات التي تواجه DBAs وأوقات مختلفة من DBAs التي نأمل أن نرى في جميع أنحاء المكان ، ولكن ما هو شكل العالم مع هذا النوع من طبقة العمل الذي تتعامل معه؟ أعني ، هؤلاء هم الأشخاص الذين يستخدمون الأنظمة الأساسية المختلفة من مدير التشخيص الخاص بك ، إلى أدوات الجرد ، وصولاً إلى رفع القيود ، وكيف تتعامل DBAs مع هذا التغيير ، وكيف تعرف نوعًا ما؟ ، ماذا يفعلون بأدواتكم للتعامل مع هذا التحول المهم في المشهد؟
بيرت سكالزو: حسنًا ، سأعود إلى ما يقرب من 20 عامًا ، ثم سأقول إن DBAs يحلون دورًا محددًا للغاية في المنظمة. وهي تعمل عادةً مع نظام أساسي واحد لقاعدة البيانات ، وربما اثنين ، وقد تمكنت من إدارة عدد صغير نسبياً من قواعد البيانات. الآن بسرعة إلى الأمام ومسؤول قاعدة البيانات ، وقال انه في الواقع سوف تعرف 10 منصات قاعدة البيانات. إنه يدير ، وهذه ليست مزحة ، في بعض الحالات الآلاف من قواعد البيانات ؛ هذا أكثر على عالم SQL Server أو عالم MySQL. ولكن لا يزال في عالم أوراكل يمكنهم إدارة مئات قواعد البيانات. وبالتالي لديهم جميع هذه الميزات الجديدة التي ظهرت ، لديهم كل هذه المنصات الجديدة ، ولديهم كل قواعد البيانات هذه التي يتحملونها. إنهم يبحثون عن أدوات لتمكين إنتاجيتهم وأيضًا لمساعدتهم على تعلم بعض الأشياء.
سأعطيك مثالًا - إذا أردت تقسيم جدول ، فهو بناء جملة غامض جدًا ، وإذا أردت تقسيمه إلى قسم ، فإن بناء الجملة يصبح أكثر صعوبة. أنا أعرف ما أريد القيام به ، أريد إنشاء دلاء. إذا كان لديّ أداة مثل DBArtisan التي تقول: "مهلاً ، إليك شاشة جميلة تتيح لك التركيز على ما تحاول القيام به بدلاً من الطريقة التي تحاول القيام بها بها ، وأو بالمناسبة ، ادفع أظهر زر SQL عندما تنتهي ، وسنعرض لك ما هي لغة SQL بحيث يمكنك البدء في تعلم هذه اللغة وإتقانها. "
يجد DBAs أن الأدوات التي تساعدهم على إنجاز المهمة ، ولكنها تساعد أيضًا في تعليمهم كل هذه الأشياء الجديدة التي يستخدمونها وسيكون الشيء نفسه صحيحًا - دعنا نقول إنني رجل Oracle وأذهب إلى MySQL وأقول ، "حسنًا ، قم بإنشاء قاعدة بيانات ، DBArtisan. الآن أرني SQL لأنني أتساءل كيف يكون إنشاء قاعدة بيانات على MySQL وتعلمت فقط بناء الجملة. "وبالتالي فإننا لا نساعدهم فقط على العمل عبر قاعدة البيانات ، بل نعلمهم أيضًا عبر قاعدة البيانات.
Dez Blanchfield: يصبح الأمر أكثر إثارة للاهتمام عندما تخرج إلى بعض من أكثر حداثة - أو ليس أكثر حداثة ، هذا ليس من العدل أن نقول - ولكن ذات مرة قاعدة بيانات هي قاعدة بيانات. في هذه الأيام ، أرى كل شيء تتحدث عنه هناك مع التحدي الإضافي المتمثل في كومة التقنية التي نراها تقليديًا من البائعين ونوع من المصادر المفتوحة فيها وأيضًا أنها جيدة. لا يقتصر الأمر على التعامل مع محركات قاعدة البيانات ولغات الاستعلام ، بل يتعاملون أيضًا مع أنواع البيانات ، الهيكلية وغير المنظمة ، كما تعلمون ، التحدي المتمثل في الاضطرار إلى التعامل مع كل شيء بدءًا من الطرف البعيد لطيف HDFS متعدد البايتات البيئة لحاويات صغيرة جدا ، وملفات الحزمة وتنسيقات ملفات السجل المختلفة.
وأعتقد أن هذا شيء الآن نراه حيث لا يوجد أي إنسان ، بغض النظر عن مقدار من الرجل الخارق ، المرأة الخارقة ، بغض النظر عما قد يعتقدون أنهم ، هم جسديا ، لا يستطيعون التعامل عقليا مع هذا المعدل من التغيير و حجم الاختلافات. أعتقد أن مجموعة الأدوات التي تقدمها الآن ستصل إلى نقطة حيث ستكون في مجموعة افتراضية تقريبًا بعدة طرق بحيث لا يمكننا تشغيل بيئات قاعدة البيانات التي حصلنا عليها بدونها لأننا فعليًا لا يمكن رمي العديد من الجثث عليهم. لقد استمتعت حقا العرض التقديمي الخاص بك. سأنتقل إلى الدكتور روبن بلور ، أنا متأكد من أنه لديه الكثير من الأسئلة التي يجب عليك طرحها عليك.
روبن بلور: حسنًا. حسنًا ، لدي بالتأكيد أسئلة. بيرت ، لا أعرف إلى أين أنت ذاهب - لقد أجريت محادثة مثيرة للاهتمام بالفعل قبل يومين ، حيث بدأ شخص ما في إخباري بأحدث حماية لبيانات DU ، ويبدو لي من خلال ما قالوه إنه لا يصدق قاسية من حيث الأشياء التي أصروا عليها. تساءلت عما إذا كنت قد نظرت بالفعل إلى ذلك ؛ هل هو شيء تعرفه؟
بيرت سكالزو: بالتأكيد. بلى.
روبن بلور: 2016 ، حسنًا ، أخبرنا بذلك.
بيرت سكالزو: وأنا بالفعل -
روبن بلور: مثيرة للاهتمام للغاية.
بيرت سكالزو: لقد عملت بالفعل لفترة من الوقت لصالح بائع الفلاش ، وفي منطقة قاعدة البيانات الخاصة بهم ، ساعدهم في بناء منتجات فلاش لقواعد البيانات ، وأستطيع أن أخبرك أن الوحشي يسير على طول الطريق. ما أقصده هو أنه إذا كنت تتذكر شريحة واحدة الخاصة بي ، فقلت في بعض قواعد البيانات أنها ستقوم بالتشفير ولكنها تضعها في ذاكرة الخادم وفي بعض قواعد البيانات تشفير - لا يزال يتم تشفيرها في ذاكرة الخادم ، يتم فك تشفيرها فقط عند يتم إرسالها إلى العميل. حسنًا ، ستجد أيضًا بعضًا من هذه المعايير الحكومية ، خاصة وزارة الدفاع أو الجيش هنا في الولايات المتحدة ، كما أنها تتجه إلى مستوى الفلاش ولا تريد أن تعرف فقط أنك تدعم التشفير وفك التشفير في أجهزتك ، ولكن إذا سرق شخص ما الرقائق التي - كما تعلمون ، أخرجها من الشيء ، من الخادم الخاص بك ، فإن ما يوجد هناك مشفر ، وعلى الرغم من أن لديهم سعة تخزينية ، فلن يكونوا كذلك على طول الطريق إلى الفعلي - ليس إلى جزء فلاش نفسه ولكن إلى رقائق الفردية. لقد أرادوا أن يعرفوا هذه الرقاقة بالشريحة ، فكل شيء مشفر.
روبن بلور: واو. أعني أن هناك الكثير من الأشياء التي - كما تعلمون ، أعتقد أن شريحة واحدة أو شريحتين فقط عرضتموها حول هذا الأمر ، لكنه كان شيئًا ، سيناريو أعتقد أنه مثير للاهتمام حقًا. على سبيل المثال ، يجب أن يكون تنقيح المعلومات أكثر ذكاءً من إخفاء الحقول المختلفة لأنه خاصة مع التعلم الآلي في الوقت الحاضر ، يمكنك القيام بأشياء استنتاجية تسمح لك بتصفح المعلومات التي لا يمكن أن تظهر لك سابقًا.
إذا كنت تحاول الحماية ، دعنا نقول المعلومات الصحية ، فهذه قواعد صارمة للغاية في الولايات المتحدة فيما يتعلق بالمعلومات الصحية ، ولكن يمكنك فعلاً ، باستخدام أساليب مختلفة للتعلم الآلي ، يمكنك في الغالب معرفة من هو شخص ما المعلومات الطبية في الواقع هو. لقد تساءلت فقط عما إذا كان لديك أي شيء تقوله حول هذا الموضوع لأنهم يعتقدون جميعًا أنه مجال مثير للاهتمام.
بيرت سكالزو: نعم ، بالتأكيد ، وأنا فقط استخدم هذا كمثال ، أنا لا أحاول أن أقول أن قاعدة بيانات واحدة أفضل من أخرى ، ولكن هذا مثال جيد للغاية على ما طلبته للتو. في Oracle ، إذا لم يُسمح لي برؤية صف من البيانات على سبيل المثال ، لا يُسمح لي برؤية السجل الطبي لجون سميث. في Oracle ، إذا قلت ، "حدد هذا السجل" ، فسوف يتم حظره أو يُسمح لي برؤية ما يُسمح لي برؤيته وسيتم تنقيحه. وإذا قلت ، "حدد نجمة الحساب من الجدول حيث يساوي جون سميث" ، سأحصل على صفر.
في SQL Server ، يمكن أن تفعل التنقيح ولكن لديها بعض الثقوب. إذا قلت ، "حدد حساب نجمة من الجدول حيث يساوي جون سميث" ، فسأسترجع واحدًا ، لذلك أعرف أن هناك جون سميث. واحد أكثر أمانا من الآخر. الآن أتوقع منهم إصلاح ذلك ، فهم يلعبون دائمًا قفزة قفزة مع بعضهم البعض. ومرة أخرى ، لا أحاول التمييز بين قواعد البيانات بخلاف إظهار مثال على - ما الذي نتحدث عنه الآن ، شيء بسيط مثل تحديد الحساب يجب أن يتم تخفيضه أيضًا من خلال التنقيح ، على الرغم من الناحية الفنية يتحدث ، لا يوجد شيء يجري تنقيحه غير وجود الصف.
روبن بلور: نعم ، صحيح. هذا نوع من الاهتمام. أعني ، سؤال عام آخر لأنني لا أملك الكثير من الوقت ، يتعلق بالتحسينات. أعني أنك كنت في واحدة حيث أعرف أنك كنت تعرض لنا أمثلة على نتائج الاختبارات المختلفة التي قمت بتشغيلها - هل تعتقد أن قواعد البيانات التقليدية ، دعنا نسميها قواعد البيانات السائدة ، SQL Server و Oracle ، هل أعتقد أنهم سيبقون قبل الانتهاء؟ أو هل تعتقد أنها ستقع في الواقع من قبل واحد أو آخر من أنواع مختلفة من الاضطرابات في السوق التي تعمل حقا بالنسبة لهم؟ ما هو رأيك؟
بيرت سكالزو: لدي رأي وهو - كما تعلمون ، سأقول مرة أخرى أنه رأيي - مايكروسوفت على سبيل المثال ، في حقبة ما بعد بالمر ، أثارت إعجاب الجحيم الحي بي. أعني أن قاعدة البيانات الممتدة هذه تحصل على SQL Server على Linux ، والحصول على .NET على Linux ، والحصول على PowerShell على Linux ؛ لا أعتقد أن بائعي قواعد البيانات التقليديين سيتخلفون عن الركب. أعتقد أنهم قرروا ، "مهلا ، دعوا اللاعبين الجدد ، الشركات الناشئة تحدد شيئًا ما. اسمح لهم باكتشاف ماهية الشرح وكيف ينبغي أن يكون الكمال ، وبمجرد قيامهم بجميع البحوث والتطوير ، نحن نعرف بالضبط ما يريده المستخدمون ، والآن دعونا نضيف المشاركة إلى Oracle. "أعتقد أنهم أصبحوا أذكياء و القول ، "مهلاً ، أن تكون في المرتبة الثانية أو الثالثة ليس بالأمر السيء عندما تكون اللاعب المهيمن لأن الناس لن يهاجروا منك."
روبن بلور: نعم ، أعني أنها استراتيجية تم استخدامها. أعني أن شركة IBM اعتادت أن تفعل ذلك وكل هذا - بالنسبة إلى نطاقات منتجاتها بأكملها ، وهي جيدة بشكل معقول حتى يأتي شخص ما بشيء خارج الجدار تمامًا لم يفكر به أحد من قبل ، ولكن لا يمكنك التخطيط له ضد ذلك على أي حال.
أسئلة من الجمهور ، اريك؟
إريك كافاناغ: نعم ، لكنك حصلت على وقت أعتقد أنه لمرة واحدة فقط وأنا أعلم أن بيرت يجب أن يركض. كان هناك شيء هنا - حسنًا ، هندسة المشاركة على Oracle 12c هي أن هذا مؤشر على - أو ما هو ذلك في رأيك ، ما الذي يحدث هناك في رأيك؟
بيرت سكالزو: حسنًا ، تستوعب شركة أوراكل أو تقدم كل ما توفره جميع موردي قواعد البيانات الأخرى. على سبيل المثال ، يمكنني وضع بيانات غير منظمة في Oracle. لا أعرف كيف يمكنك وضع بيانات غير منظمة ومن ثم نسميها قاعدة بيانات علائقية ، لذلك لا معنى لها ، لكن يمكنك ذلك. والآن تضيف Oracle التقسيم ، لذلك تقول Oracle ، "هل تعرف ماذا؟ أياً كان ما يريده السوق ، سنقدم عرض قاعدة بياناتنا لأن السوق يريد ما يريده السوق ونريد تقديم الحل ، نريدهم أن يبقوا معنا ".
أعتقد أنك سترى عناصر إضافية. لن أتفاجأ برؤية مجموعات قاعدة بيانات تشبه Hadoop ليس في حامل أوراكل أو مجموعة تطبيقات حقيقية ، ولكن بشكل أساسي في أكثر من مجموعات تقليدية من نوع Hadoop تقوم بهذا التقسيم. ولذا أعتقد أنك ستكون قادرًا على نشر قاعدة بيانات مثل Oracle مثلك مثل Hadoop ، وسوف يستمر هذا النوع من الاتجاهات. هؤلاء الباعة الكبار في قواعد البيانات ، يجنيون مليارات الدولارات ولا يريدون أن يخسروا سوقهم ، لذلك هم على استعداد للتكيف مع أي شيء أو اعتماد أي شيء.
إريك كافانا: حسنًا ، كما تعلمون ، إنه أمر مضحك لأنني تابعت بائعي المصادر المفتوحة لبعض الوقت وتساءلت عن ذلك طوال الوقت الذي سيكون له تأثير كبير على تقنية الأبواب المغلقة التقليدية لفترة من الوقت. من المؤكد أنني شعرت بأن البائعين ذوي المصادر المفتوحة كانوا يحققون بعض التقدم الجاد ، والآن وأنا أنظر إلى السوق أرى نوعًا من ما تقوله ، وأن اللاعبين الكبار قد قاموا بعملهم في الرياضيات ، وشحذوا أقلامهم واكتشفوا كيف يمكنهم نسج الكثير من هذه الأشياء في بنياتهم. سواءً كان IBM أو Oracle أو SAP - كنت فقط في مؤتمر SapphireNow الشهر الماضي وتفاخر ستيف لوكاس ، الذي يرأس نصف تلك الشركة ، بأن SAP يدمج الآن في نظامها السحابي HANA ، أي مكونات مفتوحة المصدر أكثر من أي من مكوناتها المنافسين. إذا قمت بالرياضيات في ذلك ، فهذا بيان مثير للإعجاب ويخبرني أن اللاعبين الكبار لن يذهبون إلى أي مكان قريبًا.
بيرت سكالزو: لا ، أنا أراهن بأموالي على كليهما. أعني إذا نظرت ، كان سعر سهم Microsoft مؤخرًا حوالي 50 دولارًا ، وكما تعلمون ، كان قبل 25 عامًا فقط. ولم تقم بمضاعفة سعر سهمك في فترة قصيرة ما لم تفعل أشياء جيدة ، تعرف ، من القيام بكل شيء بدءًا من Windows 10 مجانًا للسنة الأولى وحتى جميع الأشياء الذكية الأخرى التي يقومون بها ، أعتقد أن ميزة قاعدة البيانات الممتدة هذه هي مجرد اعتيادية. أعتقد أن ما سيحدث هو أن الكثير من الناس سينتهي بهم المطاف في أزور ، وليس بشكل مباشر ، وليس كما قالوا ، "دعنا ننتقل إلى قاعدة البيانات الخاصة بي إلى أزور." هناك باستخدام هذه الميزة الجديدة لقاعدة البيانات الممتدة ، وبالتالي فإن اعتماد Azure سوف يزداد.
إريك كافانا: حسنًا ، هذا أحد الاتجاهات السائدة في السوق والتي يمكنني رؤيتها ، حتى على جهاز Mac. بينما تذهب في جهاز Mac لحفظ بعض المستندات ، فإنهم الآن - وأنظمة Macs الأحدث فقط تتبع السحابة ، أليس كذلك؟ أقصد ، هناك الكثير من المعنى في تلك الاستراتيجية وأنظر إليها أيضًا وأذهب إليها ، "حسنًا يا شباب ، تحاول أن تغريني جزءًا تلو الآخر في البيئة السحابية الخاصة بك ، ثم في يوم من الأيام عندما أرغب في مشاهدة بعض الأفلام إذا انتهت صلاحية بطاقتي الائتمانية سأواجه مشكلة. "
بيرت سكالزو: نعم ، لكنك تفعل ذلك على Facebook.
إريك كافانا: نعم. هذا صحيح.
بيرت سكالزو: لقد وضعت كل شيء على Facebook.
إريك كافانا: حسنًا ، ليس كل شيء.
بيرت سكالزو: لا ، أقصد -
إريك كافانا: نعم ، تابع.
بيرت سكالزو: هذه الاتجاهات الاجتماعية تصل إلى الشركات. الآن لا يزال لدى الشركات الكثير من الأشياء الأخرى التي يتعين عليها القيام بها ، لكنها ترى هذه الاتجاهات وتقوم بنفس أنواع الأشياء. لا أرى إما Oracle أو Microsoft يرحل. في الحقيقة ، سأقوم بشراء الأسهم في كل مرة يحدث فيها تراجع.
إريك كافانا: نعم بالفعل. حسنا الناس ، انتقل إلى idera.com ، IDERA دوت كوم. كما قال بيرت ، لديهم مجموعة كاملة من الأشياء المجانية هناك ، وهي واحدة من الاتجاهات الجديدة في السوق - تمنحك بعض الأشياء المجانية لتلعب بها ، لتحصل على مدمن مخدرات ، ثم تذهب لشراء الأشياء الحقيقية.
الناس ، وكانت هذه تكنولوجيا ساخنة أخرى. شكرا على وقتك اليوم ، بيرت ، ديز بالطبع ، وروبن كذلك. سنتحدث إليكم الأسبوع المقبل ، أيها الأشخاص ، والكثير من الأشياء التي تحدث. إذا كانت لديك أية أفكار ، فلا تتردد في إرسال بريدك الإلكتروني حقًا ،. سنتحدث إليكم في المرة القادمة ، اعتني. مع السلامة.