كالدو..
الاعلامية شادن العوران
متابعين صفحة كالدو الكرام ؛ سوف اتحدث عن مصطلح البيانات الضخمة "Big Data" بشكل مفصل، ولمعرفة المزيد يمكنكم متابعه قراءة المقال.
فما هو مصطلح "Big Data" ؟؟ يشير ذلك مصطلح البيانات الضخمة "Big Data" إلى البيانات الكبيرة جداً أو السريعة أو المعقدة بحيث يصعب أو يستحيل معالجتها باستخدام الطرق التقليدية. إذاً "Big Data" هي مجموعة من البيانات الضخمة في الحجم، التي تتولد بسرعة غير ثابتة وتزداد وتنمو بشكل كبير بمرور الوقت.
معلومات رئيسية حول البيانات الضخمة :- - الحجم والتنوع والسرعة والتغير هي بعض خصائص البيانات الضخمة. - خدمة العملاء المحسّنة، والكفاءة التشغيلية الأفضل، واتخاذ القرار الأفضل هي بعض مزايا ال Bigdata. - البيانات الضخمة هي كمية كبيرة من المعلومات المتنوعة التي تصل بأحجام متزايدة وبسرعة أعلى من أي وقت مضى. - يمكن تنظيم البيانات الضخمة (غالبًا ما تكون رقمية، ويسهل تنسيقها وتخزينها) أو غير منظمة (شكل أكثر حرية، وأقل قابلية للقياس الكمي) . - حيث يمكن أن تكون البيانات الضخمة لعدة انواع وهن كالتالي :-
1) بيانات منظمة 2) بيانات غير منظمة. 3) بيانات شبه منظمة.
- تشمل أيضا المعلومات التي يتم جمعها طواعية من الأجهزة الإلكترونية والتطبيقات الشخصية، من خلال الاستبيانات، وشراء المنتجات، وعمليات تسجيل الوصول الإلكترونية... وغيرها من المصادر.
- غالبًا ما يتم تخزين ال Big Data في قواعد بيانات الكمبيوتر ويتم تحليلها باستخدام برنامج مصمم خصيصًا للتعامل مع مجموعات البيانات الكبيرة والمعقدة.
كما قسم الباحثون أنواع البيانات الضخمة" Big Data "الى 3 أنواع كالتالي :- 1) منظمة 2) غير منظمة 3) شبه منظمة.
وسافيدكم بشرح مفصل لكل نوع من أنواع للبيانات الضحمة (( Big Data )) :- 1) منظمة :- - تمكنت الشركات الكبرى من تطوير تقنيات ناجحة للعمل مع مثل هذا النوع من البيانات (( حيث يكون التنسيق معروفا مسبقا )) ويمكن استخلاص القيمة منه .
- الحجم الي يمكننا التعامل معه هو اليوم : عدة "زيتابايت :zettabyte" - مثال على البيانات الضخمة :- جداول الموظفين ؛ يضم (( أسمائهم ،جنسهم ، العمر ،تاريخ مباشرة ،القسم ...الخ ))
2) غير منظمة :- - تصنف بيانات ذات شكل أو بنية غير معروفة على أنها بيانات غير منظمة.
- بالإضافة إلى الحجم الضخم، فإن البيانات غير المنظمة تشكل تحديات متعددة من حيث معالجتها لاستخلاص القيمة منها .
- من الأمثلة النموذجية على البيانات غير المهيكلة: مصدر بيانات غير متجانس يحتوي على مجموعة من الملفات النصية البسيطة والصور ومقاطع الفيديو.
- مثال على البيانات غير المنظمة : نتائج البحث في غوغل "Google search"
3) شبه منظمة:- - يمكن أن تحتوي البيانات شبه المنظمة على كلا شكلي البيانات. -مكننا أن نرى البيانات شبه المهيكلة كمنظومة في شكل ولكنها في الواقع غير معروفة (( على سبيل المثال : تعريف جدول في نظام إدارة قواعد البيانات )).
- مثال على البيانات شبه المنظمة :- سجل مراكز الاتصال call center log ولا بد للبيانات الضخمة ان يكون لها مصادر وأبرزها :-
- تعد البيانات هي المادة الخام لموضوع " Big Data " لذلك يجب علينا معرفة المصادر التي تأتي منها البيانات .
- مصادر البيانات لا تحصى ولكن سأختصرها بأهم أربعة مصادر للبيانات وهي :-
- البيانات التي تنتجها المؤسسات والشركات والمنظمات .
- البيانات التي ينتجها الانسان . - البيانات التي ينتجها الآلات والمعدات . - البيانات التي تنتجها مراكز البحوث والمؤسسات التعليمية .
ولكل نوع من المصادر سابسطها لكم للبيانات كالآتي :- أولا :- البيانات التي ينتجها الانسان :- - هي جميع البيانات والمعلومات والمستندات والملفات الموجودة على جهاز الحاسوب الخاص بالشخص أو الهاتف المحمول ويتضمن :-
أ- الصور ومقاطع الفيديو ب- المقاطع الصوتية وتطبيقات الأجهزة الذكية المستخدمة . ج – مساهمات الانسان على شبكة الانترنت من البريد الالكتروني و المفضلات والمشاركات والمحادثات ومشاركات الصور والفيديوهات والتعليقات لذلك فان غاليبة هذه البيانات غير منظمة .
ثانيا :- البيانات التي ينتجها الآلات والمعدات :- - هي جميع البيانات التي يتم إنتاجها من الآلات دون تدخل مباشر من الانسان وتشمل هذه البيانات :- أ- بيانات أجهزة المراقبة وأجهزة الاستشعار ب- بيانات كاميرات المراقبة وأجهزة التحكم بالدخول المصرح . ح – البيانات التي تلتقطها وتسجلها عبر الأقمار الصناعية وأجهزة الرصد المختلفة .
ثالثا :- البيانات التي تنتجها مراكز البحوث والمؤسسات التعليمية ، وتشمل :- - المجلات والدوريات العلمية والبحوث والرسائل الجامعية . - المواضيع ووصف المساقات . -العمليات التعليمية والمشاريع وقصص النجاح والتطورات . - الكتب العلمية والمنشورات والأوراق البحثية و التوصيات والمشكلات .
ومن أشهر الأمثلة على " Big Data " فمنها :- أ - شبكات التواصل الاجتماعي :- تشير الاحصائيات الى ان أكثر من 500 تيرابايت من البيانات التي تدخل الى فيسبوك يوميا ، وتأتي هذه البيانات على شكل صور وفيديوهات وتعليقات وهاشتاق ، وحتى منشورات مستخدمين ...الخ
ب – الطائرات :- تشير الاحصائيات الى ان محرك واحد لطائرة ركاب تقليدية ينتج أكثر من 10 تيرابايت من البيانات كل 30 دقيقة . ج- موقع امازون :- تملك أمازون أكبر 3 قواعد بيانات لينوكس في العالم والتي تصل سعتها إلي 7.8، 18.5 و 24.7 تيرابايت.
وتكمن أهمية ال Big Data فيما يلي :- 1 - تحسين آلية عمل الشركات (( تستخدم في أنظمتها لتحسين العمليات وتقديم خدمة عملاء أفضل وإنشاء حملات تسويقية موجهة واتخاذ إجراءات أخرى يمكنها في النهاية زيادة الإيرادات والأرباح )).
2 - تحسين نتائج عمليات التسويق (( استخدامها لتحسين التسويق والإعلان والعروض الترويجية من أجل استهداف العملاء بحسب رغباتهم وسلوكهم الاستهلاكي )) .
3- البحث العلمي وتحسين النتائج الطبية (( يستخدم الباحثون الطبيون لتحديد علامات المرض وعوامل الخطر ، ويستخدمها الأطباء للمساعدة في تشخيص الأمراض والحالات الطبية لدى المرضى و توفر لمنظمات الرعاية الصحية والوكالات الحكومية معلومات حديثة دائماً عن تهديدات الأمراض المعدية أو تفشيها )) .
4- شركات النفط (( صناعة الطاقة شركات النفط والغاز على تحديد مواقع الحفر المحتملة ومراقبة عمليات خطوط الأنابيب )) .
وهنا يخطر ببالنا كيف تعمل البيانات الضخمة " Big Data " ؟؟ فيما يلي توضيح لمبدأ عمله :- أولا :- الدمج (( حيث تجمع البيانات من العديد من المصادر والتطبيقات المتباينة من عدة أشكال أو مصادر )) نذكر منها :- - التعليقات التي تتم مشاركتها بشكل عام على الشبكات الاجتماعية ومواقع الويب . - البيانات التي جمعها من الأجهزة الالكترونية والتطبيقات الشخصية . - الاستبيانات ، وشراء المنتجات . - عمليات التسجيل الوصول الإلكترونية . - المستشعرات و المدخلات الأخرى في الأجهزة الذكية .
ثانياً :- الإدارة و التخزين (( غالباً ما يتم تخزين ال Big Data في قواعد بيانات الكمبيوتر ويتم تحليلها باستخدام برنامج مصمم للتعامل مع مجموعات البيانات الكبيرة والمعقدة ،تتخصص العديد من شركات البرمجيات كخدمة "SaaS " في إدارة البيانات هذا النوع من البيانات المعقدة .
ثالثا ً:- التحليل (( غالبا ما تستخدم الشركات تقييم البيانات الضخمة خبراء لتحويل هذه البيانات الى معلومات قابلة للتنفيذ ، باستخدام التقنيات عالية الأداء مثل الحوسبة الشبكية أو التحليلات في الذاكرة.
ففي كلتا الحالتين ، تعد تحليلات البيانات الضخمة هي الطريقة التي تكتسب بها الشركات قيمة ورؤى من البيانات حيث تغذي البيانات الضخمة مساعي التحليلات المتقدمة اليوم مثل الذكاء الاصطناعي (AI) و التعلم الآلي.
رابعا ً:- اتخاذ قرارات ذكية قائمة على البيانات .
والآن فما هي مزايا و عيوب البيانات الضخمة – Big Data والتي تتمايز بما يلي ؟؟؟ أ- كبر الحجم التخزيني للبيانات . ب- الحاجة لوجود بيانات أكثر من العملاء . جـ - كمية البيانات الشخصية للعملاء التي تتطلب قدرا عاليا من الحماية . د – زيادة الحمل والضوضاء وتداخل البيانات والمعلومات . هـ - الوقت اللازم لتنسيق وترتيب البيانات لتصبح قابل للاستفادة. و- تغير تقنية البيانات الضخمة بوتيرة سريعة جداً. ز- تضاعف حجم البيانات . ح_ تخزين البيانات الكبيرة بالنسبة للشركات . خ - الحفاظ على الوقت وتوفير الجهد .
نصيحة مني أحذر؛ فقد تسرق البيانات الضخمة وظيفتك فلذلك جمع بياناتك بطريقة صحيحة وخزنها باستخدام أكثر من مكان واعمل نسخ للبيانات واحفظها بعلامتك حتى لا تخترق هويتك أوبصمة عملك وخصوصية بياناتك.