كيف أصبح عالم بيانات؟

ذكرنا مسبقاً أن علم البيانات هو مسار وظيفي جديد نسبياً يجمع بين ثلاثة مجالات وهم علم الحوسبة أو المعلوماتية، وعلم الرياضيات والإحصاء والخبرة الموضوعية. 

إذاً من هو عالم البيانات؟

هناك من عرّف عالم البيانات على أنه شخص يجيد الإحصاء أفضل من أي مهندس برمجيات وأنه يجيد هندسة البرمجيات أفضل من أي خبير في الاحصاء.من أهم وأول الخطوات التي عليك اتباعها لتصبح عالم بيانات هو التسجيل في مساق مقدمة لعلم البيانات وتعلم الآلة.ثم البحث عن الحافز الخاص بك لتتعلم علم البيانات. بالنسبة لي أنا كنت شغوفا بفهم وتحليل سلوكيات المستخدمين على مواقع التواصل الإجتماعي وحتى الآن لازلت شغوفا بذلك. هذا الشغف ساعدني كثيرا أثناء الدراسة. لذا أنا أشجعك على البحث عن حافز يقويك أثناء دراستك.

 

فيما يلي سنعرض المهارات التحليلية:

  • الرياضيات وخاصة الجبر والتفاضل والإحصاء:

في البداية أنت فقط تحتاج إلى أساسيات الجبر والجبر الخطي وكذلك التفاضل، أما بالنسبة للإحصاء فأنت تحتاج إلى فرعي الإحصاء وهما الإحصاء الوصفي و الإحصاء الاستنتاجي خاصة نظرية الإحتمالات. وكلما تتعمق في الرياضيات عامة والإحصاء خاصة كلما كان أفضل.

  • البرمجة خاصة لغة البايثون و ار (Python & R)

هذه الأيام لغة بايثون هي الأكثر شيوعا بين علماء البيانات ومهندسي الذكاء الإصطناعي وأهم المكتبات التي تحتاجها هي:

NumPy, SciPy, Pandas, Matplotlib, SciKit-Learn 

أما بالنسبة للغة البرمجة ار فهي تحتوي على أكثر من 5000 مكتبة وهي تتميز في تصور البيانات أو data visualization.

لكن بايثون أكثر شويعا هذه الأيام بسبب أنها أسرع من ار وكلاهما لديهم مكتبات قوية ومجتمع مطورين قوي.

  • إدارة قواعد البيانات

من غير المنطقي أن تعمل بالبيانات دون أن يكون لديك خلفية عن التعامل مع لغات ادارة البيانات مثل SQL و NoSQL

  • تعلم الآلة والتعلم العميق

في هذا المساق سنتحدث عن تعلم الألة والتعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف وكذلك التعلم العميق

  • تصور البيانات أو عرض البيانات في صورة مرئية

لا أحد يستطيع فهم جدول به ملايين السجلات من البيانات لذا نقوم بعرض البيانات الضخمة في صورة مرئية حتى يتسنى لنا اكتشافها وتحليلها. في هذا المساق سنتعرض لطرق مختلفة لعرض البيانات.

  • عالم البيانات يحتاج أن يكون مُلِـما بمجال الأعمال الذي يخدمه

بمعنى إن كان يعمل في مجال يتعلق بمجال الإتصالات فعليه أن يكون ملما بمجال الإتصالات، وان كان يعمل بمجال الزراعة فإنه يحتاج إلى أن يكون ملِما بالزراعة والتربة وهكذا. لكن لا تقلق معظم المجالات تستطيع اكتساب معرفة جيدة بها خلال عدة أشهر.

 

مسار علم البيانات أو دورة حياة عالم البيانات تتلخص في الأتي:

  • جمع البيانات
  • تنظيف البيانات وتحضيرها
  • استكشاف البيانات وعرضها
  • عمل التحليلات التنبؤية
  • بناء نماذج تعتمد على البيانات

في هذا المساق سنقوم بازالة الغموض عن كل مرحلة من هذه المراحل من جمع وتنظيف البيانات ثم استكشافها وعمل تحليلات تنبؤية وبناء منتجات تعتمد على علم البيانات. كذلك سنفرق بين الذكاء الإصطناعي والتعلم الآلي وسنعمل على ضرب بعض الأمثلة لذلك.

م. علي سعد – مساعد ومشرف مساق علم البيانات‎

شارك المعرفة

ما هو علم البيانات؟ وأين تتواجد البيانات؟

البيانات هي كميات هائلة من المعلومات المسجلة رقميا عنّا وعن العالم. هذه المعلومات تأتي من عدة مصادر من أهمها وسائل التواصل الإجتماعي مثل الفيس بوك ولينكد ان وتويتر، كذلك تأتي من بعض التطبيقات مثل أوبر وامازون، بالإضافة إلى وجود إنترنت الأشياء الذي سيجعل الكثير من الأجهزة متصلة بالإنترنت. ويقدر أنه بنهاية العام القادم سيكون هناك أكثر من 40 مليار جهاز متصل بالانترنت.

هذه هي البيانات، إذا ما هو علم البيانات؟

علم البيانات لديه الكثير من التعريفات. لكن لابد أن تعرف أن علم البيانات يتضمن ثلاثة أنواع من التحليلات:

تحليل وصفي وتحليل تنبئي و تحليل إلزامي.

التحليل الوصفي هو استخراج معرفة من كميات هائلة من البيانات، وعرض تلك المعرفة من خلال عروض و رسومات سهلة للمستخدم.

التحليل التنبئي هو استخدام البيانات الموجودة حاليا للتنبؤ بالمستقبل. مثل استخدام بيانات لمرضى مصابين بورم ما إذا كانت هذه الأورام حميدة أم خبيثة. حيث يمكننا استخدام هذه البيانات للتنبؤ بأنواع المرض للمرضى الجدد.

التحليل الإلزامي هو بناء منتجات تعتمد على التحليلات الوصفية والتنبئية. 

مثل تطبيق fitbit: يستخدم التحليل الوصفي للبيانات عن الحركة الجسدية ويقوم بعرضها للمستخدم. بهذا الشكل هو يقع تحت التحليل الالزامي للبيانات.

لماذا الضجة حول علم البيانات؟


رغم أن الكثير من التقنيات التي يعتمد عليها علم البيانات موجودة منذ أكثر من 20 عاما. إلا أن مفهوم علم البيانات ظهر حديثا. وأهمية علم البيانات في السنوات الأخيره سببها تضخم البيانات و الزيادة المفرطة في الإمكانيات الحاسوبية، وكذلك إمكانيات التخزين الحاسوبية التي يتم الوصول إليها بسهولة وبأسعار قليلة. كل هذه الأسباب أدت إلى زيادة علم البيانات والطلب على علماء البيانات في السنوات الأخيرة.

عالم البيانات يستخدم النظريات العلمية لاستخراج الأفكار والمعرفة من البيانات. لذا نحن نراه فن. لأنه يدمج بين العديد من المجالات المختلفة.

يمكننا تلخيص هذه المجالات في ثلاثة مجالات رئيسية:

مجال المهارات المعلوماتية

مجال علم الرياضيات والإحصاء

مجال الخبرة الموضوعية

لذا لتصبح عالم بيانات أنت بحاجة إلى مهارات في البرمجة خاصة باستخدام لغات مثل بايثون. كذلك لابد من وجود معرفة بعلم الجبر والتفاضل والإحصاء. وأخيرا على حسب المجال الذي ستعمل به لابد أن يكون لديك خلفية مسبقة عنه.

بعض التطبيقات لعلم البيانات:

التنبؤ بأفضل فيديو/فيلم/مقالة ستثير اهتمام المستخدم

التنبؤ بمرض ان كان حميد أو خبيث من خلال تحليل بيانات المرضى السابقين

فهم رد فعل الناس من خلال تحليل سلوكيات مستخدمي الانترنت ومواقع التواصل الإجتماعي

استكشاف أي فعل غريب على الخوادم للتنبؤ بالاختراقات والهجمات قبل أن تتم

تمرين الآلة على التعرف على الأشياء وتحديد صفاتها. مثل التعرف على الثمرة وتحديد جودتها، أو التعرف على- الإنسان وتحديد هويته.

نحن هنا في إدراك نقدم مساق مقدمة في علم البيانات وتعلم الآلة لكل شاب وشابة بالعالم العربي المهتمين بتطوير مهاراتهم بمجال علم البيانات والذكاء الإصطناعي والتعلم الآلي. كذلك للمهتمين ببناء شركات تعتمد على علم البيانات والذكاء الإصناعي.

هدف هذه الدورة هو اعطائكم فكرة أو نكهة عن ما يدور في علم البيانات والتعلم الآلي والذكاء الاصطناعي والفرصة لقيام بعض التطبيقات بأنفسكم. كذلك سنقوم بمساعدتكم بالمعلومات والأدوات اللازمة للبدء في مشواركم الخاص.

م. علي سعد – مساعد ومشرف مساق علم البيانات‎

 

شارك المعرفة