أهم النقاط بالفصل السادس من كتاب قوة تصميم المسح

لماذا إدارة البيانات مهمة

  • تبدأ عملية إدارة البيانات منذ بداية تصميم الاستبيان، ويجب أن يوفر الاستبيان عناصر هامة لإدخال البيانات، مثل:
    1. توفير مساحة كافية للإجابة على كل الأسئلة، خاصة الأسئلة المفتوحة
    2. أن تكون خانة اختيار الإجابة بجوار الإجابة المرتبطة بها
    3. أن يكون نمط ترتيب الإجابات المتاحة موحد، ويفضل أن تكون الإجابات مرتبة من الأعلى إلى أسفل
    4. تحديد الأسئلة التي سيتم إنشاء بدائل إجابات لها (عملية الترميز) بعد الانتهاء من العمل الميداني
  • ضرورة تفاعل مدير المسح مع مدير البيانات لكسب ثقة ودقة أكبر في البيانات التي سيتم تجميعها، ويجب أن يتعاون محلل البيانات ومصمم الأسئلة مع مدير البيانات لتحديد النطاق المناسب لفحص الاتساق في الإجابات المحتملة
  • يُفضل أن يحصل مدير البيانات على تدريبات حول كافة جوانب المسح، وأن يحضر تدريبات الباحثين جامعي البيانات
  • لضمان جمع بيانات دقيقة في الوقت المناسب، هناك أربعة إجراءات أساسية:
    1. الترميز
    2. التعديل
    3. إدخال البيانات إلكترونيا
    4. التنظيف

الترميز (التصنيف)

  • هو عملية تلخيص بيانات المسح في فئات محددة وإعطاء كل فئة رقم، لدراسة الخصائص والأنماط الناتجة عنها
  • تحديد إطار الترميز (التصنيف)
    • تحديد فئات الإجابة المحتملة لكل سؤال، وتكون سهلة عندما تكون الفئات بسيطة مثل نعم/لا
    • يكون الإطار صعب تحديده مع الأسئلة التي يصعب حصر إجاباتها المحتملة
    • يجب أن يعكس مستوى عمق التصنيف الغرض التحليلي للسؤال
    • الأخذ في الاعتبار قدرة المستجيب على الاختيار من الفئات المطروحة، يجب أن تكون مناسبة للجميع
    • عدم وضوح التصنيف يؤدي إلى رفض المستجيب الإجابة أو أنه يقدم إجابة متحيزة
    • يجب أن يقوم بالتصنيف شخص ملم بهدف المسح والطريقة التي سيتم بها استخدام البيانات
    • ترقيم الإجابات الخاصة بكل سؤال بجانب الفئة نفسها لتسهيل إدخال البيانات
    • لا يجب تصنيف إجابات الأسئلة المفتوحة أثناء إجراء المسح، لأن ذلك يسبب تحيز مضر بالبيانات
    • يجب تصنيف كل الأسئلة التي لها نفس الإجابات بنفس الطريقة ونفس الترتيب
    • مهم في هذه العملية التمييز بين استخدام:
      • لا أعرف: المستجيب لم يستطع أن يوفر إجابة
      • لا ينطبق: لا ينطبق السؤال على المستجيب، مثل “ما هو عدد الأبناء؟” لشخص لم يتزوج من قبل
      • رفض: المستجيب رفض أن يقدم إجابة على السؤال
  • يمكن تجنب الأخطاء في البيانات إذا تم استخدام أرقام سالبة للتعبير عن تلك الفئات السابقة
  • يجب أن يكون كل سؤال وكل إجابة لها تصنيف منفرد عن غيرها، ولا يُفضل ضم إجابات معا تحت ترميز واحد

التعديل/التحرير

  • هي عملية يتم خلالها مراجعة الاستبيان المكتمل لاكتشاف الأخطاء وتصحيحها
  • يقوم جامع البيانات بها بعد الانتهاء من كل مقابلة، ويقوم بها أيضا المشرف أثناء مراجعة البيانات
  • خطوة مهمة مهما كان جامعو البيانات على قدر عال من الخبرة فإنهم يرتكبون الأخطاء ويغفلوا عن إلقاء بعض الأسئلة أو تسكين بعض الإجابات
  • تتم تلك العملية من خلال فحص المعلومات المجمعة أنها:
    • مكتملة: جميع الأسئلة المنطبقة على المستجيب تم الإجابة عليها بالكامل
    • دقيقة: أن الإجابات واضحة وتحقق هدف السؤال، لأن توتر المقابلة قد يؤدي إلى اختيار إجابات غير سليمة أو عدم اختيار كل الإجابات التي تم الإشارة إليها
    • متسقة: الإجابات المترابطة مع بعضها متسقة بحيث لا يوجد تعارض بين إجابة وأخرى مرتبطة أو مكملة لها

إدخال البيانات إلكترونيا

  • بالرغم من فوائد استخدام الاستبيانات الإلكترونية من حيث السرعة وتخزين البيانات، إلا أن تصميم الاستبيان إلكترونيا هي عملية مهمة وتستغرق وقت للفحص والتأكد من قابلية استخدام الاستبيان الإلكتروني
  • تبدأ عملية تجهيز استبيان إلكتروني منذ لحظة الاستقرار على البرنامج الذي سيتم استخدامه
  • قرار استخدام البرنامج يتحكم فيه عوامل عدة، مثل البرنامج الذي تستخدمه الشركة القائمة بالمسح وإمكانياتها، ومدى انتشار البرنامج وإمكانيات الدولة التي يتم إجراء المسح بها على استخدام البرنامج
  • لضمان إدخال بيانات دقيقة يجب أن:
    • كل استبيان أو استمارة لجمع البيانات يكون له كود منفرد خاص به فقط
    • كل متغير أو سؤال له اسم منفرد خاص به فقط
    • كل إجابة يتم تسجيلها إلكترونيا يتم فحص جودتها من خلال 3 طرق إلكترونية:
      • فحص المدى للإجابة: إذا كان المدى من 1 إلى 10 فلا يمكن قبول أي إجابة خارج هذا المدى
      • منطقية الإجابة: الأسئلة الانتقالية التي لا يجب الإجابة عليها، يجب أن تكون فارغة
      • موثوقية الإجابة: الإجابات التي مجموعها 100 لا يمكن أن يكون المجموع أقل أو أكثر من ذلك
    • يوفر البرنامج ملف الإجابات في أي شكل إلكتروني يكون قابل للاستخدام مع البرامج الإلكترونية الأخرى
  • يمكن فحص الاستبيان من خلال إدخال بيانات عينة صغيرة بها مواقف مختلفة لرصد تفاعل النظام الإلكتروني معها

تنظيف البيانات

  • هي عملية تعزيز جودة البيانات من خلال الفحص النهائي لها، وإعدادها لمرحلة التحليل
  • يمثل خطوة خطيرة جدا لأن التعديل أو التغيير غير الدقيق يمكن أن يضر بصحة البيانات وتغيير النتائج
  • يساعد تنظيف البيانات على تحسين جودة البيانات وجاهزيتها للتحليل، وزيادة الثقة بها
  • ضرورة أن يقوم بتلك الخطوة الخبراء والمتخصصين
  • هناك مبدأين يتم الاعتماد عليهم عند تنظيف البيانات:
    • يتم تنظيف البيانات عند رصد خطأ مؤكد بدون شك، وإذا كان هناك شك يتم إرجاع القرار لمستخدمي البيانات
    • عند تجاوز البيانات التي بها مشكلة نسبة 5% فإنه يتم إرجاعها للمكتب الميداني لمزيد من الفحص وقد يتم إجراء مقابلات تتبعيه للتأكد منها.

خطوات عملية حول تنظيف بيانات المسح

  • التحقق من الاستقرار الهيكلي من ملفات البيانات، وأنها متوافقة مع هيكل الاستبيان، وذلك عن طريق:
    • تتضمن ملفات البيانات كل أقسام الاستبيان
    • كل استجابة لها كود تعريفي منفرد، وكل المتغيرات في الملفات متوافقة مع متغيرات الاستبيان ولها كود منفرد
    • الأكواد التعريفية للاستبيانات للمستجيبين تتوافق مع أكواد العينة
    • الأكواد للإجابات تكون مميزة لكل إجابة وحتى الفئات مثل “لا أعرف” أو “لا ينطبق” أو غيرها تكون مميزة
  • تحديد البيانات غير الصحيحة، وقد تكون غير صحيحة عن طريق:
    • الإجابة خارج مدى الإجابات المسموح للسؤال
      • الإجابة قد تكون غير متسقة مع إجابة أخرى في الاستبيان
  • تغيير /تعديل القيم غير الصحيحة وتوقع القيم غير الموجودة، ويكون هذا التصحيح في 3 مراحل:
    • التحديد الكمي للأخطاء، من خلال إنشاء توزيع تراكمي لتكرار الأخطاء وإذا كان هناك اتجاه معين للأخطاء يتم إرجاعها مباشرة لمكتب العمل الميداني لمزيد من التحقق
    • تحديد الأخطاء المطبعية أو الكتابية عند إدخال الإجابات، وهذه تكون واضحة وسهلة التحديد والتصحيح
    • لتحقق من أخطاء عدم الاتساق بين كل سؤال وباقي أسئلة الاستبيان، لاكتشاف التناقض الداخلي وتصحيحه
  • عند تنظيف البيانات يجب أن يؤخذ في الاعتبار التحيزات الممكنة، مثل أثر الاستحسان الاجتماعي، وأثر الترتيب للأسئلة وبدائل الإجابات، وأثر الأسئلة الحساسة، وأثر التذكر لأنها تؤثر على تناسق الإجابات
  • مهما كان حجم التنظيف للبيانات فإنه لا يمكن أن يعالج الأخطاء الناتجة عن التصميم السيء للاستبيان أو دقة تسجيل الإجابات

أمثلة عملية حول تنظيف (تصحيح) عدم الاتساق الداخلي

عملية التنظيف للتناقضات تتم في إطار أن تناقض الإجابات لم يتجاوز 5% من إجمالي الإجابات

المثال الأول (تعدد الإجابات غير المتسقة)

  • نفترض أن المسح يتم مع مديرين المصانع، وتتم المقابلة في المصنع، وهناك سؤالين:
    • الأول: “كم عدد المصانع الإضافية التي تحت سيطرة مؤسستك؟”
    • الثاني منقسم لأسئلة فرعية:
      1. كم مصنع يقع في منطقتك؟
      2. كم مصنع يقع في هذا الحي بخلاف ما ذكر في أ؟
      3. كم مصنع يقع في هذه البلد بخلاف ما ذكر في أ، ب؟
      4. كم مصنع يقع في البلاد الأخرى؟
  • المتوقع أن مجموع أعداد الأسئلة الفرعية للسؤال الثاني يكون مساوي للعدد المذكور في السؤال الأول
  • قد يحدث تناقض هنا، وأن مجموع الأعداد للسؤال الثاني أكبر بـ 1 عن السؤال الأول، ويمكن تصحيح ذلك كما يلي:
    • السؤال الأول يطلب العدد الإضافي من المصانع بخلاف المصنع الذي تتم فيه المقابلة
    • السؤال الثاني يطلب توزيع العدد في المنطقة أو الحي أو غيرهما دون توضيح أنه يتحدث عن العدد الإضافي
    • عند وضع ذلك في الاعتبار يتضح أن التناقض نشأ لأن المستجيب في إجابته على السؤال الثاني لم يستبعد المصنع الذي تتم فيه المقابلة، وأصبح المجموع للسؤال الثاني أكبر بـ 1 من السؤال الأول
    • يتم هنا تصحيح الإجابة في السؤال الثاني وتقليلها بـ 1
  • يوجد تصنيفات مختلفة للتناقض المحتمل لمثل هذه الأسئلة، فقد يخطأ المحاور أو المستجيب في إعطاء إجابات لكل سؤال فرعي في السؤال الثاني دون استبعاد العدد المذكور في السؤال الفرعي السابق له والذي هو جزء منه
  • كلما زاد تعقيد التناقض كلما صعب التصحيح له، وكان هناك ضرورة إلى الرجوع إلى مكتب العمل الميداني لمزيد من التوضيح

المثال الثاني (تعقيد الهيكل يسبب عدم تناسق الإجابات)

  • المسح يتم مع الشركات ويوجد به أسئلة خاصة بالقروض، والأسئلة كما يلي:
    • السؤال الأول: “هل قامت الشركة من قبل بالتقديم على قرض بنكي؟” وهو سؤال انتقالي إذا أجاب بـ “نعم” سيتم الإجابة على الأسئلة التالية له المتعلقة بالقرض وهي من س2 إلى س11
    • إذا كانت الإجابة على س1 “لا” سينتقل إلى س12 وهو “ما هي أسباب عدم تقديم الشركة على قرض بنكي؟”
    • الأسئلة من س13 إلى س 15 مرتبطة بتفاصيل حول أن الشركة قدمت بالفعل على قرض ولكن تم رفضه
  • يوجد داخل كل مجموعة من الأسئلة السابقة انتقالات داخلية أخرى
  • يتضح أن الأسئلة من س2 إلى س11 ومن س13 إلى س15 مرتبطة بأن الإجابة على س1 يجب أن تكون “نعم”
    • حدث تناقض في الإجابات بأشكال مختلفة، وتم التعامل معها كالتالي:
    • إذا كانت إجابة س1 بـ “لا” وهناك إجابة على الأقل بأحد الأسئلة المرتبطة بـ “نعم”، وأن س12 ليس به إجابة مطلقا، فيتم تحويل إجابة س1 إلى “نعم”
    • إذا كانت إجابة س1 بـ “نعم” ولكن الأسئلة المرتبطة بـ “نعم” فارغة، وأن س12 تم الإجابة عليه، تتحول الإجابة في س1 إلى “لا”
    • إذا كان س1 ليس به إجابة وأن جميع الأسئلة التالية المرتبطة بكل من “نعم” و “لا” بها إجابات، فهنا يستحيل أن يقوم منظف البيانات بتصحيحها، ويتم الرجوع إلى مكتب العمل الميداني في تلك الحالة

Leave a Reply

Your email address will not be published. Required fields are marked *