الفصل الحادي عشر

الملفات

 

11-1 المنظور المنطقي للملف  

11-2 المنظور الفيزيائي للملف

11-3 تعريف الملف

11-4 أنواع حقول السجل

11-5 أنواع الملفات

11-6 العمليات على الملفات

11-7 أطوال السجلات

11-8 نشاط الملفات

 

11-8-1 تنظيم الملفات على الوسائط التخزينية

 

11-8-2 تنظيم الملفات على الأقراص المغناطيسية

11-9 مزايا نظم الملفات

11-10 عيوب نظم الملفات



مقدمة في الحاسوب

11-1 المنظور المنطقي للملف Logical Veiw :

 

ويركز هذا المنظور على خصائص حقول بيانات السجلات Records المكونة للملف, كما يركز على المعالجات اللازمة على البيانات, ونلحظ أن النظرة المنطقية لا تعطي أهمية لوسائط التخزين التي تحتوي على الملف.

11-2 المنظور الفيزيائي للملف Veiw Physical:

  ومحور هذا المنظور معرفة وسائط التخزين الحاملة للبيانات وقدراته و أسلوب تنظيمها للبيانات واستعادة البيانات.

11-3 تعريف الملف File  :

 

هو مجموعة من السجلات المرتبطة منطقياً,وكل سجل داخل الملف يعنون بدليل أو مفتاح يستخدم للتميز بين السجلات المختلفة بالملف, بمعني أن هذا الدليل يستخدم كمعرف للسجل.
ويمكن تعريف السجل داخل الملف على أنه مجموعة من مفردات البيانات
Data Items يسمى كل منها حقل, و أحد هذه الحقول يستخدم كدليل أو مفتاح للسجل Record Key أما الحقل فهو عبارة عن مجموعة من الرموز قد تكون هجائية أو رقمية أو رقمية هجائية أو علامات خاصة, تنتظم معاً لتعطي معني منطقياً.
 وكمثال على الملفات: ملف الطلبة
Student File فهو تجميع لسجلات الطلبة Records, كل سجل منها مخصص لطالب, ويحوي مفردات البيانات Data Items للطالب كرقم الطالب, اسمه, عنوانه, جنسه, تاريخ ولادته, وكل واحد من هذه المفردات يسمى حقلاً وكل حقل مكون من مجموعة من الحروف.

  ويمكن تلخيص ما سبق:
الحرف: هو أصغر مكون منطقي في الملف, وقد يكون أبجدي أو رقمي
  الحقل: وهو أصغر وحدة بيانات ويتشكل من مجموعة متناغمة من الحروف.
  السجل: مجموعة مترابطة منطقياً مع حقول توصف كيان بذات توصيفاً يتلاءم مع طبيعة ومتطلبات الملف, وقد تسمى الحقول بالموصفات للكيان Attributes .
  الكيان Entity : هو شيء محدد مثل الإنسان- السلعة- التاجر- الموظف- أو نظام المعلومات, أو هو شيء نهتم بتسجيل بيانات عنه.

 

أضغط لتكبير الشكل
الشكل 11-1 يوضح مكونات الملف

11-4 أنواع حقول السجلRecord Field Kinds  :

  إذا تدارسنا بيانات البطاقة الشخصية أو بيانات تسجيل كتاب بأحد المكتبات لوجدنا أن موصفات صاحب البطاقة أو موصفات الكتاب كما هي موضحة على النحو التالي :

وسوف نلاحظ أن هناك نوعين من الحقول حقل وحيد له قيمة لا تتكرر على مستوى السجل وعلى مستوى الملف كله مثل البطاقة / الرقم القومي / رقم تسجيل الكتاب ، وكلاهما رقم فريد Unique ولذلك إذا سألت عن بيانات صاحب البطاقة رقم (كذا) أو ما هو عنوان واسم مؤلف الكتاب الذي رقم تسجيله (كذا) فما أيسر الوصول إلى البيانات المطلوبة لأن هذا النوع من الحقول يشير مباشرة إلى باقي حقول السجل ويحدد الكيان المعبر عنه تحديدًا دقيقًا.
مثل هذه الحقول الخاصة تسمى حقل مفتاح رئيسي Primary Key  ولا ينفي وجود هذا النوع من الحقول وجود حقول أخرى تصلح للإشارة للسجل ويطلق عليها المفاتيح الثانوية Secondary Key ، كما يمكن الدمج بين أكثر من حقل غير مفتاحي لتكوين حقل مفتاحي Unique ، أما باقي الحقول فهي حقول يحتمل تكرارها في أي عدد من السجلات في الملف الواحد ، ففي ملف البطاقات الشخصية قد يتواجد عدد من السجلات لها نفس أسماء أصحاب البطاقات ، وربما نفس محل الميلاد ويحتمل نفس تاريخ الميلاد ولا تنفي احتمال وجود ولو عدد محدود جدًا من الأشخاص لهم نفس العنوان وهكذا.

الرقم القومي الاسم محل الميلاد تاريخ الميلاد العنوان فصيلة الدم

والحقل الفريد أو المفتاح الرئيسي هو أحد الأدوات المنطقية في استرجاع البيانات من الملفات .

11-5 أنواع الملفات Files Kinds:

  تقسم الملفات إلى عدة أنواع أبرزها:
1.ا
لملف الرئيسي Master File :
هو ملف ذا بيانات شبه مستديمة (المرتبات ) ويتم تحديثه على فترات متباعدة ( شهريًاـ نصف سنوي ـ سنوي ) وبالتالي فإن الملف الرئيسي يحتوي على بيانات ذات طبيعة استاتيكية ( الاسم ـ العنوان ـ المرتب الأساسي ).

2.ملفات المتغيرات Transaction File:
هي ملفات تضم المتغيرات اليومية عن البيانات ـ الحركة ـ مثل أوامر الشراء الواردة للمؤسسة خلال فترة معينة وتستخدم هذه الملفات في تحديث الملف الرئيسي.

3.ملفات جامدة أو مرجعية Reference File:
هي الملفات التي تضم بيانات لا تتغير مثل الاسم ـ تاريخ الميلاد ـ محل الميلاد ـ النوع ـ الديانة ـ أسماء الكتب وسنة النشر ـ الموردون لمكتبة الجامعة .

4.ملفات البرامج و بياناتها :
هي ملفات تضم بعض البرامج أو البيانات المرتبطة بالبرامج ، وقد تكون البرامج والبيانات المرتبطة على نفس الملف أو على ملفين مستقلين.

5.ملفات النصوص Text File:
يضم نص وثيقة أو عدة وثائق مرتبطة منطقيًا.

6.ملفات شغل Work File:
هو ملف ينتج خلال مراحل المعالجة ولا يجري تخزينه شأنه شأن المسودات في الأعمال الإدارية والمكتبية.

7.ملفات تجريب Scratch File:
هو ملف مؤقت يمحى فور انتهاء المعالجة بأن يعاد الكتابة عليه.

11-6 العمليات على الملفات :

  تتم جملة عمليات على الملفات هي على النحو:
التحديث Updating :
عندما تتغير البيانات المتاحة عن البيانات المسجلة يتم تحديث الملف بالبيانات الجديدة.

المرجعية Referencing  :
لتأكيد معلومة من معلومات مسجلة ولا يجري خلالها أي تعديل أو تحديث.

صيانة الملفات :
وهي عملية تشمل إضافة سجلات جديدة وحذف سجلات قديمة مثل تغيير الثمن ، حذف أصناف لم تعد تنتج ـ عناوين العملاء ـ أرقام التليفونات .
 

11-7 أطوال السجلات :

 

تقسم السجلات من حيث الطول (الحيز مقدر بوحدة البايت) إلى نوعين أساسين هما :
1. طول ثابت Fixed :
أي أن حيز كل سجل على الملف مساو تمامًا لحيز أي سجل آخر ، ويعتبر هذا النوع من أفضل أنواع السجلات لأنه يساعد على سهولة تصميم البرامج وإن كان لا يحقق كفاءة عالية في استغلال وسائط التخزين إذ يعتبر الحيز الذي لم يستخدم مجرد فراغات محجوزة
Blank  يستحيل استغلالها .
2. الطول المتغير Variable length :
يتميز بأن أطوال السجلات ليست موحدة , بعض السجلات قصيرة وبعضها طويل ويعود هذا إلى أن بعض السجلات بها عدد أكبر من الحقول , فإن تساوت في عدد الحقول يعزى إلى اختلاف حيز الحقول ذاتها , تعتبر هذه السجلات من أفضل أنواع السجلات استغلالاً لحيز التخزين على الوسائط المختلفة.

11-8 نشاط الملفات :

  يعتبر نشاط الملف أو حجم الحركة عليه أحد المعايير الهامة Terms   في تصميم الملف من حيث اختيار وسائط التخزين والتنظيم وأسلوب الاسترجاع ، كما أن درجة ثبات البيانات وعدم تغيرها أو تحديثها يعتبر من المعايير التي تؤخذ في الاعتبار فإذا كان تغيير البيانات يتصف بالسرعة دعيت الملفات بأنها ملفات متطايرة Volatile  .

11-8-1 تنظيم الملفات على الوسائط التخزينية :

 

أولاً: الملفات على الشرائط المغناطيسية:
تكتب السجلات من الذاكرة على الشرائط بالأمر "أكتب" وكل سجل يتم كتابته يتلوه سجل آخر حتى نهاية تسجيل السجلات ، ونلحظ من ميكانيكية الكتابة على الشرائط أن دوران الشريط يأخذ أقصى سرعة منتظمة من بداية الكتابة حتى نهايتها ثم يبطئ الدوران لدرجة التوقف بعدها يعاود اكتساب السرعة اللازمة مما يستغرق وقتاً يسمح بمرور حيز من الشريط دون الكتابة عليه مسببًا فجوة بين السجلات Inter Record Gap كما هو مبين في الشكل 11-2 .

أضغط لتكبير الشكل
الشكل 11-2 يوضح الفجوات بين السجلات

وحتى نقلل الفجوة لأدنى حيز ممكن تخزن السجلات على هيئة مكتلة Blocked ويضم السجل الفيزيائي الواحد عدة سجلات منطقية يتراوح عددها بين سجل واحد وعدد "ن" من السجلات ويوضح الشكل 11-3 الفجوة البينية بين الكتل الفيزيائية للسجلات.

أضغط لتكبير الشكل

الشكل 11-3 يوضح الفجوة بين الكتل

والتكتيل يرفع من كفاءة نقل البيانات ويساعد على تحسين أداء وحدة التشغيل المركزية علاوة على الاستغلال الجيد للشرائط .

•معامل التكتيل:
هو عدد من السجلات المنطقية في السجل الفيزيائي ويتراوح بين سجل واحد، وعدد"ن" من السجلات فإذا كان معامل التكتيل يساوي واحد فإنه لا تكتيل ، وإذا تم النص على إجراء تكتيل فإن الأمر "اكتب" يكتب كتلة كاملة وليس سجلا مفردا وعندما يصدر الأوامر بالقراءة من الملف فإن الحاسب يقرأ كتلة كاملة ويفككها نظام التشغيل إلى سجلات مفردة.

تنظيم الملفات على الشرائط المغناطيسية :
1.تنظيم الملفات وفق المعيار الزمني لورود السجلات فمن يأتي أولا يسجل أولا ويسمى هذا التنظيم Pile كومة أو Serial متسلسل. 2.إذا أعيد ترتيب سجلات الملف المسلسل وفق قيمة حقل المفتاح سمي الملف في هذه الحالة ملف متتالي Sequential .

وكما نظمت الملفات مسلسلة فإن استرجاع السجلات يكون بذات ترتيب وتنظيم الملف وهو أسلوب فرضته تقنية الشرائط مما حد من استعمالها في الأنظمة النشطة أو الملفات المتطايرة ، حتى عند تحديث بيانات
 سجل يعاد كتابته في موقعه الأول مما يستدعي عند تحديث الملف أن يكون شريط ملف المتغيرات له نفس تنظيم الملف الرئيسي ، وفي حالة حذف أي سجل يبقى مكانه خاليًا على الشريط حتى يتم كتابة الشريط"الملف" مرة أخرى.

توصيف وتسمية الملفات :
إلى جانب سجلات البيانات يتم تعريف وتوصيف الملف باستخدام سجلين أحد هما في بداية الملف والآخر في نهايته ويكتبا مغناطيسياً ويشملا اسم الملف ـ تاريخ فتحه ـ الصلاحية ـ انتهاء الصلاحية ، ويتولى برنامج التطبيقات اختبار البيانات والتأكد من مطابقة الشريط للبرنامج ، ويدون في سجل نهاية الملف ، إشارة نهاية الملف ـ عدد السجلات ـ رقم الشريط.

ثانياً: الملفات على الأقراص المغناطيسية:
ناقشنا في الفصل السابع طريقة التسجيل على مجموعة الأقراص الصلبة وكيفية إعداد الأسطوانات المكونة من المسارات المتماثلة على الأسطح المغناطيسية حيث يقسم كل مسار إلى عدد من القطاعات ويسمى القطاع الواحد كتلة البيانات لأن بيانات كل قطاع تقرأ أو تكتب دفعة واحدة فيما بين القرص والذاكرة فيما يناظر كتلة منطقية على الشريط المغناطيسي ، وقد يتم جمع الكتل المنطقية إلى بعضها البعض مكونة    Buckets فيما يوضحه الشكل 11-4 مما يسرع عمليات القراءة والكتابة على الأقراص وتنظيم الملفات على الأقراص بأي من  أساليب التنظيم الآتية:

1. تنظيم مسلسل كما في الشرائط.
2. تنظيم متتالي كما في الشرائط.
وكلا الأسلوبين يعتبر إهدار لقدرات الحاسب وسرعة التعامل مع الأقراص سيان في تسجيل البيانات أو استرجاعها.
3. تنظيم متتالي مفهرس ويتطلب إنشاء ملف فهرس إلى جانب ملف البيانات .
ولا يحقق هذا التنظيم سوى سرعة استرجاع البيانات ويحتاج حيز تخزين أكبر من حيز ملف البيانات .
4. تنظيم عشوائي "مباشر".

عند تناول هذه التنظيمات لابد من التأكد من أن تقنية الأقراص تتيح استرجاع فوري لأي سجل على أي موقع من الأسطوانات الوهمية للبيانات مما يتطلب عنونة السجلات   Addressing وتقسيم مواقع التخزين إلى أجزاء يسهل الوصول إليها وفق هذا الترتيب الهرمي:
1. الأسطوانة:عدد الأسطوانات يساوي عدد المسارات على وجه أي قرص.
2. المسار: عدد المسارات في الأسطوانة الواحدة يسوى عدد أوجهه في الأقراص المغناطيسية ناقص2.
3. القطاع: وهو أقل كتلة منطقية يمكن عنونتها وتقرأ أو تكتب دفعة واحدة.

أضغط لتكبير الشكل
الشكل 11-4 القطاعات والمسارات وفهرسة السجلات

وبذلك يكون عنوان السجل على النحو من اليسار إلى اليمين كما في الإطار التالي :

الموقع النسبي

=

رقم السطح

رقم المسار

رقم القطاع

11-8-2 تنظيم الملفات على الأقراص المغناطيسية:

  1.التنظيم المباشر Direct Organization :
يعتمد هذا التنظيم على تخزين السجلات واسترجاعها وفق عنوان لكل سجل يحسب من معادلة رياضية تطبق على حقل المفتاح الرئيسي فإن كان الحقل أبجدي فيجب تحويله إلى قيمة رقمية بعدها يتم حساب قيمة العنوان.

2.التنظيم المفهرس Indexed Organization :
يعتمد هذا التنظيم على إنشاء ملف صغير يسمى ملف فهرس Index File إلى جوار ملف البيانات Data File ويعتبر ملف الفهرس المدخل الأساسي لملف البيانات ، ويتكون سجل ملف الفهرس من حقلين، الأول المفتاح الرئيسي أو حقل المفتاح لسجل البيانات إلى جانب حقل الفهرس المحدد لموضع السجل على الوسيط  المغناطيسي ، مما يعني أن كل سجل بيانات له مدخل وحيد في ملف الفهرس ، ونؤكد مرة أخرى ملف مفهرس يعني ملفين ، ملف بيانات وجواره ولصيق به ملف فهرس ويمكن إتباع التنظيم المفهرس في حالتين:
تنظيم عشوائي مفهرس Indexed Random Organization:
عندما يتم كتابة سجلات ملف البيانات دون ترتيب أو تحديد على وسائط التخزين فهذا ما نعنيه تماماً بمفهوم التنظيم العشوائي المفهرس جواره سجل الفهرس الذي يضم حلقين كما هو موضح مما دفع إلى عدة تساؤلات عن الفائدة المحققة من استخدام الفهارس خاصة وهو ملف يشغل حيزاً لا يستهان به من وسائط التخزين ويتطلب إنشاء وصيانة وتحديث ومعالجة شأن كل الملفات؟
هل التكلفة الإضافية لإنشاء الفهرس تعطي مردوداً يستدعي هذا الجهد والتكلفة؟
ومجموعة الأسئلة المثارة توضح مدي أهمية الفهارس ، فهذا التنظيم يتيح الاسترجاع المتتالي رغم أن سجلات البيانات موزعة عشوائياً أثناء التسجيل ...كيف؟ بإعادة فرز وترتيب ملف الفهارس وسلسلة مفتاح سجل البيانات تصاعدياً يتيح هذا النوع من الاسترجاع ، أيضاً يمكن استرجاع سجلات البيانات عشوائياً دون جهد بإجراء البحث في ملف الفهرس وصولا إلى ـ الكتلة ـ التي تضم السجل المنشود مباشرة مما يقلل من زمن الاسترجاع والذي ينعكس بدوره على كفاءة النظام لأن التعامل مع ملف سجلاته لا تتعدي 8 بايت أبسط كثيراً من التعامل مع السجلات قد يصل حيز السجل الواحد في ملف البيانات مئات أو عدة آلاف من البايت.

أضغط لتكبير الشكل

الشكل 11-5

التنظيم المتتالي المفهرس Indexed Sequential :
ويضم مزايا ملف الفهارس إلى جانب أن سجلات البيانات مرتبة ترتيباً متتالياً وفق حقل المفتاح ، وفي هذه الحالة ليس هناك أدنى حاجة إلى فهرس كثيف يضم مدخلات لجميع السجلات ويكتفي بفهرس مختصر مما يساعد على سرعة البحث وتقليل زمن استجابة النظام مع استخدام حيز تخزين محدود وقد يوضع الفهرس المختصر ذاته في الذاكرة مما يرفع من كفاءة و استجابة النظام. 

11-9 مزايا نظم الملفات:

  1.الملفات المتتالية تستهلك من حيز التخزين أدنى قدر متاح خصوصاً إذا كانت مكتلة ، لكن الاسترجاع المتتالي يبرز عدم مرونة هذا التنظيم.

2.تمتاز الملفات المباشرة بأقصى سرعة استرجاع لكنها غير مناسبة من حيث الاسترجاع المتتالي.

3.التنظيم المفهرس يتيح للمستخدم الاسترجاع المتتالي و المباشر رغم أن الأخير ليس بالسرعة المناسبة وهنا يتفوق التنظيم المتتالي المفهرس.

4.معظم  نظم الملفات تلبي متطلبات النظم غير النشطة مثل أنظمة المرتبات والمخزون مما يستدعي استخدام تكلفة إضافية.

5.من أبسط الأساليب في إدارة البيانات رغم العيوب الكثيرة التي تعاني منها.

11-10 عيوب نظم الملفات:

  حتى السبعينات ونظراً للقصور الكبير في معدات الحاسبات صممت معظم التطبيقات على مبدأ الارتباط المباشر بين البرنامج والبيانات الخاصة بها فيما عرف باسم Data Program Dependence ، فعندما كان يكتب برنامج بلغة الكوبول فإنه يجري إنشاء ملف يضم البيانات اللازمة لهذا البرنامج ، وعندما يكتب برنامج بلغة البيزيك ينشأ معه ملف آخر تطابق صياغة بياناته برنامج البيزك وهكذا.

أضغط لتكبير الشكل

الشكل 11-6

حقيقة أن كل برنامج يمكنه التعامل مع أكثر من ملف لكنه يتعامل معها تتابعياً لأنه لا يمكنه التعامل مع أكثر من ملف واحد في الوقت الواحد ، شريطة أن تكون الملفات مكتوب بياناتها بطريقة تلائم لغة البرمجة المستخدمة .
هذه الحقيقة كان لها نتائجها السلبية التي نلخصها على النحو:
1.حدت من مرونة النظام.
2.
سببت نقص كفاءة النظام.
3.
أتاحت وجود تكرارية في البيانات الواحدة.
4.
رغم الارتباط المباشر بين البيانات بلغة البرمجة فليس متاحاً استخدام بيانات برنامج لبرنامج آخر رغم أنهما مكتوبان بنفس لغة البرمجة مما حتم استخدام نسخ جديدة من ملف البيانات ليلائم البرنامج الآخر.
5.تسببت تكرارية البيانات في عدم تحقيق التكاملية بينها لأن تحديث أحد الملفات لا يعني بالضرورة تحديث الآخر.
6.انعكس كل هذا على زيادة كبيرة في وسائط تخزين البرامج والبيانات.
كل هذه المشاكل قادت إلى التفكير نحو إيجاد حلول مناسبة لأحداث تكاملية بين مختلف الملفات وإنهاء مشكلة تكرارية البيانات...الخ.
وقد سميت هذه الفكرة تكاملية الملفات Integrated Files ثم شاع مسمى قواعد البيانات Data Base  وتتلخص الفكرة في وضع البيانات ضمن إطار موحد ونطلق عليه للتبسيط حوض البيانات Data Pool أو قاعدة بيانات Data Base  بحيث يستطيع مختلف مستخدمي النظام التعامل معها بشكل سهل ومبسط.



حول الموقع  الصفحة الرئيسية  المراجع