أنظمة الملفات من الجيل التالي: ما الذي سوف يبحثون عنه؟
إن فكرة أن البيانات تنمو باطراد تبدو حقيقة مقبولة عالميًا بين محترفي تكنولوجيا المعلومات. ومع ذلك ، يبدو أن الغالبية العظمى من المحادثات حول نمو البيانات تركز على البيانات المنظمة. ومع ذلك ، فإن البيانات غير المهيكلة (بيانات الملفات) تنمو أيضًا بمعدل غير مسبوق. على هذا النحو ، فإن التقنيات التي استخدمت منذ فترة طويلة لتخزين وتنظيم البيانات غير المهيكلة أصبحت مليئة بسرعة غير كافية.
على الرغم من أنني أشك بشدة في أن العديد من الناس سينكرون فكرة أن البيانات غير المنظمة تتزايد ، فمن السهل التقليل من حجم نمو البيانات. بدافع الفضول ، ألقيت نظرة على محتويات مستودع الملفات الخاص بي ووجدت أنه يحتوي على حوالي 360،000 ملف تقريبًا. رغم أن ذلك قد لا يبدو عددًا كبيرًا ، خاصة وفقًا لمعايير المؤسسة ، إلا أنني شخص واحد فقط. علاوة على ذلك ، لا يتضمن هذا الرقم ملفات نظام التشغيل ، ولا يشمل أرشيفات البيانات الخاصة بي. إذا كان بإمكاني إنشاء 360،000 ملف (يتكون معظمها من المستندات ولقاطات الشاشة ومقاطع الفيديو) بنفسي ، فقط تخيل عدد الملفات التي يمكن إنشاؤها في مؤسسة كبيرة.
إدارة الضوابط
هناك بالطبع أي عدد من التدابير التي اتخذها المسؤولون للتحكم في تراكم الملفات. على سبيل المثال ، يمكن استخدام Windows Server Resource Manager لتصنيف الملفات ولمنع المستخدمين من حفظ أنواع الملفات المختلفة إلى مشاركة ملف شبكة. على سبيل المثال ، قد يختار المسؤول حظر ملفات الصوت أو الفيديو. وبالمثل ، تعمل العديد من المؤسسات على الاستفادة من آليات مثل الحصص النسبية للمستخدم أو سياسات إدارة دورة حياة البيانات لمنع تراكم أعداد كبيرة من الملفات على الشبكة.
من ناحية ، أنا أفهم تمامًا سبب استخدام هذه التقنيات وغيرها من التقنيات المشابهة. هناك تكلفة مباشرة مرتبطة بتخزين البيانات ، كما يساعد الحفاظ على نمو البيانات في التحكم في التكاليف. في الوقت نفسه ، على الرغم من ذلك ، تكتشف المؤسسات بشكل متزايد أن بياناتها الدنيوية على ما يبدو تحتوي على قيمة أعمال مخفية مسبقًا تنتظر فتحها. إذا كان من المحتمل أن تكون البيانات ذات قيمة بالنسبة إلى العمل ، فليس من المنطقي وضع قيود صارمة على قدرة المستخدمين على حفظ الملفات أو فرض إزالة البيانات القديمة.
بالطبع ، يمثل النمو غير المقيد للبيانات غير المهيكلة مشكلات أخرى تتجاوز تكاليف التخزين. قد يكون التحدي الأكبر هو الحفاظ على تنظيم البيانات. يجب على المؤسسات مراعاة أفضل السبل لمساعدة المستخدمين على تحديد موقع الملف الذي يحتاجون إليه عند تخزينه بين ملايين الملفات الأخرى داخل نظام الملفات.
تصنيف يستند إلى مجلد كحل نظام ملفات؟
تقليديًا ، كانت أفضل طريقة للحفاظ على البيانات منظمة إلى حد ما هي بناء تصنيف في بنية الدليل. في مؤسستي الخاصة ، على سبيل المثال ، أستخدم أسماء المجلدات ذات المستوى الأعلى التي تصف محتويات المجلد بشكل عام. تتضمن هذه الأسماء أشياء مثل المقالات أو الأعمال. من هناك ، أقوم بإنشاء سلسلة من المجلدات الفرعية التي تساعد على تنظيم المعلومات بشكل أفضل. على سبيل المثال ، لدي مجلد كتب للكتب التي كتبتها. أقوم بتنظيم المعلومات داخل مجلد الكتب عن طريق إنشاء مجلدات فرعية للناشر والسنة وعنوان الكتاب.
يعمل التصنيف المستند إلى المجلدات الذي قمت بإنشائه في مؤسساتي الخاصة (معظم الوقت) ، لكن من المحتمل ألا يكون حجمه جيدًا. إذا كان هناك مستخدمون آخرون على شبكتي ، فلا يوجد ضمان بأن هؤلاء المستخدمين سيحفظون ملفاتهم في الموقع الصحيح بناءً على بنية المجلد التي تم إنشاؤها.
تكمن المشكلة الأكبر في استخدام التصنيف المعتمد على المجلد في أنه بغض النظر عن كيفية تنظيم بنية المجلد ، سيكون من الصعب تحديد موقع بعض الأشياء. منذ بضعة أيام ، على سبيل المثال ، كنت بحاجة إلى العثور على الرسم التخطيطي لكاميرا التصوير الحراري التي قمت بإنشائها قبل عدة سنوات. لم يكن لدي مجلد من المستوى الأعلى للجهاز ، ولم أكن أتذكر بالضبط متى قمت ببناء الجهاز. انتهى بي الأمر إلى اللجوء إلى استخدام واجهة بحث Windows.
لحسن الحظ ، يتم فهرسة محتويات خادم الملفات بالكامل ، لكن لا يزال هناك الكثير من الوقت للتدقيق في نتائج البحث. يؤدي استخدام كلمة “camera” كمصطلح بحث إلى إرجاع النتائج من المقالات على التطبيقات التي تستفيد من كاميرات الهواتف الذكية ، والإيصال من كاميرا DSLR التي اشتريتها قبل بضع سنوات ، وعدد لا يحصى من المستندات الأخرى التي تضمنت عرضًا كلمة camera.
السبب في أن هذا النوع من البحث يمثل مشكلة كبيرة لأن النتائج تستند إلى اسم الملف و / أو محتويات الملف (مثل الكلمات الموجودة في ملف المستند). من المحتمل أن تكون عملية البحث أكثر فاعلية إذا تمكنت من إجراء بحث عن الكلمات الرئيسية بدلاً من ذلك.
ماذا عن تخزين الأشياء؟
تعمل الحلول السحابية العامة مثل Amazon AWS و Microsoft Azure على حل هذه المشكلة باستخدام تخزين الكائنات بدلاً من تخزين الكتل. تخزين الكائنات هو نظام تخزين ملفات مسطح (على عكس التسلسل الهرمي) ، وهو مصمم للتوسع الهائل. بدلاً من تنظيم الملفات في مجلدات ، يمكن تمييز الملفات بالبيانات الوصفية ، مما يتيح وصف الملفات ذاتيًا ويسهل العثور عليها.
يتمتع استخدام البيانات الوصفية بمزاياها ، لكنه ليس مثاليًا. على سبيل المثال ، كان لدى SharePoint القدرة على تطبيق علامات بيانات التعريف على المستندات الموجودة في مكتبة المستندات لسنوات عديدة. هناك مسألتان على الأقل في استخدام تمييز بيانات التعريف.
أولاً ، سيكون هناك حتما بعض المستخدمين الذين يتركون العلامات فارغة. بينما يمكنك طلب وضع علامات ، قد يكون هناك مستخدمون يقومون بإدخال البيانات المهملة في حقول البيانات الأولية في محاولة لتجاوز ما يعتبرونه متطلبًا مزعجًا أو غير مجدي تمامًا.
المشكلة الأكبر هي أن بنية وضع العلامات لا تنطبق بشكل جيد على جميع الوثائق. النظر ، على سبيل المثال ، في المقالات التي أكتبها. قد أطبق علامات مثل تاريخ النشر أو المحرر أو الموضوع. كما ذكرنا سابقًا ، فإن المقالات ليست هي النوع الوحيد من البيانات على نظام الملفات الخاص بي. تخيل أنني بحاجة إلى حفظ نسخة من إيصال لأغراض ضريبية. قد لا يكون من المنطقي تطبيق علامة النشر أو علامة النشر على الإيصال.
أظن أن نظام الملفات في المستقبل سيستخدم مزيجًا من تصنيف البيانات الوصفية وتجميعها. يمكن تجميع أنواع مماثلة من المحتوى ، ومن ثم يمكن تطبيق تصنيف قائم على العلامات على كل مجموعة ، مع تصميم العلامات خصيصًا لتتناسب مع غرض المجموعة. لا أتحدث عن إنشاء مجموعة منفصلة لكل نوع من أنواع الملفات أو تنظيم ملفات SharePoint في مكتبات مستندات منفصلة. أنا أتحدث عن نظام تصنيف مدمج في نظام الملفات ، ويمكن تطبيقه بطريقة تشبه قائمة التحكم في الوصول.
أنظمة الملفات من الجيل التالي: الأرشفة والوصول
على الرغم من أن مفهوم أنظمة الجيل التالي من الملفات نظري تمامًا ، إلا أنه يعالج بعض التحديات الرئيسية التي ينطوي عليها الحفاظ على تنظيم البيانات. بغض النظر عن الشكل النهائي لنظام الملفات غدًا ، فمن المؤكد أنه سيحتاج إلى تضمين تقنيات تقليل البيانات مثل إلغاء البيانات المكررة (الموجودة بالفعل في نظام ملفات NTFS) ، وميزة أرشفة شفافة. تسمح هذه الميزة بنقل البيانات القديمة التي يتم الوصول إليها بشفافية إلى نظام أرشفة مع الاستمرار في السماح للمستخدمين بالوصول إلى البيانات بالطريقة المعتادة إذا دعت الحاجة إلى ذلك. مرة أخرى ، هناك منتجات يمكنها القيام بذلك اليوم ، لكنني أتحدث عن تضمين هذه القدرات في نظام الملفات.