सामान्यीकरण - Normalization का क्या अर्थ है?

सामान्यीकरण एक डेटाबेस में डेटा को पुनर्गठित करने की प्रक्रिया है ताकि यह दो मूलभूत आवश्यकताओं को पूरा करे:

  1. डेटा की कोई अतिरेक नहीं है, सभी डेटा को केवल एक ही स्थान पर संग्रहीत किया जाता है।
  2. डेटा निर्भरताएँ तार्किक हैं, सभी संबंधित डेटा आइटम एक साथ संग्रहीत किए जाते हैं।

सामान्यीकरण कई कारणों से महत्वपूर्ण है, लेकिन मुख्य रूप से क्योंकि यह डेटाबेस को यथासंभव कम डिस्क स्थान लेने की अनुमति देता है, जिसके परिणामस्वरूप प्रदर्शन में वृद्धि होती है।

सामान्यीकरण को डेटा सामान्यीकरण के रूप में भी जाना जाता है।

डेटा सामान्यीकरण के दौरान पहला लक्ष्य तार्किक रूप से डेटा अतिरेक को एक साथ समूहीकृत करके सभी डुप्लिकेट डेटा का पता लगाना और निकालना है। जब भी डेटा का एक टुकड़ा दूसरे पर निर्भर होता है, तो उस डेटा सेट के भीतर दोनों को निकटता में संग्रहित किया जाना चाहिए।

सभी विसंगतियों से छुटकारा पाने और असंरचित डेटा को संरचित रूप में व्यवस्थित करने से, सामान्यीकरण डेटा सेट की उपयोगिता में बहुत सुधार करता है। डेटा को अधिक आसानी से देखा जा सकता है, अंतर्दृष्टि को अधिक कुशलता से निकाला जा सकता है, और जानकारी को अधिक तेज़ी से अपडेट किया जा सकता है। चूंकि अतिरेक एक साथ विलय कर दिया जाता है, त्रुटियों का जोखिम और डुप्लिकेट डेटा को और भी असंगठित बना देता है। इन सबसे ऊपर, एक सामान्यीकृत डेटाबेस कम जगह लेता है, कई डिस्क स्थान समस्याओं से छुटकारा पाता है, और इसके समग्र प्रदर्शन में उल्लेखनीय वृद्धि करता है।

सामान्यीकरण के तीन मुख्य प्रकार नीचे सूचीबद्ध हैं। नोट: "एनएफ" "सामान्य रूप" को संदर्भित करता है।

पहला सामान्य रूप (1NF)

1NF में टेबल्स को कुछ नियमों का पालन करना चाहिए:

प्रत्येक सेल में केवल एक (परमाणु) मान होना चाहिए।

तालिका में प्रत्येक स्तंभ को विशिष्ट रूप से नामित किया जाना चाहिए।

कॉलम में सभी मान एक ही डोमेन से संबंधित होने चाहिए।

दूसरा सामान्य रूप (2NF)

2NF में तालिकाएँ 1NF में होनी चाहिए और कोई आंशिक निर्भरता नहीं होनी चाहिए (उदाहरण के लिए प्रत्येक गैर-प्रमुख विशेषता तालिका की प्राथमिक कुंजी पर निर्भर होनी चाहिए)।

तीसरा सामान्य रूप (3NF)

3NF में तालिकाएँ 2NF में होनी चाहिए और प्राथमिक कुंजी पर कोई सकर्मक कार्यात्मक निर्भरता नहीं होनी चाहिए।

निम्नलिखित दो एनएफ भी मौजूद हैं लेकिन इनका उपयोग बहुत कम किया जाता है:

बॉयस-कॉड नॉर्मल फॉर्म (बीसीएनएफ)

3NF का एक उच्च संस्करण, बॉयस-कॉड नॉर्मल फॉर्म का उपयोग विसंगतियों को दूर करने के लिए किया जाता है, जिसके परिणामस्वरूप एक से अधिक उम्मीदवार कुंजी मौजूद हो सकती है। 3.5 सामान्य फॉर्म के रूप में भी जाना जाता है, बीसीएनएफ को 3 एनएफ में होना चाहिए और सभी कार्यात्मक निर्भरताओं (एक्स → वाई) में, एक्स एक सुपर कुंजी होना चाहिए।

चौथा सामान्य रूप (4NF)

4NF में तालिका के लिए, यह BCNF में होना चाहिए और बहु-मूल्यवान निर्भरता नहीं होनी चाहिए।

पहले तीन एनएफ 1970 के दशक की शुरुआत में रिलेशनल डेटा मॉडल के जनक ई.एफ. कॉड द्वारा प्राप्त किए गए थे। आज के लगभग सभी रिलेशनल डेटाबेस इंजन उसके नियमों का उपयोग करते हैं।

कुछ संबंधपरक डेटाबेस इंजन सामान्यीकरण के सभी नियमों के मानदंडों को कड़ाई से पूरा नहीं करते हैं। एक उदाहरण Microsoft द्वारा Access 2007 डेटाबेस एप्लिकेशन में पेश की गई बहु-स्तरीय फ़ील्ड सुविधा है। डेटाबेस हलकों में इस बात को लेकर गरमागरम बहस हुई है कि क्या ऐसी विशेषताएं अब ऐसे अनुप्रयोगों को वास्तविक संबंधपरक डेटाबेस प्रबंधन प्रणाली होने से अयोग्य ठहराती हैं।

Post a Comment

0 Comments