डेटा माइनिंग - Data Mining का क्या मतलब है?

डेटा माइनिंग उस डेटा को उपयोगी और अक्सर कार्रवाई योग्य जानकारी में बदलने के लिए विभिन्न दृष्टिकोणों के अनुसार डेटा के छिपे हुए पैटर्न का विश्लेषण करने की प्रक्रिया है। डेटा को सामान्य क्षेत्रों में एकत्र और इकट्ठा किया जाता है, जैसे डेटा वेयरहाउस, और डेटा माइनिंग एल्गोरिदम ऐसे पैटर्न की तलाश करते हैं जिनका उपयोग व्यवसाय बेहतर निर्णय लेने के लिए कर सकते हैं, जैसे कि निर्णय जो लागत में कटौती, राजस्व में वृद्धि, या ग्राहकों या ग्राहकों की बेहतर सेवा करने में मदद करते हैं।

डेटा माइनिंग को डेटा डिस्कवरी या नॉलेज डिस्कवरी के रूप में भी जाना जाता है। डेटा-संचालित निर्णयों को स्थापित करने के लिए व्यावसायिक बुद्धिमत्ता में यह महत्वपूर्ण है।

डेटा माइनिंग प्रक्रिया में शामिल प्रमुख चरण हैं:
  • डेटा को डेटा वेयरहाउस में निकालें, रूपांतरित करें और लोड करें
  • एक बहुआयामी डेटाबेस में डेटा स्टोर और प्रबंधित करें
  • एप्लिकेशन सॉफ़्टवेयर का उपयोग करके व्यावसायिक विश्लेषकों को डेटा एक्सेस प्रदान करें
  • विश्लेषण किए गए डेटा को आसानी से समझने योग्य रूपों में प्रस्तुत करें, जैसे कि ग्राफ़
डेटा माइनिंग में पहला कदम व्यवसाय के लिए महत्वपूर्ण प्रासंगिक डेटा एकत्र करना है। कंपनी डेटा या तो लेन-देन, गैर-परिचालन या मेटाडेटा है। लेन-देन संबंधी डेटा बिक्री, इन्वेंट्री और लागत जैसे दिन-प्रतिदिन के कार्यों से संबंधित है। गैर-परिचालन डेटा सामान्य रूप से पूर्वानुमानित होता है, जबकि मेटाडेटा तार्किक डेटाबेस डिज़ाइन से संबंधित होता है। डेटा तत्वों के बीच पैटर्न और संबंध अक्सर व्यावसायिक प्रक्रियाओं में सुधार के लिए प्रासंगिक जानकारी प्रदान कर सकते हैं। एक मजबूत उपभोक्ता फोकस वाले संगठन डेटा माइनिंग तकनीकों से निपटते हैं जो बेचे गए उत्पादों, मूल्य, प्रतिस्पर्धा और ग्राहक जनसांख्यिकी की स्पष्ट तस्वीरें प्रदान करते हैं।

उदाहरण के लिए, खुदरा क्षेत्र की दिग्गज वॉलमार्ट अपनी सभी प्रासंगिक सूचनाओं को टेराबाइट्स डेटा वाले डेटा वेयरहाउस में पहुंचाती है। इस डेटा को आपूर्तिकर्ताओं द्वारा आसानी से एक्सेस किया जा सकता है, जिससे उन्हें ग्राहक खरीद पैटर्न की पहचान करने में मदद मिलती है। वे डेटा माइनिंग तकनीकों का उपयोग करके खरीदारी की आदतों, सबसे अधिक खरीदारी वाले दिनों, सबसे अधिक मांग वाले उत्पादों और अन्य अंतर्दृष्टि पर पैटर्न उत्पन्न कर सकते हैं।

डेटा माइनिंग में दूसरा चरण एक उपयुक्त एल्गोरिथम का चयन करना है - डेटा माइनिंग मॉडल का निर्माण करने वाला एक तंत्र। एल्गोरिथम के सामान्य कामकाज में डेटा के एक सेट में रुझानों की पहचान करना और पैरामीटर परिभाषा के लिए आउटपुट का उपयोग करना शामिल है। डेटा माइनिंग के लिए उपयोग किए जाने वाले सबसे लोकप्रिय एल्गोरिदम वर्गीकरण एल्गोरिदम और रिग्रेशन एल्गोरिदम हैं, जिनका उपयोग डेटा तत्वों के बीच संबंधों की पहचान करने के लिए किया जाता है। Oracle और SQL जैसे प्रमुख डेटाबेस विक्रेता डेटा माइनिंग की मांग को पूरा करने के लिए डेटा माइनिंग एल्गोरिदम, जैसे क्लस्टरिंग और रिग्रेशन ट्री को शामिल करते हैं।

Post a Comment

0 Comments