डेटा माइनिंग को डेटा डिस्कवरी या नॉलेज डिस्कवरी के रूप में भी जाना जाता है। डेटा-संचालित निर्णयों को स्थापित करने के लिए व्यावसायिक बुद्धिमत्ता में यह महत्वपूर्ण है।
डेटा माइनिंग प्रक्रिया में शामिल प्रमुख चरण हैं:
- डेटा को डेटा वेयरहाउस में निकालें, रूपांतरित करें और लोड करें
- एक बहुआयामी डेटाबेस में डेटा स्टोर और प्रबंधित करें
- एप्लिकेशन सॉफ़्टवेयर का उपयोग करके व्यावसायिक विश्लेषकों को डेटा एक्सेस प्रदान करें
- विश्लेषण किए गए डेटा को आसानी से समझने योग्य रूपों में प्रस्तुत करें, जैसे कि ग्राफ़
उदाहरण के लिए, खुदरा क्षेत्र की दिग्गज वॉलमार्ट अपनी सभी प्रासंगिक सूचनाओं को टेराबाइट्स डेटा वाले डेटा वेयरहाउस में पहुंचाती है। इस डेटा को आपूर्तिकर्ताओं द्वारा आसानी से एक्सेस किया जा सकता है, जिससे उन्हें ग्राहक खरीद पैटर्न की पहचान करने में मदद मिलती है। वे डेटा माइनिंग तकनीकों का उपयोग करके खरीदारी की आदतों, सबसे अधिक खरीदारी वाले दिनों, सबसे अधिक मांग वाले उत्पादों और अन्य अंतर्दृष्टि पर पैटर्न उत्पन्न कर सकते हैं।
डेटा माइनिंग में दूसरा चरण एक उपयुक्त एल्गोरिथम का चयन करना है - डेटा माइनिंग मॉडल का निर्माण करने वाला एक तंत्र। एल्गोरिथम के सामान्य कामकाज में डेटा के एक सेट में रुझानों की पहचान करना और पैरामीटर परिभाषा के लिए आउटपुट का उपयोग करना शामिल है। डेटा माइनिंग के लिए उपयोग किए जाने वाले सबसे लोकप्रिय एल्गोरिदम वर्गीकरण एल्गोरिदम और रिग्रेशन एल्गोरिदम हैं, जिनका उपयोग डेटा तत्वों के बीच संबंधों की पहचान करने के लिए किया जाता है। Oracle और SQL जैसे प्रमुख डेटाबेस विक्रेता डेटा माइनिंग की मांग को पूरा करने के लिए डेटा माइनिंग एल्गोरिदम, जैसे क्लस्टरिंग और रिग्रेशन ट्री को शामिल करते हैं।
0 Comments