1.

Which of the following is not a preprocessing method used for unstructured data classification?

Answer»

प्रीप्रोसेसिंग विधियां महत्वपूर्ण कदम हैं जो पाठ खनन में महत्वपूर्ण हैं, एनएलपी या प्राकृतिक भाषा प्रसंस्करण में, और आईआर या सूचना पुनर्प्राप्ति में महत्वपूर्ण हैं।

टेक्स्ट इकट्ठा करना एक ऐसा कदम है जिसमें सभी कच्चे डेटा एकत्र किए जाते हैं। ये सभी डेटा असंगठित है। प्रीप्रोकैसिंग चरण इन कच्चे असंगठित डेटा के अधिक परिभाषित तरीके से विभाजन और प्रतिनिधित्व की अनुमति देते हैं।

टोकननाइजेशन असंगठित डेटा के प्रीप्रोसेसिंग में एक कदम है जिसमें कच्चे डेटा को उन शब्दों में विभाजित किया जाता है जिन्हें फीचर पीढ़ी कहा जाता है। स्टेमिंग एल्गोरिदम लागू किया गया है ताकि सभी शर्तों को एक स्टेमड फॉर्म में दर्शाया जा सके और स्टॉप शब्द भी हटा दिए जाएं।



Discussion

No Comment Found

Related InterviewSolutions