• Home
  • /
  • Blog
  • /
  • सीएसवी फाइलें – बच्चों को समझाए गए एमएल एल्गोरिदम की रीढ़

सीएसवी फाइलें – बच्चों को समझाए गए एमएल एल्गोरिदम की रीढ़

सीएसवी फ़ाइलें

This post is also available in: English العربية (Arabic)

डेटा किसी भी एमएल/एआई एल्गोरिदम का मूल है। इसकी आपूर्ति उस रूप में की जानी चाहिए जिसे एल्गोरिथम समझता है। ML/AI एल्गोरिदम का मुख्य कार्य डेटा में उपलब्ध छिपी हुई जानकारी/ज्ञान को अनलॉक करना है। एल्गोरिदम गलत, फर्जी अंतर्दृष्टि प्रदान करेगा यदि डेटा एल्गोरिदम द्वारा समझ में नहीं आने वाले रूप में उपलब्ध है। एमएल एल्गोरिदम को डेटा प्रदान करने के सबसे लोकप्रिय तरीकों में से एक सीएसवी फाइलों के माध्यम से है।

सीएसवी फ़ाइल क्या है?

CSV एक अल्पविराम से अलग की गई मान फ़ाइल (कॉमा सेपरेटेड फाइल) है, जो डेटा को एक सारणीबद्ध प्रारूप में सहेजने की अनुमति देती है। CSV एक स्प्रेडशीट की तरह दिखते हैं लेकिन एक .csv एक्सटेंशन के साथ। CSV फ़ाइलों का उपयोग अधिकांश स्प्रेडशीट प्रोग्राम, जैसे माइक्रोसॉफ्ट एक्सेल या गूगल स्प्रेडशीट के साथ किया जा सकता है। वे अन्य स्प्रैडशीट फ़ाइल प्रकारों से भिन्न होते हैं क्योंकि आपके पास फ़ाइल में केवल एक शीट हो सकती है और वे सेल, कॉलम या पंक्ति को सहेज नहीं सकते हैं। साथ ही, आप इस प्रारूप में सूत्रों को सहेज नहीं सकते हैं।

CSV फ़ाइलों का उपयोग क्यों किया जाता है?

सीएसवी फाइलें कई अलग-अलग उद्देश्यों की पूर्ति करती हैं। वे उपयोगकर्ताओं को अधिक केंद्रित (सेंट्रलाइज्ड) डेटाबेस में उच्च मात्रा में डेटा निर्यात करने में मदद करते हैं।

उनके निम्नलिखित फायदे भी हैं:

  • CSV फ़ाइलें प्लेन-टेक्स्ट फ़ाइलें होती हैं, जिससे उपयोगकर्ताओं के लिए उन्हें बनाना आसान हो जाता है.
  • चूंकि वे प्लेन टेक्स्ट हैं, इसलिए आपके द्वारा उपयोग किए जा रहे विशिष्ट सॉफ़्टवेयर पर ध्यान दिए बिना, उन्हें स्प्रेडशीट या किसी अन्य संग्रहण डेटाबेस में आयात करना आसान होता है।
  • यह बड़ी मात्रा में डेटा को बेहतर ढंग से व्यवस्थित करता है।

CSV फ़ाइल कैसे बनाएं?

CSV एक टेक्स्ट फ़ाइल है, इसलिए इसे किसी भी टेक्स्ट एडिटर (जैसे नोटपैड) का उपयोग करके बनाया और संपादित किया जा सकता है। अधिक बार, हालांकि, प्रोग्राम में एक स्प्रेडशीट या डेटाबेस को निर्यात (File > Export) करके एक CSV फ़ाइल बनाई जाती है जिसने इसे बनाया है।

नोटपैड का उपयोग करके

टेक्स्ट एडिटर के साथ CSV फ़ाइल बनाने के लिए, पहले अपना पसंदीदा टेक्स्ट एडिटर चुनें, जैसे नोटपैड, और एक नई फ़ाइल खोलें। फिर वह टेक्स्ट डेटा दर्ज करें जिसे आप फ़ाइल में रखना चाहते हैं, प्रत्येक मान को अल्पविराम से और प्रत्येक पंक्ति को एक नई पंक्ति से अलग करते हुए।

Title1,Title2,Title3one,two,threeexample1,example2,example3

इस फाइल को एक्सटेंशन .csv से सेव करें। फिर आप माइक्रोसॉफ्ट एक्सेल या किसी अन्य स्प्रेडशीट प्रोग्राम का उपयोग करके फ़ाइल को खोल सकते हैं। यह निम्न के समान डेटा की एक तालिका तैयार करेगा:

CSV Files

स्प्रेडशीट का उपयोग करके

स्प्रेडशीट सॉफ़्टवेयर (जैसे माइक्रोसॉफ्ट एक्सेल) का उपयोग करके CSV फ़ाइल बनाने के लिए, प्रोग्राम लॉन्च करें और फिर सेल में डेटा दर्ज करें (प्रत्येक मान एक अलग सेल में और प्रत्येक पंक्ति एक नई पंक्ति के साथ)। डेटा दर्ज करने के बाद File पर क्लिक करें और Save As चुनें। Save as type से CSV चुनें और फाइल को सेव करें।

पायथन में सीएसवी फ़ाइल के साथ कार्य करना

पायथन में सीएसवी फाइलों को काम करने के लिए, सीएसवी नामक एक इनबिल्ट मॉड्यूल है। सीएसवी फाइलों को संभालने के लिए पायथन एक सीएसवी मॉड्यूल प्रदान करता है। डेटा पढ़ने/लिखने के लिए, आपको सीएसवी की पंक्तियों के माध्यम से लूप करना होगा।

सीएसवी मॉड्यूल सीएसवी प्रारूप में सारणीबद्ध डेटा को पढ़ने और लिखने के लिए क्लासेज़ को लागू करता है। यह प्रोग्रामर को एक्सेल द्वारा उपयोग किए गए सीएसवी प्रारूप के सटीक विवरण को जाने बिना “एक्सेल द्वारा पसंदीदा प्रारूप में डेटा लिखें”, या “इस फ़ाइल से डेटा पढ़ें जो एक्सेल द्वारा उत्पन्न किया गया था” कहने की अनुमति देता है। प्रोग्रामर अन्य ऍप्लिकेशन्स द्वारा समझे जाने वाले सीएसवी प्रारूपों का भी वर्णन कर सकते हैं या अपने स्वयं के विशेष-उद्देश्य वाले सीएसवी प्रारूपों को परिभाषित कर सकते हैं।

सीएसवी फाइलों से जानकारी खींचने के लिए आप अलग-अलग कॉलम से डेटा प्राप्त करने के लिए लूप और स्प्लिट विधियों का उपयोग करते हैं। इस कार्य को संभालने के लिए CSV मॉड्यूल स्पष्ट रूप से मौजूद है, जिससे CSV स्वरूपित फ़ाइलों से निपटना बहुत आसान हो जाता है। यह विशेष रूप से तब महत्वपूर्ण हो जाता है जब आप डेटा के साथ काम कर रहे होते हैं जिसे वास्तविक स्प्रेडशीट और डेटाबेस से टेक्स्ट फ़ाइलों में निर्यात किया जाता है। जानकारी को अपने आप पढ़ना मुश्किल हो सकता है।

एक सामान्य पाठक और लेखक के साथ, मॉड्यूल में माइक्रोसॉफ्ट एक्सेल और संबंधित फाइलों के साथ काम करने के लिए एक बोली शामिल है।

सीएसवी फंक्शन्स

सीएसवी मॉड्यूल में अंतर्निहित सभी आवश्यक फंक्शन्स शामिल हैं। वे हैं:

  • csv.reader
  • csv.writer
  • csv.register_dialect
  • csv.unregister_dialect
  • csv.get_dialect
  • csv.list_dailetcts
  • csv.field_size_limit

इस लेख में हम दो मुख्य फंक्शन्स पर गौर करेंगे – csv.reader और csv.writer

CSV फ़ाइलें पढ़ना

CSV फ़ाइल से डेटा पढ़ने के लिए, आपको रीडर ऑब्जेक्ट जेनरेट करने के लिए reader फ़ंक्शन का उपयोग करना चाहिए। फ़ाइल के प्रत्येक वाह को लेने और सभी स्तंभों की सूची बनाने के लिए reader फ़ंक्शन विकसित किया गया है। फिर, आपको उस कॉलम को चुनना होगा जिसके लिए आप वेरिएबल चाहते हैं।

इसे बेहतर ढंग से समझने के लिए, आइए निम्नलिखित उदाहरण पर विचार करें। मान लें कि data.csv में निम्न डेटा है:

Programming language, Designed by, Appeared, Extension

Python, Guido van Rossum, 1991, .py

Java, James Gosling, 1995, .java

C++, Bjarne Stroustrup, 1983, .cpp

#import necessary modulesimport csvwith open(‘X:data.csv’,’rt’)as f: data = csv.reader(f) for row in data: print(row)

जब आप उपरोक्त प्रोग्राम को निष्पादित करते हैं, तो आउटपुट होगा:

[‘Programming language; Designed by; Appeared; Extension’]

[‘Python; Guido van Rossum; 1991; .py’]

[‘Java; James Gosling; 1995; .java’]

[‘C++; Bjarne Stroustrup;1983;.cpp’]

CSV फ़ाइल को एक डिक्शनरी के रूप में पढ़ना

आप CSV फ़ाइलों को पढ़ने के लिए DictReader का भी उपयोग कर सकते हैं। परिणामों को एक डिक्शनरी के रूप में व्याख्यायित किया जाता है जहां शीर्षलेख पंक्ति कुंजी होती है, और अन्य पंक्तियां मान होती हैं।

निम्नलिखित कोड पर विचार करें:

#import necessary modulesimport csvreader = csv.DictReader(open(“X:data.csv”))for raw in reader: print(raw)

इस कोड का परिणाम है:

OrderedDict([(‘Programming language’, ‘Python’), (‘Designed by’, ‘Guido van Rossum’), (‘ Appeared’, ‘ 1991’), (‘ Extension’, ‘ .py’)])

OrderedDict([(‘Programming language’, ‘Java’), (‘Designed by’, ‘James Gosling’), (‘ Appeared’, ‘ 1995’), (‘ Extension’, ‘ .java’)])

OrderedDict([(‘Programming language’, ‘C++’), (‘Designed by’, ‘ Bjarne Stroustrup’), (‘ Appeared’, ‘ 1985’), (‘ Extension’, ‘ .cpp’)])

CSV फ़ाइल में लिखना

जब आपके पास डेटा का एक सेट होता है जिसे आप CSV फ़ाइल में संग्रहीत करना चाहते हैं, तो आपको writer() फ़ंक्शन का उपयोग करना होगा। पंक्तियों पर डेटा को पुनरावृत्त करने के लिए, आपको writerow() फ़ंक्शन का उपयोग करना होगा।

निम्नलिखित उदाहरण पर विचार करें। हम डेटा को “writeData.csv” फ़ाइल में लिखते हैं, जहां सीमांकक एक एपॉस्ट्रॉफ़ है।

#import necessary modulesimport csvwith open(‘X:writeData.csv’, mode=’w’) as file: writer = csv.writer(file, delimiter=’,’, quotechar='”‘, quoting=csv.QUOTE_MINIMAL) #way to write to csv file writer.writerow([‘Programming language’, ‘Designed by’, ‘Appeared’, ‘Extension’]) writer.writerow([‘Python’, ‘Guido van Rossum’, ‘1991’, ‘.py’]) writer.writerow([‘Java’, ‘James Gosling’, ‘1995’, ‘.java’]) writer.writerow([‘C++’, ‘Bjarne Stroustrup’, ‘1985’, ‘.cpp’])

csv फ़ाइल में परिणाम है:

Programming language, Designed by, Appeared, Extension

Python, Guido van Rossum, 1991, .py

Java, James Gosling, 1995, .java

C++, Bjarne Stroustrup,1983,.cpp

Pandas के साथ CSV फ़ाइलें पढ़ना

Pandas एक ओपन-सोर्स लाइब्रेरी है जो आपको पायथन में सीएसवी आयात करने और डेटा हेरफेर करने की अनुमति देता है। Pandas डेटा बनाने, हेरफेर करने और हटाने का एक आसान तरीका प्रदान करते हैं।

CSV को Panda DataFrame में पढ़ना बहुत तेज़ और आसान है:

#import necessary modulesimport pandasresult = pandas.read_csv(‘X:data.csv’)print(result)

उपरोक्त का परिणाम होगा:

Programming language, Designed by, Appeared, Extension

0 Python, Guido van Rossum, 1991, .py

1 Java, James Gosling, 1995, .java

2 C++, Bjarne Stroustrup,1983,.cpp

Pandas का उपयोग करके CSV फ़ाइलों को पढ़ना बहुत आसान है। कोड की सिर्फ तीन पंक्तियों में, आपको पहले जैसा ही परिणाम मिलता है। Pandas को पता है कि सीएसवी की पहली पंक्ति में कॉलम नाम हैं, और यह स्वचालित रूप से उनका उपयोग करेगा।

Pandas के साथ सीएसवी फाइलें लिखना

Pandas के साथ CSV फ़ाइल में लिखना पढ़ने में जितना आसान है। सबसे पहले, आपको एक DataFrame बनाना होगा और उसमें डेटा लिखना होगा। फिर डेटाफ़्रेम से CSV फ़ाइल में डेटा निर्यात करें। निम्नलिखित कोड वही करता है:

from pandas import DataFrameC = {‘Programming language’: [‘Python’,’Java’, ‘C++’], ‘Designed by’: [‘Guido van Rossum’, ‘James Gosling’, ‘Bjarne Stroustrup’], ‘Appeared’: [‘1991’, ‘1995’, ‘1985’], ‘Extension’: [‘.py’, ‘.java’, ‘.cpp’], }df = DataFrame(C, columns= [‘Programming language’, ‘Designed by’, ‘Appeared’, ‘Extension’])export_csv = df.to_csv (r’X:pandaresult.csv’, index = None, header=True) # here you have to write path, where result file will be storedprint (df)

उपरोक्त कोड का आउटपुट निम्न सीएसएस फ़ाइल होगा:

Programming language, Designed by, Appeared, Extension

0 Python, Guido van Rossum, 1991, .py

1 Java, James Gosling, 1995, .java

2 C++, Bjarne Stroustrup,1983,.cpp

तो, अब आप जानते हैं कि ‘सीएसवी’ विधि का उपयोग कैसे करें और सीएसवी प्रारूप में डेटा को पढ़ें और लिखें। सीएसवी फाइलें सॉफ्टवेयर अनुप्रयोगों में व्यापक रूप से उपयोग की जाती हैं क्योंकि वे पढ़ने और प्रबंधित करने में आसान होती हैं, और उनका छोटा आकार उन्हें प्रसंस्करण और संचरण के लिए अपेक्षाकृत तेज़ बनाता है।

सीएसवी मॉड्यूल विभिन्न कार्य और क्लासेज़ प्रदान करता है जो आपको आसानी से पढ़ने और लिखने की अनुमति देता है। सीएसवी डेटा को सहेजने, देखने और भेजने का सबसे अच्छा तरीका है। सीएसवी फाइलों को पढ़ने के लिए पांडा भी एक बढ़िया विकल्प है। वास्तव में, यह सीखना उतना कठिन नहीं है जितना शुरुआत में लगता है। लेकिन थोड़े से अभ्यास से आप इसमें महारत हासिल कर लेंगे।

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}
>