हिंदी अनुवाद: स्माक डेटासेट
यह डेटासेट नहीं मौजूद है। भविष्य में यदि इसकी आवश्यकता प
टिप्पणी
पर्रॉट अभी तक विकास में है और अन्तिम उपयोगकर्ताओं के लिए तैयार नहीं है।
दस्तावेज़ की स्टैक मेटाडेटा
The Stack has a separate metadata repository containing information about the dataset without hosting the dataset itself. This practice is beneficial as it allows researchers to understand dataset contents without being bound by licenses. For instance, how can one agree to a license when they're unaware of the content's licenses? By using metadata files, this issue can be mitigated.
लिंक गीट रीपोजिटरी के:
git clone https://huggingface.co/datasets/bigcode/the-stack-metadata
डाउनलोड हो रहा मेटाडाटा
यह मेटाडाटा पूरी डेटासेट से कम है, लेकिन अभी भी बहुत बड़ा है। गिट मेटाडाटा रीपोजिटर
प्रारूप मेटाडेटा को पढ़ा रहा है
यह स्टॅक की मेटाडेटा पार्केट फ़ॉर्मैट में संग्रहीत होती है। पार्क
चुनें हों रिपोज़ीटोरियाँ
लिबरे मानदंडों के अनुसार उपयोगी रेपोजिटरी को फ़िल्टर करने वाला एक स्क्रिप्ट लिखें।
रीपॉजिटरी का क्लोन करें
लिस्ट के चयनित रीपॉजिटोरियों का क्लोन करने के लिए एक स्क्रिप्ट लिखें।
चारागांव
इस पर काम करें बिग कोड से लिबर कोड का उपयोग करके (स्टैक के निर्माता) मॉडल ट्रेनिंग के लि�
स्क्रिप्ट्स
The following scripts are available:
the-stack-headers
-- Retrieves header names from The Stack's parquet files.the-stack-licenses
-- Extracts licenses and records from The Stack's license file.
कोड सहायता
यहाँ कुछ स्क्रिप्ट बनाए गए थे जो Parrot कोड असिस्ट का उपयोग करते हैं:
the-stack-headers
the-stack-licenses
ये स्क्रिप्ट The Phind-CodeLlama-34B-v2_q8.guff मॉडल से TheBloke द्वारा बनाए गए हैं।
टिप्पणी
पर्रोट दस्तावेज़ अंग्रेजी में लिखा गया है और अन्य भाषों के लिए आईएमटी-अभिसंक्रमण पर अवतर