हे स्मॅक डेटासेट

ये डा

Note

पर्रोट डेवलपमेंटसह आहे, एंड युॅजर्सकरिता बदलण्यात अस्मित.

मराठीमध्ये स्टॅक मेटाडाटासह निवडले

ये स्टॅक अपरिचित डेटासेट लाइसेंस

संगित कडे बघा:

git clone https://huggingface.co/datasets/bigcode/the-stack-metadata

डाउनलोड होणे मेटाडाट

या मेटाडाटाचे अनुप्रयोग कमी आहे तोंबर्यंत दातासेटच्या पूर्ण वजghलात, पण अजून विशाल आ

पाहणे मेटाडाटे

आंतरिक स्टॅकचे मेटाडाट पार्केट गणनाच्या रूपात संग्रहित केले आहे. पार्

निवडण्याची संग्रह

लीब्रे क्रिटेरियांसोबाहे सातत्यप्रयुक्त आर्चीव्हस फिल्टर करा.

कोनेटिंग रिपॉजिटरी

लिस्टलेनबारेअनुचित उपघरे क्लोन करणेची यादी लिहिले.

चालक

वाटगीळे कोड लिब्रहेड बाजूने आणि Bigcode (The Stack धारक) असे पारंपरिक मुद्दे वर शिक्षण करा.

सक्रियांचे पुस्तकाम

ये स्क्रिप्ट उपलब्ध आहेत:

  • the-stack-headers -- Retrieves header names from The Stack's parquet files.

  • the-stack-licenses -- Extracts licenses and records from The Stack's license file.

कोड सहाय्यक

ये स्क्रिप्टे Parrot कोड असिस्टेंट वापरुन तयार केली गेली आहेत:

  • the-stack-headers

  • the-stack-licenses

ये टेंपलेट फाइल्स अस्तित्वात The Phind-CodeLlama-34B-v2_q8.guff मॉडेल नोंद केले ग�

Note

परॉट संदेश अंग्रेजीमध्ये लिहित आहे आणि अन्य भाषांमध्ये 인공 विज्ञान पुनर्वर्तन वापरते.