ڈیٹاست پر کوئی بیان نہیں کیا جا سکتا اسے تفصیلی طور پر ملاحظہ کرتے ہوئے
کہانی کی تشخیص میں بھرپور سے زیادہ ہوتی ہے، جبکہ اس کے لئے
Note
پرارٹ (Parrot) مبتدی اہلکی میں ہے، یہ نے استعمال کا دور نہیں ہے.
دائرۂ کا میٹاڈاتا فائل
یادگاری کے لیے مختصر عوام حفظ شدہ سائ
لنك براء المستودع گِت:
git clone https://huggingface.co/datasets/bigcode/the-stack-metadata
ميتاڈائٹا ڈاؤن لوڑ رہا ہے
یہ میٹاڈیٹا کم آر کم سب ڈیٹاسےت سے کم ہے، لیکن انھیں بہت بڑا ہے۔ جیٹ میٹا
Reading Metadata
اسٹیک کی متادیت پارکٹ فارمیٹ میں محفوظ ہے۔ پارکٹ فائلیں 562 گیگا
حداکث مخازن کی تبدیلی
Write a script to filter appropriate repositories based on libre criteria.
کلونیگ ریپاز
لطفاً انتخاب شده ریپازیتوریها را کلون کنید اسکریپت نوشته کنید.
قایدہ
استعمال کریں لائبر کوڈ فرے سے Bigcode (The Stack دی بنانے والے) موڈل ٹریننگ کے لئے۔
اسکریپٹس
ایک سے زیادہ اسکرپٹ دستیاب ہیں:
the-stack-headers
-- Retrieves header names from The Stack's parquet files.the-stack-licenses
-- Extracts licenses and records from The Stack's license file.
کوڈ آسیسٹانٹ
اس کے آگے بنی ہوئے اسکریپٹز پارات کوڈ اسیسٹ کے استعمال سے بنائے گئے ہیں:
the-stack-headers
msgstr:""
یہ اسکرپٹ سامنے The Phind-CodeLlama-34B-v2_q8.guff موڈل سے TheBloke سے بنائے گئے ہیں۔
Note
پاررائٹ ڈاکیومنٹیشن انگلیسی میں لکھی گئی ہے اور دوسرے زبانوں کے لئے ای آئی ماشین ٹرانسلیشن