ڈیٹاست پر کوئی بیان نہیں کیا جا سکتا اسے تفصیلی طور پر ملاحظہ کرتے ہوئے

کہانی کی تشخیص میں بھرپور سے زیادہ ہوتی ہے، جبکہ اس کے لئے

Note

پرارٹ (Parrot) مبتدی اہلکی میں ہے، یہ نے استعمال کا دور نہیں ہے.

دائرۂ کا میٹاڈاتا فائل

یادگاری کے لیے مختصر عوام حفظ شدہ سائ

لنك براء المستودع گِت:

git clone https://huggingface.co/datasets/bigcode/the-stack-metadata

ميتاڈائٹا ڈاؤن لوڑ رہا ہے

یہ میٹاڈیٹا کم آر کم سب ڈیٹاسےت سے کم ہے، لیکن انھیں بہت بڑا ہے۔ جیٹ میٹا

Reading Metadata

اسٹیک کی متادیت پارکٹ فارمیٹ میں محفوظ ہے۔ پارکٹ فائلیں 562 گیگا

حداکث مخازن کی تبدیلی

Write a script to filter appropriate repositories based on libre criteria.

کلونیگ ریپاز

لطفاً انتخاب شده ریپازیتوری‌ها را کلون کنید اسکریپت نوشته کنید.

قایدہ

استعمال کریں لائبر کوڈ فرے سے Bigcode (The Stack دی بنانے والے) موڈل ٹریننگ کے لئے۔

اسکریپٹس

ایک سے زیادہ اسکرپٹ دستیاب ہیں:

  • the-stack-headers -- Retrieves header names from The Stack's parquet files.

  • the-stack-licenses -- Extracts licenses and records from The Stack's license file.

کوڈ آسیسٹانٹ

اس کے آگے بنی ہوئے اسکریپٹز پارات کوڈ اسیسٹ کے استعمال سے بنائے گئے ہیں:

  • the-stack-headers

  • msgstr:""

یہ اسکرپٹ سامنے The Phind-CodeLlama-34B-v2_q8.guff موڈل سے TheBloke سے بنائے گئے ہیں۔

Note

پاررائٹ ڈاکیومنٹیشن انگلیسی میں لکھی گئی ہے اور دوسرے زبانوں کے لئے ای آئی ماشین ٹرانسلیشن