تجميعة البيانات السمك

الجمعة لم تكن موجودة. في المستقبل، إذا وقعت، ستكون إصدار حر البناء

ملاحظة

Parrot is in early development, not ready for end users.

البيانات الفوقية للمكدس

الستاك لديه مستودع معلومات منفرد يحتوي

رابط المستودع الجيت:

git clone https://huggingface.co/datasets/bigcode/the-stack-metadata

جارٍ تنزيل البيانات

البيانات الفوقية أصغر من جميع البيانات، لكنها ما زالت مساوية لحد كبير. يتكون مخزن البيانات الف

قراءة المعلومات

تخزين البيانات الفهرسة للمكدس بتنسيق parquet. تشمل الملفات parquet حجمًا معادلًا 562 غيغا

اختيار المستودعات

اكتب سكريبتًا لتصفية المستودعات المناسبة استنادًا إلى معايير ليبر.

نسخ المستودعات

Write a script to clone the selected repositories.

القطار

استخدم الكود الحر من بيغ كود (صنعاء قوات الدعم) لتدريب النموذج.

البرامج

البرامج التالية متوفرة:

  • the-stack-headers -- Retrieves header names from The Stack's parquet files.

  • the-stack-licenses -- Extracts licenses and records from The Stack's license file.

Code Assist

قالب النصوص التالفة تم تطويرها باستخدام كود المساعدة Parrot:

  • the-stack-headers

  • the-stack-licenses

تم إنشاء هذي السكريبتات باستخدام النموذج The Phind-CodeLlama-34B-v2_q8.guff من TheBloke.

ملاحظة

توثيق بارتون مكتوب بالإنجليزية ويستخدم الترجمة الآلية للغات أخرى.