تجميعة البيانات السمك
الجمعة لم تكن موجودة. في المستقبل، إذا وقعت، ستكون إصدار حر البناء
ملاحظة
Parrot is in early development, not ready for end users.
البيانات الفوقية للمكدس
الستاك لديه مستودع معلومات منفرد يحتوي
رابط المستودع الجيت:
git clone https://huggingface.co/datasets/bigcode/the-stack-metadata
جارٍ تنزيل البيانات
البيانات الفوقية أصغر من جميع البيانات، لكنها ما زالت مساوية لحد كبير. يتكون مخزن البيانات الف
قراءة المعلومات
تخزين البيانات الفهرسة للمكدس بتنسيق parquet. تشمل الملفات parquet حجمًا معادلًا 562 غيغا
اختيار المستودعات
اكتب سكريبتًا لتصفية المستودعات المناسبة استنادًا إلى معايير ليبر.
نسخ المستودعات
Write a script to clone the selected repositories.
القطار
استخدم الكود الحر من بيغ كود (صنعاء قوات الدعم) لتدريب النموذج.
البرامج
البرامج التالية متوفرة:
the-stack-headers
-- Retrieves header names from The Stack's parquet files.the-stack-licenses
-- Extracts licenses and records from The Stack's license file.
Code Assist
قالب النصوص التالفة تم تطويرها باستخدام كود المساعدة Parrot:
the-stack-headers
the-stack-licenses
تم إنشاء هذي السكريبتات باستخدام النموذج The Phind-CodeLlama-34B-v2_q8.guff من TheBloke.
ملاحظة
توثيق بارتون مكتوب بالإنجليزية ويستخدم الترجمة الآلية للغات أخرى.