ชุดข้อมูล Smack
วัตถุดิบของ Smack Dataset ไม่มีสัจจะว์ ในอนาคต ถ้ามีการเกิด จะเป
Note
พาร์โรต (Parrot) ยังอยู่ในการพัฒนาตั้งแต่เริ่มของระบบ ยังไม่สามารถใช้งานโดยผู้ใช้สุดท้ายได้
ข้อมูลเมตาดาต้าของสแกน
เส้นทางมีโครงการจัดเก็บข้อมูลเมตาแยกต
Link to the Git Repository:
git clone https://huggingface.co/datasets/bigcode/the-stack-metadata
กำลังดาวน์โหลดข้อมูล
ข้อมูลเม타ดาต้าในปริมาณที่น้อยกว่าแต่ยังสูงเป็นพิเศษ จะไม่เท่ากับข้อมูลชุดของทั้งห
Reading Metadata
ข้อมูลเมตาดาต้าของสแกนนี้จัดเก็บในรูปแบบ parquet ไฟล์ parquetทั้งหมดมีขนาด 562
เลือก repo ที่สนใจ
Write a script to filter appropriate repositories based on libre criteria.
การค隆เรปโอสในภาษาไทย
เขียนสคริปต์เพื่อทำซ้ำการลงชื่อในเก็บเล่มที่เลือกไว้.
รถไฟ
ใช้รหัสการทำงานอิสระจาก Bigcode (ผู้สร้างของ The Stack) สำหรับการดูแลตัวอย่าง.
สคริปต์
รายการสคริปต์ที่พร้อมใช้งานดังนี้:
the-stack-headers
-- Retrieves header names from The Stack's parquet files.the-stack-licenses
-- Extracts licenses and records from The Stack's license file.
การช่วยเหลือโค๊ด
คำสั่งด้านล่างถูกพัฒนาโดยใช้ Parrot code assist:
the-stack-headers
the-stack-licenses
เหตุการณ์ควบคุมนี้ถูกสร้างขึ้นด้วยโมเดล The Phind-CodeLlama-34B-v2_q8.guff จาก TheBloke.
Note
แม่ค้าสาขาวกันได้ เอกสารเป็นภาษาอังกฤษ และใช้แปลโดยตรง AI ภาษาอื่น