ชุดข้อมูล Smack

วัตถุดิบของ Smack Dataset ไม่มีสัจจะว์ ในอนาคต ถ้ามีการเกิด จะเป

Note

พาร์โรต (Parrot) ยังอยู่ในการพัฒนาตั้งแต่เริ่มของระบบ ยังไม่สามารถใช้งานโดยผู้ใช้สุดท้ายได้

ข้อมูลเมตาดาต้าของสแกน

เส้นทางมีโครงการจัดเก็บข้อมูลเมตาแยกต

Link to the Git Repository:

git clone https://huggingface.co/datasets/bigcode/the-stack-metadata

กำลังดาวน์โหลดข้อมูล

ข้อมูลเม타ดาต้าในปริมาณที่น้อยกว่าแต่ยังสูงเป็นพิเศษ จะไม่เท่ากับข้อมูลชุดของทั้งห

Reading Metadata

ข้อมูลเมตาดาต้าของสแกนนี้จัดเก็บในรูปแบบ parquet ไฟล์ parquetทั้งหมดมีขนาด 562

เลือก repo ที่สนใจ

Write a script to filter appropriate repositories based on libre criteria.

การค隆เรปโอสในภาษาไทย

เขียนสคริปต์เพื่อทำซ้ำการลงชื่อในเก็บเล่มที่เลือกไว้.

รถไฟ

ใช้รหัสการทำงานอิสระจาก Bigcode (ผู้สร้างของ The Stack) สำหรับการดูแลตัวอย่าง.

สคริปต์

รายการสคริปต์ที่พร้อมใช้งานดังนี้:

  • the-stack-headers -- Retrieves header names from The Stack's parquet files.

  • the-stack-licenses -- Extracts licenses and records from The Stack's license file.

การช่วยเหลือโค๊ด

คำสั่งด้านล่างถูกพัฒนาโดยใช้ Parrot code assist:

  • the-stack-headers

  • the-stack-licenses

เหตุการณ์ควบคุมนี้ถูกสร้างขึ้นด้วยโมเดล The Phind-CodeLlama-34B-v2_q8.guff จาก TheBloke.

Note

แม่ค้าสาขาวกันได้ เอกสารเป็นภาษาอังกฤษ และใช้แปลโดยตรง AI ภาษาอื่น