El Dataset de Smack
El tazzetal The Stack dataset ch'a ku nixaj ku kux winaqte'ob ichil, chi qab'ele' laj ch'a uchik ti' hawiz uchel ab'e ku ku kujto
Note
Tze' parrot tsij chan chanil ajchikob, eb'ales para usuarios finales.
Tz'i' Parrot tz'ij.
Nimajcha tzij hawilchel ixpaj kux uik'abalil tzem ik'ank'abal uwa xanik haw
Tz'iin ja ri txurilob kex tajumel:
git clone https://huggingface.co/datasets/bigcode/the-stack-metadata
Descargando metadatos
El metadato es significativamente menos que el conjunto de datos completo, pero todavía es bastante grande. El repositorio de metadatos de Git tiene aproximadamente un terabyte de tamaño.
Léyendo metadatos
Kex ajtxik ruk'ajtik teko' nalaj Chuq'ibal ilik umanal lej pa'x ajtxik ruk'ajtik, chuq'ilob'al 562 gigabytes lej kex ajtxik ruk'ajtik il
Seleccionando repositorios
Tz'ikin pa k'at k'inich ri juyaj winaq ti' libris u k'ak'al, chawiix jachil.
K'inich ujtzal Xuchu
Tz'ij k'ab'al ilu ri txujilaj tz'irij.
Tren
Utiliza el código libre de Bigcode (creadores de The Stack) para la capacitación del modelo.
Tekstil
Tze'n chanob'ob tz'ijob'al.
the-stack-headers
-- Retrieves header names from The Stack's parquet files.the-stack-licenses
-- Extracts licenses and records from The Stack's license file.
Asistente de k'inchil
Tz'iijob' che ri tzemòotik ri k'àb'al in Parrot code assist:
the-stack-headers
the-stack-licenses
Násho jut'awo k'u k'awíikel jachkin ri The Phind-CodeLlama-34B-v2_q8.guff TheBloke le.
Note
La documentación de Parrot está escrita en inglés y utiliza traducción automática de máquina para otros idiomas.