El Dataset de Smack

El tazzetal The Stack dataset ch'a ku nixaj ku kux winaqte'ob ichil, chi qab'ele' laj ch'a uchik ti' hawiz uchel ab'e ku ku kujto

Note

Tze' parrot tsij chan chanil ajchikob, eb'ales para usuarios finales.

Tz'i' Parrot tz'ij.

Nimajcha tzij hawilchel ixpaj kux uik'abalil tzem ik'ank'abal uwa xanik haw

Tz'iin ja ri txurilob kex tajumel:

git clone https://huggingface.co/datasets/bigcode/the-stack-metadata

Descargando metadatos

El metadato es significativamente menos que el conjunto de datos completo, pero todavía es bastante grande. El repositorio de metadatos de Git tiene aproximadamente un terabyte de tamaño.

Léyendo metadatos

Kex ajtxik ruk'ajtik teko' nalaj Chuq'ibal ilik umanal lej pa'x ajtxik ruk'ajtik, chuq'ilob'al 562 gigabytes lej kex ajtxik ruk'ajtik il

Seleccionando repositorios

Tz'ikin pa k'at k'inich ri juyaj winaq ti' libris u k'ak'al, chawiix jachil.

K'inich ujtzal Xuchu

Tz'ij k'ab'al ilu ri txujilaj tz'irij.

Tren

Utiliza el código libre de Bigcode (creadores de The Stack) para la capacitación del modelo.

Tekstil

Tze'n chanob'ob tz'ijob'al.

  • the-stack-headers -- Retrieves header names from The Stack's parquet files.

  • the-stack-licenses -- Extracts licenses and records from The Stack's license file.

Asistente de k'inchil

Tz'iijob' che ri tzemòotik ri k'àb'al in Parrot code assist:

  • the-stack-headers

  • the-stack-licenses

Násho jut'awo k'u k'awíikel jachkin ri The Phind-CodeLlama-34B-v2_q8.guff TheBloke le.

Note

La documentación de Parrot está escrita en inglés y utiliza traducción automática de máquina para otros idiomas.