Reproducibilidad
Sistema de referencia
- SO: Ubuntu 24.04.2 LTS
- CPU: Intel(R) Xeon(R) Platinum 8171M CPU @ 2.60GHz
- GPU: Ninguna
- Python: 3.12.10
Configuración del entorno
- Crear y activar un entorno virtual:
python -m venv .venv source .venv/bin/activate - Instalar dependencias de desarrollo y ejecutar pruebas para verificar:
pip install -e ".[dev]" PYTHONPATH=src pytest -q
Semillas aleatorias
Todos los estimadores de SheShe aceptan un argumento random_state para asegurar resultados deterministas:
from sheshe import ModalBoundaryClustering
clustering = ModalBoundaryClustering(random_state=0)Fija el mismo random_state en ejecuciones distintas para reproducir experimentos.
Exportar información del sistema
Captura versiones exactas de paquetes y detalles de la plataforma para referencia futura:
python -m pip freeze > packages.txt
python - <<'PY'
import json, platform, sys
info = {
"platform": platform.platform(),
"python": sys.version,
}
print(json.dumps(info, indent=2))
PY
Cómo reportar diferencias
Si los resultados difieren de los benchmarks publicados:
- Comparte el
packages.txtgenerado y el JSON de plataforma. - Describe el conjunto de datos y parámetros usados, incluyendo valores de
random_state. - Abre un issue con registros y pasos de reproducción.
TODO
- Especificar capacidad de RAM recomendada.