Reproducibilidad

Sistema de referencia

  • SO: Ubuntu 24.04.2 LTS
  • CPU: Intel(R) Xeon(R) Platinum 8171M CPU @ 2.60GHz
  • GPU: Ninguna
  • Python: 3.12.10

Configuración del entorno

  1. Crear y activar un entorno virtual:
    python -m venv .venv
    source .venv/bin/activate
  2. Instalar dependencias de desarrollo y ejecutar pruebas para verificar:
    pip install -e ".[dev]"
    PYTHONPATH=src pytest -q

Semillas aleatorias

Todos los estimadores de SheShe aceptan un argumento random_state para asegurar resultados deterministas:

from sheshe import ModalBoundaryClustering
clustering = ModalBoundaryClustering(random_state=0)

Fija el mismo random_state en ejecuciones distintas para reproducir experimentos.

Exportar información del sistema

Captura versiones exactas de paquetes y detalles de la plataforma para referencia futura:

python -m pip freeze > packages.txt
python - <<'PY'
import json, platform, sys
info = {
    "platform": platform.platform(),
    "python": sys.version,
}
print(json.dumps(info, indent=2))
PY

Cómo reportar diferencias

Si los resultados difieren de los benchmarks publicados:

  • Comparte el packages.txt generado y el JSON de plataforma.
  • Describe el conjunto de datos y parámetros usados, incluyendo valores de random_state.
  • Abre un issue con registros y pasos de reproducción.

TODO

  • Especificar capacidad de RAM recomendada.