Consejos de rendimiento

Heurísticas

SheShe aplica reglas simples para mantener los tiempos de ejecución manejables. La principal es auto_rays_by_dim, que limita base_2d_rays a medida que crece la dimensionalidad:

  • 2–24 características → usa el valor completo de base_2d_rays (32 por defecto).
  • 25–64 características → limita base_2d_rays a 16.
  • 65+ características → limita base_2d_rays a 12.

Desactiva este comportamiento con auto_rays_by_dim=False para mantener el número original de rayos.

Conjuntos de datos de alta dimensión

Los espacios de características grandes requieren cuidado adicional. Considera los siguientes ajustes al trabajar con decenas o cientos de dimensiones:

  • Reduce rayos: establece base_2d_rays en 16 o 12 cuando auto_rays_by_dim esté desactivado o se necesite un límite más bajo.
  • Recorta pasos de exploración: baja scan_steps de 24 a 12 para reducir a la mitad las evaluaciones a lo largo de cada rayo.
  • Limita la exploración: disminuye n_max_seeds y max_subspaces para restringir el número de puntos iniciales y subespacios escaneados.
  • Preselecciona subespacios: ejecuta SubspaceScout para enfocarte en pares de características prometedores antes de lanzar búsquedas más pesadas.

Consulta el README para contexto adicional sobre cómo interactúan estos parámetros.