Muestreo Estadístico

J.E. Martín 2025 (c)

Introducción al Muestreo Estadístico

Muestreo de Hipercúbico Latino (LHS)

El Muestreo de Hipercúbico Latino (LHS) es una técnica de muestreo estratificado que proporciona una cobertura más eficiente del espacio muestral en comparación con el muestreo aleatorio simple. Es particularmente útil para problemas multidimensionales.

Características principales:

  • Asegura que se muestrea todo el rango de cada variable
  • Divide la distribución de probabilidad acumulativa de cada parámetro de entrada en intervalos iguales
  • Selecciona aleatoriamente un valor de cada intervalo
  • Requiere menos muestras que Monte Carlo para una precisión comparable
  • Proporciona una mejor cobertura de las colas de la distribución

LHS es particularmente valioso cuando se trata de contaminación radiológica que puede tener una variabilidad significativa y cuando el número de muestras debe ser limitado debido a preocupaciones de costo o seguridad.

Algoritmo LHS:

  1. Dividir la función de distribución acumulativa (CDF) de cada variable en N intervalos igualmente probables
  2. De cada intervalo, seleccionar aleatoriamente un valor
  3. Emparejar las variables aleatoriamente para formar N muestras

Esto asegura que la muestra incluya el rango completo de cada variable manteniendo la aleatoriedad dentro de cada intervalo.

Muestreo de Monte Carlo

El muestreo de Monte Carlo es una técnica que utiliza números aleatorios o pseudoaleatorios para muestrear una distribución de probabilidad. Se utiliza ampliamente para el análisis de incertidumbre y la estimación de probabilidad en sistemas complejos.

Características principales:

  • Basado en el muestreo aleatorio repetido
  • Proporciona estimaciones estadísticas con incertidumbre cuantificable
  • Maneja problemas complejos y multidimensionales
  • Conceptualmente simple y ampliamente aplicable
  • Tasa de convergencia de aproximadamente 1/√N (donde N es el número de muestras)

En la caracterización radiológica, los métodos de Monte Carlo son valiosos para modelar la incertidumbre en los niveles de contaminación y para tomar decisiones basadas en la probabilidad sobre las estrategias de remediación.

Proceso de Monte Carlo:

  1. Definir el dominio de las posibles entradas
  2. Generar entradas aleatoriamente a partir de distribuciones de probabilidad
  3. Realizar cálculos deterministas sobre las entradas
  4. Agregar los resultados y analizar estadísticamente

La precisión de los métodos de Monte Carlo aumenta con el número de simulaciones, siguiendo la ley de los grandes números.

Comparación de Métodos de Muestreo

Método de Muestreo Ventajas Limitaciones Mejor Uso Para
Aleatorio Simple
  • Fácil de implementar
  • Sin sesgo
  • Teoría estadística bien desarrollada
  • Puede pasar por alto áreas importantes
  • Ineficiente para distribuciones complejas
  • Requiere grandes muestras
Sitios homogéneos con mínima información previa
Sistemático/Cuadrícula
  • Buena cobertura espacial
  • Fácil de implementar en campo
  • Patrones visuales fácilmente detectados
  • Puede pasar por alto patrones periódicos
  • El patrón fijo puede no adaptarse a las condiciones
  • Puede ser estadísticamente complejo
Sitios que requieren cobertura uniforme; al mapear la contaminación
Opinático
  • Utiliza el conocimiento experto
  • Se dirige a áreas conocidas o sospechosas
  • A menudo rentable
  • Sesgado/no representativo
  • Inferencia estadística limitada
  • Depende de la disponibilidad de expertos
Puntos calientes conocidos; evaluaciones preliminares; sitios pequeños
Hipercúbico Latino
  • Cobertura de distribución eficiente
  • Buena representación de la variabilidad
  • Se necesitan menos muestras que con Monte Carlo
  • Implementación más compleja
  • Requiere conocimiento de la distribución
  • Puede ser computacionalmente intensivo
Sitios complejos con múltiples variables; análisis de incertidumbre
Monte Carlo
  • Maneja escenarios complejos
  • Cuantifica la incertidumbre
  • Ampliamente aplicable
  • Requiere muchas muestras
  • Computacionalmente intensivo
  • Resultados dependientes de la calidad de las distribuciones de entrada
Evaluación de incertidumbre; análisis de riesgo probabilístico

Las siguientes pestañas le permiten ingresar los parámetros, seleccionar los métodos de muestreo apropiados y analizar los resultados.

Entrada de Datos

Cargar Datos

Cargue un archivo Excel que contenga definiciones de parámetros y sus características de distribución. El archivo debe incluir nombres de parámetros, tipos de distribución y valores característicos.

Formatos soportados: .xlsx, .xls

Entrada Manual de Parámetros

Alternativamente, puedes definir manualmente parámetros y sus distribuciones a continuación.

Métodos de Muestreo

Seleccionar Método de Muestreo

Muestreo de Hipercúbico Latino

El Muestreo de Hipercúbico Latino divide la función de distribución acumulativa de cada variable en intervalos de probabilidad iguales. Se muestrea aleatoriamente un valor de cada intervalo, asegurando una cobertura completa del rango de cada variable de entrada.

Este método proporciona una mejor cobertura del espacio muestral con menos muestras en comparación con el muestreo de Monte Carlo puro.

Progreso del Muestreo

Detalles del Método

Algoritmo de Muestreo de Hipercúbico Latino

  1. Divida la función de distribución acumulativa (CDF) de cada variable en N intervalos igualmente probables, donde N es el número de muestras.
  2. De cada intervalo, seleccione aleatoriamente un valor (muestreo estratificado).
  3. Los N valores obtenidos para la primera variable se emparejan aleatoriamente con los N valores de la segunda variable.
  4. Estos N pares se combinan aleatoriamente con los N valores de la tercera variable, y así sucesivamente hasta que se utilicen todas las variables.

Este enfoque asegura que todo el rango de cada variable esté representado, manteniendo la aleatoriedad dentro de cada intervalo. La representación matemática es:

Para cada variable X con función de distribución acumulativa FX:

1. Divida [0,1] en N intervalos: [0,1/N), [1/N,2/N), ..., [(N-1)/N,1]

2. De cada intervalo i, muestree ui ~ U(i/N, (i+1)/N)

3. Aplique la CDF inversa: xi = FX-1(ui)

4. Permute aleatoriamente los índices para cada variable

El resultado es una muestra que representa mejor las distribuciones de entrada que el muestreo aleatorio simple, especialmente con un pequeño número de muestras.

Resultados

Resultados del Muestreo