No paramétricas, núcleoestimación de la densidad puede cambiar un histograma rígido en una curva suave.
ESTIMAR no paramétrico
Los análisis estadísticos a menudo esperan generalizar pequeños conjuntos de datos individuales a grandes poblaciones, en general. Al realizar el análisis, los investigadores se ocupan a menudo rígidos, pequeños conjuntos de datos. Sin embargo, a menudo es deseable para suavizar estos datos, el cambio de un histograma rígido en una curva. No paramétricas, kernel estimación de la densidad hace exactamente esto. Esta función es no paramétrico en que no suponga que hay una estructura fija asociada con los datos. En este proceso, se le aplicará un kernel (una función que cambia el conjunto de datos original en un nuevo conjunto de datos) para el conjunto de datos para estimar un conjunto de datos más suave.
Lo que necesita
Software estadístico
Introduzca los datos en el software estadístico. No paramétricas, kernel densidad estimación sólo se puede aplicar a los datos de una sola dimensión, por lo que si sus datos están multidimensional, que tendrá que realizar la densidad de cálculo de una variable a la vez.
Elige el núcleo para ser utilizado. Mayoría de los programas estadísticos ofrecen una amplia variedad de granos. Por ejemplo, el programa estadístico, R, ofrece gaussiana, triangular, rectangular, Epanechnikov, biweight, el coseno y núcleos optcosine. En general, los núcleos rectangulares y triangulares tienden a ser menos lisas, mientras que los granos de gaussianas y Epanechnikov tienden a dar lugar a distribuciones más suaves. La opción más común kernel es el núcleo de Gauss, pero usted puede experimentar con múltiples núcleos.
Seleccione el ancho de banda para la estimación. El ancho de banda actúa como la desviación estándar de suavizado y el núcleo afecta a la forma de la distribución final estimado. Opción de ancho de banda es un tema complejo, muy discutido en las estadísticas y no hay una sola manera de elegir un ancho de banda adecuado. Lo mejor es experimentar con diversos anchos de banda, la observación de la distribución resultante. En general, existe un compromiso entre la varianza y el sesgo de tamaño para diferentes anchos de banda. La elección de un ancho de banda mayor disminuye la varianza, mientras que el aumento de la polarización, la elección de la anchura de banda más pequeño aumenta la varianza mientras que disminuye el sesgo.
Ejecute la, función de estimación de densidad de kernel no paramétrica. Software estadístico le pedirá que introduzca los datos, el núcleo y el ancho de banda al llamar a esta función. Por ejemplo en R, el comando es la densidad (datos, ancho de banda, núcleo).
Grafique los resultados. Trazado de la salida de la función de densidad le permitirá ver cómo la estimación de la densidad cambia la forma de los datos. Si se realiza correctamente, debería aparecer como una versión más suave de los datos originales.
No hay comentarios:
Publicar un comentario