Etiqueta: Estadística

  • Estadística descriptiva

    Estadística descriptiva

    Estadística descriptiva
    Imagen de Ruthson Zimmerman

    ¿Qué es la estadística descriptiva?

    La estadística descriptiva es un coeficientes descriptivo breve que resume un conjunto de datos dado, que puede ser una representación de la totalidad o una muestra de una población. Las estadísticas descriptivas se dividen en medidas de tendencia central y medidas de variabilidad (propagación). Las medidas de tendencia central incluyen la media, la mediana y la moda, mientras que las medidas de variabilidad incluyen la desviación estándar, la varianza, las variables mínima y máxima, y ​​la curtosis y la asimetría estadística.

    Comprensión de la estadística descriptiva.

    En resumen, las estadísticas descriptivas ayudan a describir y comprender las características de un conjunto de datos específico al brindar breves resúmenes sobre la muestra y las medidas de los datos. Los tipos más reconocidos de estadística descriptiva son las medidas de centro: la media, la mediana y la moda, que se utilizan en casi todos los niveles de matemáticas y estadística. La media, o el promedio, se calcula sumando todas las cifras dentro del conjunto de datos y luego dividiendo por el número de cifras dentro del conjunto. Por ejemplo, la suma del siguiente conjunto de datos es 20: (2, 3, 4, 5, 6). La media es 4 (20/5). La moda de un conjunto de datos es el valor que aparece con más frecuencia y la mediana es la cifra situada en el medio del conjunto de datos. Es la figura que separa las cifras superiores de las inferiores dentro de un conjunto de datos. Sin embargo, hay tipos menos comunes de estadística descriptiva que siguen siendo muy importantes.

    Las personas usan estadísticas descriptivas para reutilizar conocimientos cuantitativos difíciles de entender a través de un gran conjunto de datos en descripciones del tamaño de un bocado. El promedio de calificaciones de un estudiante (GPA), por ejemplo, proporciona una buena comprensión de las estadísticas descriptivas. La idea de un GPA es que toma puntos de datos de una amplia gama de exámenes, clases y calificaciones, y los promedia juntos para proporcionar una comprensión general del desempeño académico general de un estudiante. El GPA personal de un estudiante refleja su rendimiento académico medio.

    Medidas de estadística descriptiva.

    Todas las estadísticas descriptivas son medidas de tendencia central o medidas de variabilidad, también conocidas como medidas de dispersión. Las medidas de tendencia central se centran en los valores medios o medios de los conjuntos de datos, mientras que las medidas de variabilidad se centran en la dispersión de los datos. Estas dos medidas utilizan gráficos, tablas y discusiones generales para ayudar a las personas a comprender el significado de los datos analizados.

    Las medidas de tendencia central describen la posición central de una distribución para un conjunto de datos. Una persona analiza la frecuencia de cada punto de datos en la distribución y la describe usando la media, mediana o moda, que mide los patrones más comunes del conjunto de datos analizados.

    Las medidas de variabilidad, o las medidas de dispersión, ayudan a analizar qué tan dispersa está la distribución para un conjunto de datos. Por ejemplo, si bien las medidas de tendencia central pueden dar a una persona el promedio de un conjunto de datos, no describen cómo se distribuyen los datos dentro del conjunto. Entonces, si bien el promedio de los datos puede ser 65 de 100, todavía puede haber puntos de datos tanto en 1 como en 100. Las medidas de variabilidad ayudan a comunicar esto al describir la forma y la extensión del conjunto de datos. El rango, los cuartiles, la desviación absoluta y la varianza son ejemplos de medidas de variabilidad. Considere el siguiente conjunto de datos: 5, 19, 24, 62, 91, 100. El rango de ese conjunto de datos es 95, que se calcula restando el número más bajo (5) en el conjunto de datos del más alto (100).

  • Analítica de datos.

    Analítica de datos.

    ¿Qué es la analítica de datos?
    Imagen de Luke Chesser

    ¿Qué es la analítica de datos?

    La analítica de datos es la ciencia de analizar los datos en bruto para sacar conclusiones sobre esa información. Muchas de las técnicas y procesos de análisis de datos han sido automatizadas en procesos mecánicos y algoritmos que trabajan sobre los datos en bruto para el consumo humano.

    Las técnicas de analítica de datos pueden revelar tendencias y métricas que de otra manera se perderían en la masa de información. Esta información puede entonces ser utilizada para optimizar los procesos y aumentar la eficiencia general de un negocio o sistema.

    Entendiendo la analítica de datos.

    La analítica de datos es un término amplio que abarca muchos tipos diversos de análisis de datos. Cualquier tipo de información puede ser sometida a las técnicas de análisis de datos para obtener una visión que puede ser utilizada para mejorar las cosas.

    Por ejemplo, las empresas manufactureras suelen registrar el tiempo de ejecución, el tiempo de inactividad y la cola de trabajo de varias máquinas y luego analizan los datos para planificar mejor las cargas de trabajo para que las máquinas funcionen más cerca de su capacidad máxima.

    La analítica de datos puede hacer mucho más que señalar los cuellos de botella en la producción. Las compañías de juegos utilizan el análisis de datos para establecer programas de recompensas para los jugadores que mantienen a la mayoría de los jugadores activos en el juego. Las compañías de contenido utilizan muchos de los mismos análisis de datos para mantenerte haciendo clic, viendo o reorganizando el contenido para obtener otra vista u otro clic.

    El proceso de análisis de datos implica varios pasos diferentes:

    1. El primer paso es determinar los requisitos de datos o cómo se agrupan los datos. Los datos pueden estar separados por edad, demografía, ingresos o género. Los valores de los datos pueden ser numéricos o ser divididos por categoría.
    2. El segundo paso en el análisis de los datos es el proceso de recopilación de los mismos. Esto se puede hacer a través de una variedad de fuentes como computadoras, fuentes en línea, cámaras, fuentes ambientales, o a través del personal.
    3. Una vez que los datos son recolectados, deben ser organizados para que puedan ser analizados. La organización puede llevarse a cabo en una hoja de cálculo u otra forma de software que pueda tomar datos estadísticos.
    4. Los datos se limpian antes de ser analizados. Esto significa que se limpian y se comprueban para asegurar que no hay duplicación o error, y que no están incompletos. Este paso ayuda a corregir cualquier error antes de que pase a un analista de datos para ser analizado.

    [Importante: La analítica se centra en llegar a conclusiones basadas en lo que el analista ya sabe.]

    ¿Por qué es importante la analítica de datos?

    El análisis de datos es importante porque ayuda a las empresas a optimizar sus rendimientos. Su implementación en el modelo de negocios significa que las empresas pueden ayudar a reducir los costos identificando formas más eficientes de hacer negocios y almacenando grandes cantidades de datos.

    Una empresa también puede utilizar el análisis de datos para tomar mejores decisiones de negocios y ayudar a analizar las tendencias y la satisfacción de los clientes, lo que puede conducir a nuevos y mejores productos y servicios.

    Tipos de análisis de datos.

    El análisis de datos se divide en cuatro tipos básicos:

    1. El análisis descriptivo reseña lo que ha sucedido en un período de tiempo determinado. ¿Ha aumentado el número de vistas? ¿Son las ventas más fuertes este mes que el anterior?

    2. La analítica diagnóstica se centra más en el porqué de lo que ha pasado. Esto involucra una entrada de datos más diversa y un poco de hipótesis. ¿Afectó el clima a las ventas de cerveza? ¿La última campaña de marketing tuvo un impacto en las ventas?

    3. El análisis predictivo se mueve hacia lo que probablemente sucederá a corto plazo. ¿Qué pasó con las ventas la última vez que tuvimos un verano caluroso? ¿Cuántos modelos meteorológicos predicen un verano caluroso este año?

    4. La analítica prescriptiva sugiere un curso de acción. Si la probabilidad de un verano caluroso se mide como un promedio de estos cinco modelos meteorológicos está por encima del 58%, deberíamos añadir un turno de tarde a la cervecería y alquilar un tanque adicional para aumentar la producción.

    El análisis de datos sustenta muchos sistemas de control de calidad en el mundo financiero, incluyendo el siempre popular programa Six Sigma. Si no está midiendo algo correctamente, ya sea su peso o el número de defectos por millón en una línea de producción, es casi imposible optimizarlo.

    Consideraciones especiales: ¿Quién utiliza el análisis de datos?

    Algunos de los sectores que han adoptado el uso de la analítica de datos incluyen la industria de los viajes y la hostelería, donde los plazos de entrega pueden ser rápidos. Esta industria puede recopilar datos de los clientes y averiguar dónde están los problemas, si los hay, y cómo solucionarlos.

    El sector de la salud combina el uso de grandes volúmenes de datos estructurados y no estructurados y utiliza el análisis de datos para tomar decisiones rápidas. De manera similar, la industria de la venta al por menor utiliza cantidades copiosas de datos para satisfacer las demandas siempre cambiantes de los compradores. La información que los minoristas recopilan y analizan puede ayudarles a identificar tendencias, recomendar productos y aumentar los beneficios.