Loading...

Glosario del Data Science, parte 1

La entrada de hoy va a ser diferente. Esta vez, va a tener un fin completamente didáctico. Para que tengas los conocimientos básicos y comprendas la terminología alrededor del Data Science, vamos a recopilar los términos más conocidos en un Glosario del Data Science online de la A a la Z. ¡Aquí llega nuestro glosario del Data Science! ¡A tu servicio para enseñarte! Pero antes…

¿Qué es el Data Science?

El Data Science es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados. Así, el Data Science puede entenderse como una continuación de campos como la estadística, el Data Mining, Machine Learning y analítica predictiva.

El Data Science trabaja con datos incompletos e incluso desordenados. Y funciona analizando los datos para ver qué información obtiene, administrar grandes conjuntos de datos que son un gran desafío y los hallazgos impulsan decisiones sobre operaciones y productos.

Glosario del Data Science

Algoritmo

Una serie de pasos repetibles para llevar a cabo un cierto tipo de tarea con datos. Al igual que con las estructuras de datos, las personas que estudian informática estudian acerca de los diferentes algoritmos y su idoneidad para diversas tareas. Las estructuras de datos específicas a menudo juegan un rol en cómo ciertos algoritmos se implementan.

Big Data

El Big Data es la capacidad de trabajar con colecciones de datos que antes no eran prácticos debido a su volumen, velocidad y variedad. Un impulsor clave de esta nueva capacidad ha sido la distribución mas fácil del almacenamiento y procesamiento a través de redes de hardware básico de bajo costo utilizando tecnología como Hadoop en lugar de requerir de computadoras individuales mas grandes y potentes. El trabajo realizado con esta gran cantidad de datos se basa en las habilidades del Data Science.

Distribución binomial

Una distribución binomial es una distribución de probabilidad ampliamente utilizada de una variable aleatoria discreta, esta describe varios procesos de interés para los administradores. Describe datos discretos resultantes de un experimento denominado proceso de Bernoulli.

Clustering (agrupamiento)

El clustering es una tarea que consiste en agrupar un conjunto de objetos (no etiquetados) en subconjuntos de objetos llamados Clusters. Cada Cluster está formado por una colección de objetos que son similares entre sí, pero que son distintos respecto a los objetos de otros Clusters.

El clustering se enmarca dentro del aprendizaje no supervisado. Es decir, que para esta técnica solo disponemos de un conjunto de datos de entrada, sobre los que debemos obtener información de la estructura del dominio de salida, que es una información de la cual no disponemos.

Científico de datos

Un Data Scientist es un experto en Data Science, su trabajo consiste en extraer conocimiento a partir de los datos para poder responder a las preguntas que se le formulan.

Correlación

El grado de correspondencia relativa entre dos conjuntos de datos. Si las ventas aumentan cuando aumenta el presupuesto publicitario, se correlacionan. El coeficiente de correlación es una medida de qué cómo se correlacionan dos conjuntos de datos. Un coeficiente de correlación de 1 es una correlación perfecta, 0.9 es una correlación fuerte y 0.2 es una correlación débil. Este valor también puede ser negativo, como cuando la incidencia de una enfermedad disminuye cuando las vacunas aumentan. Un coeficiente de correlación de -1 es una correlación negativa perfecta. Recuerde siempre, sin embargo, que la correlación no implica causalidad.

Covarianza

Mientras que la varianza mide cómo una sola variable se desvía de su media, la covarianza mide cómo dos variables varían en tándem de sus medios.

Data Mining

Consiste en analizar grandes conjuntos de datos para buscar patrones que permitan a las personas tomar decisiones comerciales. Aunque no es exactamente Data Science, el Data Mining sí que tiene elementos en común.

¿Interesado en el Data Science?

Si tras esta lectura estás interesado y quieres conocer más acerca del Data Science, no dudes en contactar con nosotros. Estamos aquí para lo que necesites. Pero sobre todo, te aconsejamos estar pendiente de las próximas entradas. ¡Muy pronto tendrás disponible la segunda entrada de nuestro glosario!

Sin Comentarios (0)

    Dejar un Comentario

    Solicita Información

    Rellene este formulario para enviarnos cualquier consulta. En breve nos pondremos en contacto contigo.



    Dirección
    Madrid (España)
     Anterior  Todos Siguiente