El Business Intelligence (BI) es un término utilizado para referirse a las
aplicaciones, la infraestructura y las herramientas que permiten el
análisis de la información para mejorar y optimizar las decisiones y el
rendimiento dentro de las organizaciones. La principal finalidad del BI
es analizar datos para obtener información sobre eventos que ya han
ocurrido.
Big data
hace referencia al almacenamiento de grandes
cantidades de datos y a los procedimientos usados
para obtener información de ellos
Base de datos
A los conjuntos de datos almacenados los denominamos
bases de datos, así los Sistemas Gestores de Bases de
Datos (SGBD) son aplicaciones y programas que permiten
almacenar y gestionar estos grupos de datos
Estadística
Los orígenes de la estadística están relacionados con el gobierno y sus cuerpos administrativos. Es la
rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio que la genera,
siguiendo leyes de probabilidad. Las técnicas estadísticas podemos clasificarlas en dos grupos:
Estadística descriptiva. Es la que utiliza analítica tradicional y es la que intenta explicar y describir los
acontecimientos que han tenido lugar en el pasado.
Estadística inferencial. Incluye una variedad de técnicas
estadísticas que analizan los datos actuales e históricos reales
para hacer predicciones acerca del futuro o de acontecimientos
no conocidos.
Minería de datos.
Es el más utilizado en el ámbito de Big Data. Hace referencia al conjunto de técnicas y métodos que tienen
como objetivo procesar y analizar los datos para la obtención de conocimiento. Estas técnicas de minería de
datos provienen de la inteligencia artificial y de la estadística. Entre los distintos tipos de herramientas
utilizados en los paquetes de data mining, podemos distinguir tres grandes grupos:
Técnicas de inteligencia artificial
Herramientas Simbólicas
SQL
SQL (Structured Query Language): lenguaje de
consulta muy popular para bases de datos
relacionales
Sistemas gestores de bases de datos
Los Sistemas Gestores de Bases de Datos (SGBD) son aplicaciones y programas que permiten almacenar
y gestionar estos grupos de datos. Podemos, nglobar las bases de datos en varios grupos:
Bases de datos relacionales En este tipo de
almacenamiento, los datos se encuentran organizados en
unas estructuras denominadas tablas, organizadas en filas
y columnas. Las filas son las diferentes «ocurrencias» de un
evento y las columnas son los «atributos» de las ocurrencias
Bases de datos multidimensionales Son bases de datos
con estructura de cubos, donde la información se
encuentra optimizada para realizar análisis
multidimensionales. Son parecidas a las relacionales,
con la salvedad de que, en lugar de ser de dos únicas
dimensiones «filas y columnas», cuentan con más de
dos dimensiones.
Bases de datos NoSQL En estas estructuras, también denominadas no relacionales, la información que se
almacena es mucho más variada. Esta flexibilidad permite que los tiempos, tanto de construcción y
desarrollo como de consulta, sean mucho más veloces. También son más fácilmente escalables al tener
estructuras menos rígidas. Dentro de este tipo de bases de datos encontramos diferentes tipos
arquitecturas:
Arquitectura clave/valor. Es el modelo más
popular y de funcionalidad más sencilla, puesto
que cada elemento está identificado por una
clave única. Como algunas de sus principales
características encontramos su eficacia, tanto en
operaciones de escritura como de lectura, que
son altamente divisibles y que permiten escalado
horizontal.
Bases de datos documentales. La información se
almacena como un documento atendiendo a una
estructura simple como .json o .xml, donde existe
una única clave que identifica de manera
inequívoca cada registro.
Bases de datos en grafo. Su principal destino es trabajar
con conjuntos de datos altamente conectados, facilitando
la creación y consulta desde aplicaciones cuya principal
misión es establecer relaciones entre datos.
Bases de datos orientadas a objeto. En estos modelos la
información se organiza como objetos. Está basada en los
mismos principios que la programación orientada a
objetos (POO). Los datos pertenecen a diferentes clases o
grupos de elementos que comparten características, y
que a su vez se relacionan con otras clases.
Bases de datos orientadas a columnas. La información se encuentra organizada en estructuras que
contienen claves y valores.
Modelo híbrido. Soluciones que son capaces de combinar los modelos relacionales y los modelos
NoSQL.
Tipos de datos
Según su estructura
Estructurados
No Estructurados
Semiestructurados
Según su contenido
Cualitativos
Cuantitativos
Discretos
Continuos
Calidad de los datos
Completitud
Credibilidad
Coherencia
Conformidad
Consistencia
Precisión / Exactitud
Duplicación
Integridad
Ley orgánica de protección de datos
ley orgánica española que tiene por objeto «garantizar y proteger, en lo que concierne al tratamiento de
los datos personales, las libertades públicas y los derechos fundamentales de las personas físicas, y
especialmente de su honor, intimidad y privacidad personal y familiar»
aprobada por las Cortes Generales el 13 de diciembre de 1999 y actualizada recientemente con la
entrada en vigor, el 5 de diciembre de 2018, de la Ley Orgánica 3/2018, de Protección de Datos
Personales y garantía de los derechos digitales, que adapta la legislación española al Reglamento
General de Protección de Datos de la Unión Europea y garantiza los derechos digitales de la ciudadanía
conforme a lo establecido en la Constitución.