ADMINISTRACIÓN DE DATOS:
FACTOR DE ÉXITO
ALMACENAMIENTO DE DATOS
El almacenamiento
de datos es la tendencia más importante en la administración de
la información en las organizaciones, pero dada la cantidad de
datos que podemos encontrar en el entorno, generalmente se
presentan estos problemas con dichos datos:
-. La cantidad de datos que se maneja puede ser enorme, ya que
las organizaciones cuentan con datos ya almacenados, estos deben
mantenerse y además constantemente nuevos están ingresando al
sistema.
-. Existen datos dispersados en muchas organizaciones, en
diferentes métodos y dispositivos de recopilación.
-. Solo una parte de todos los datos que se recolectan dan la
utilidad que espera obtener de ellos.
-. Para lograr eficiencia en la toma de decisiones, es necesario
recurrir a datos externos ya que los conseguidos no dan la
información que se necesita.
-. Los datos en bruto, son en muchas ocasiones de difícil
acceso, ya que están almacenados en diferentes sistemas de
computo, bases de datos, formatos, lenguajes humanos y de
computador.
-. Las leyes relativas a los datos obtenidos, pueden diferir de
un lugar a otro para su aplicación, así los datos conseguidos no
pueden tener aplicabilidad global.
-. Se pueden presentar problemas de seguridad, calidad e
integridad con la recopilación y el análisis de datos.
-. Existen problemas con la administración de datos por el
gigante numero de estos disponibles.
OBJETIVO
DE LA ADMINISTRACIÓN DE DATOS
En la
administración de datos, los datos se conocen como CARGA y el
uso en información y conocimiento que se les pueda dar a estos
se traduce en PODER, se tendrá entonces que la administración de
datos en general busca:
FACILITAR LA CARGA E INCREMENTAR EL PODER
PROCESO
DEL CICLO DE VIDA DE LOS DATOS Y
DESCUBRIMIENTO DEL CONOCIMIENTO
Para comprender este proceso, se necesita seguir el flujo que
los datos siguen en las organizaciones. Se debe realizar el
proceso eficientemente pues las organizaciones no operan sobre
los datos recolectados sino sobre la información y el
conocimiento de cómo usarlos con buenos resultados en la toma de
decisiones. Todo se fundamenta en el conocimiento y por esto
este es considerado como un elemento fundamental de los
negocios. Es importante recalcar que el conocimiento se
desprende de los datos, ya que no se encuentra de inmediato en
el entorno.
Los datos siguen el siguiente proceso para transformarse en
conocimiento:
1.
RECOPILACIÓN
2.
SELECCIÓN
3.
PRE - PROCESAMIENTO
4.
TRANSFORMACIÓN
5.
MINERÍA DE DATOS
6.
INTERPRETACIÓN / EVALUACIÓN
7.
USO y ALMACENAMIENTO
La parte de recopilación, selección, pre - procesamiento y
transformación es la que facilita el ALMACENAMIENTO DE
DATOS; la minería de datos y la interpretación o
la evaluación forman el ANÁLISIS DE DATOS y finalmente el
uso y almacenamiento son la base del conocimiento
de la organización.
FUENTES
Y RECOLECCIÓN DE DATOS
El ciclo comienza
con la recopilación de datos en las fuentes correspondientes.
Los datos incluyen mapas, documentos, imágenes, sonidos,
animaciones, conceptos, opiniones y pueden estar en bruto o bien
resumidos.
Los datos
pueden ser:
DATOS INTERNOS:
Estos datos se dan dentro de la organización tales como
personas, productos, servicios y procesos y pueden almacenarse
en uno o varios lugares, así por ejemplo los datos de los
trabajadores se pueden almacenar en la base de datos de Recursos
Humanos, los detalles de los equipos de maquinaria se guardan en
la base de datos de mantenimiento, etc. El acceso a ellos se
tiene desde la red de computo organizacional de la empresa.
DATOS PERSONALES:
Se
refiere a la documentación propia de trabajadores o usuario y
pueden residir en el computador personal del usuario o en la
comunicación pública; pueden ser estimaciones de venta,
opiniones sobre la competencia, reglas de los usuarios.
DATOS EXTERNOS:
Existen muchas bases de datos comerciales hasta por sensores y
satélites. Muchas organizaciones en el mundo tienen datos en la
Web pero la mayoría de estos datos no resultan pertinentes para
una aplicación específica y por ello gran parte debe revisarse y
capturarse para asegurarse de no pasar datos importantes por
alto. La fuente más importante de datos externos es Internet y
además entre ellos se tienen los obtenidos en CD roms,
servidores, informes del gobierno y publicaciones comerciales.
DATOS EN BRUTO:
En ocasiones se obtienen en el campo o bien provienen de la
gente, aunque acarrean problemas de calidad e integridad.
Se pueden recabar manualmente o por medio de sensores. Aunque
existe una gran variedad de hardware y software para el
almacenamiento, la comunicación y la presentación de este tipo
de datos, la captura es compleja y esto limita el uso de los
sistemas de información; entre estos se tienen encuestas,
estudios de tiempos y observaciones.
Administrador de Flujo de Datos,
Roland - 1.994
El AFD, toma información de fuentes externas y las ubica en un
sitio útil donde éstas en realidad se necesitan ya que los datos
provienen de muchas fuentes y la tarea de análisis se torna muy
complicada.
EBSB. “ ENTRA BASURA, SALE BASURA “
En el manejo de los AFD, se debe tener en cuenta que según los
datos recopilados se obtiene el tipo de información, es decir,
si los datos que entraron no tienen mayor utilidad y es
“basura”, la información que estos datos arrojen también los
será, de no ser seleccionados con anterioridad. Cualquier
decisión que se tome en la organización basada en datos de mala
calidad puede significar perdidas en millones, despidos y
quiebra.
El Administrador de Fuljo de Datos, tiene las siguientes
características:
.- Sistema de apoyo para decisiones
.- Procesador central de peticiones de datos
.- Componente de integridad de datos
.- Conexión con proveedores de datos externos
.- Procesos utilizados por los proveedores de datos
CALIDAD DE LOS DATOS – CD
Es un aspecto muy importante porque de aquí viene la utilidad de
las decisiones. Los datos pueden presentar muchos problemas,
entre ellos su inexactitud, su complejidad, algunos no son
oportunos y otros por el contrario no existen; por ello, se han
establecido cuatro
categorías y dimensiones de los problemas en la calidad de
datos, ya que identificando el problema puede hallarse más
rápido la solución:
1.- Calidad intrínseca de los datos:
Hace referencia a la exactitud, objetividad, credibilidad y
reputación de los datos.
2.- Calidad de los datos por su accesibilidad
Analiza los datos según accesibilidad y la seguridad en su
acceso.
3.- Calidad contextual de los datos
Toma de los datos su pertinencia, valor agregado, oportunidad,
consistencia y cantidad.
4.- Calidad de los datos de Representación.
Interpretabilidad, facilidad, comprensión, representación
concisa y consistente de los datos recopilados.
El aspecto fundamental de la calidad de los datos es la
INTEGRIDAD, entendida esta como la facilidad con que un
cambio en un dato en algún lugar, se realice simultáneamente en
otro archivo para no tener problemas de contradicción y
redundancia en los datos.
BASES DE DATOS
La manera en que se recopilan los datos y el uso que se les
planea dar determinan el formato mediante el cual se organizan y
se almacenan. Dichos datos se pueden almacenar en archivos y
BASES DE DATOS.
QUE SON LAS BD?
Son agrupamientos lógicos y organizados de archivos
relacionados. Aquí los datos se integran y se relacionan de modo
que un conjunto de software proporcionan acceso a todos los
datos. Con esto, se solucionan problemas de redundancia de
datos, inconsistencia; obtenièndose además mayor integridad e
independencia entre los datos.
SISTEMAS ADMINISTRADORES DE BASES DE DATOS – DBMS
Programa (s) que proporcionan acceso a una base de datos.
Permite a una organización centralizar datos, manejarlos
eficientemente, dando acceso a su almacenamiento mediante los
programas de aplicación. Actúan como interfaz entre los
programas de aplicación y los archivos físicos. Ofrecen
herramientas para añadir, borrar, mantener, exhibir, imprimir,
buscar, clasificar y actualizar datos.
VENTAJAS Y FUNCIONES DE LOS DBMS
a.
Incremento al acceso y a la disponibilidad de
información
b.
Simplificar el acceso, utilización, seguridad y
manipulación de los datos.
c.
Menor inconsistencia y redundancia de los datos.
d.
Menor costo en dllo. y mantenimiento de programas.
e.
Actualización rápida de registros y archivos de datos.
f.
Interrelación de datos de diferentes fuentes.
g.
Fácil recuperación de datos para preguntas e informes.
h.
Amplia seguridad y seguimiento en el uso de los datos.
i.
Soluciones rápidas y económicas a las preguntas ad hoc.
j.
Manejo
de datos personales y no oficiales
k.
Efectúa tareas complejas de manipulación y recuperación
con base en preguntas
MODELOS DE BASES DE DATOS.
Del mismo modo que
hay muchas maneras de estructurar las organizaciones de
negocios, existen muchas maneras de estructurar los datos que
esas organizaciones necesitan. El Sistema administrador de base
de datos separa la vista lógica de la física de los datos, lo
que quiere decir que el programador y el usuario final no tienen
que conocer dónde y cómo se almacenan realmente los datos. En la
estructuración lógica de una dase de datos, los negocios
necesitan considerar las características de los datos y cómo se
tendrá acceso a estos mismos.
Existen tres
modelos básicos para estructurar una base de datos:
MODELO JERÁRQUICO:
Relaciona datos estructurándolos rígidamente en un “árbol”
invertido en el que los registros contienen dos elementos:
a.
Una raíz simple o un campo maestro, denominado a menudo
clave.
b.
Un número variable de campos subordinados que definen el
resto de los datos de un registro.
Como regla, mientras todos los campos solo tienen un “padre”,
cada padre puede tercer muchos “hijos”. La mayor ventaja es la
velocidad y eficiencia con la que se realiza la búsqueda de
datos; como desventaja.
MODELO DE RED
Crea relaciones entre los datos a través de una estructura de
lista en la que los registros subordinados pueden vincularse a
más de un “ padre “. La relación se denomina conjunto. Su
ventaja es que no impone restricciones sobre el número de
relaciones para un campo, pero a su vez las bases de datos de
red son muy complejas ya que cuando aumentan el número de
relaciones su diseño e implementación son más complicados.
MODELO RELACIONAL.
Organización tradicional en tablas de columnas y renglones.
Usada comunmente para datos contables y financieros. Las tablas
reciben el nombre de RELACIONES, el renglón se denomina TUPLA y
una columna ATRIBUTO. Su ventaja es la simplicidad conceptual,
por lo tanto es flexible para los usuarios finales. A diferencia
de los modelos jerárquico y de red, todos los datos dentro de
una tabla y entre tablas pueden ligarse, relacionarse y
compararse.
BASES DE DATOS ORIENTADAS A OBJETOS.
Son también llamadas BASES DE DATOS MULTIMEDIA y se manejan
mediante sistemas administrados especiales. Aquí se manejan
datos que incluyen imágenes, planos, documentos, mapas,
videocintas, y fotos entre otros.
Son utilizadas especialmente en las industrias de periódicos,
televisión y manufactura integrada por computadora.
CREACIÓN DE BASES DE DATOS
.- DISEÑO CONCEPTUAL:
Modelo abstracto de la base de datos desde la perspectiva del
usuario o del negocio.
.- DISEÑO FÍSICO:
Muestra cómo la base de datos se organiza realmente en los
dispositivos de almacenamiento de acceso directo
DICCIONARIO DE DATOS
Es el tercer elemento de un SISTEMA ADMINISTRADOR DE BASE DE
DATOS, constituye un archivo que almacena definiciones de
elementos de datos y sus características como el uso, la
representación física, la propiedad, la autorización y la
seguridad.
Hace referencia además al elemento de datos (representa un
campo) en sistemas específicos e identifica los individuos,
funciones de negocios, aplicaciones e informes que utilizan
dicho elemento.
TENDENCIAS ACTUALES DE LAS BASES DE DATOS
Para las aplicaciones actuales se requieren funciones de bases
de datos que almacenen, recuperen y procesen diversos medios y
no solo texto y números.
.- DATA WAREHOUSE:
Almacenes de datos. Útiles para las compañías que almacenan
crecientes cantidades de información, construyendo bodegas
gigantescas de datos organizados para permitir el acceso a los
usuarios finales.
.- BASES DE DATOS MULTIMEDIA
Base de datos adicional que permite a los usuarios finales
recuperar y presentar rápidamente datos complejos que incluyen
muchas dimensiones.
.- ALMACÉN DE DATOS:
Sus beneficios son la capacidad para obtener datos rápida y
fácilmente, puesto que se encuentran ubicados en un lugar.
Los AD, permiten el almacenamiento de Metadatos, que incluyen
resúmenes de datos que son más fáciles de buscar, especialmente
con las herramientas Web
En los AD se maneja un subconjunto duplicado de los mismos
llamado MERCADO DE DATOS y se dedica a un área funcional o
regional.
CARACTERÍSTICAS DEL ALMACÉN DE DATOS:
1.- Organización
2.- Consistencia
3.- Variabilidad en el tiempo.
4.- No Volatilidad
5.- Relacionalidad
6.- Cliente / Servidor.
MINERIA DE DATOS
Se relaciona con el término general de MINERIA y como proceso,
requiere la selección entre una cantidad inmensa de material o
la indagación inteligente para encontrar exactamente donde
reside el valor de la información en los datos.
Otros nombres dados a este método son Extracción del
conocimiento, Paleo de datos, Arqueología de datos,
Procesamiento de patrones de datos, Dragado de datos y Cosecha
de información
La tecnología de la Minería de Datos puede generar nuevas
oportunidades de negocios al proporcionar estas funciones:
a.
Predicción automática de tendencias y de comportamiento.
La
minería de datos automatiza el proceso de determinar información
que se predice en grandes bases de datos. Por ejemplo, la
minería de datos puede tomar datos del pasado e identificar
objetivos que tengan mayor posibilidad de responder a
promociones ahora; esto en el caso de la mercadotecnia.
b.
Descubrimiento automatizado de patrones previamente
desconocidos.
Las herramientas de minería de datos identifican patrones
previamente ocultos en una etapa. Por ejemplo, en este proceso
se descubren patrones en el análisis de datos de ventas al
menudeo para identificar productos aparentemente no
relacionados.
CARACTERÍSTICAS Y OBJETIVOS DE LA MINERÍA DE DATOS
1.
Usualmente los datos se encuentran en las profundidades
de las bases de datos, que en ocasiones se encuentra allí por
varios años.
2.
Las herramientas de minería de datos ayudan a extraer el
mineral de la información enterrada en archivos corporativos o
registros públicos archivados.
3.
El “minero” es muchas veces un usuario final con poca o
ninguna habilidad de programación facultado con herramientas de
minería, que le permiten indagar por preguntas ad hoc y
obtener rápidamente respuestas.
4.
“Hurgar y Sacudir ” significa el descubrimiento de nuevos
datos e información.
5.
La minería de datos produce 5 tipos de información:
asociaciones, secuencias, clasificaciones, agrupamientos y
pronósticos.
TÉCNICAS DE LA MINERÍA DE DATOS
1.
Razonamiento basado en casos:
Este método utiliza casos históricos para reconocer patrones.
2.
Computación Neuronal:
Es un método de máquina de aprendizaje por medio del cual se
examinan los datos históricos para reconocer patrones los cuales
deben utilizarse para predicciones y para apoyar decisiones.
3.
Agentes Inteligentes:
Es la técnica que se utiliza para recuperar información de
Internet o de bases de datos en intranets.
APLICACIONES
Menudeo y ventas, Banca, Manufactura y Producción, Correduría y
comercio de valores, Seguros, Hardware y Software de
computadoras, Investigaciones, Funciones Estatales, Aerolíneas,
Salud, Transmisión y Mercadotecnia.
|