Terminología
| Este módulo ofrece una introducción al lenguaje, la terminología y las definiciones de algunos de los conceptos, funciones y procesos básicos relacionados con la movilización de datos sobre biodiversidad. |
Definiciones
|
En este vídeo (12:02), repasará la terminología utilizada en este curso. Si no puede ver el vídeo incrustado, puede download hacerlo localmente. (MP4 - 45,8 MB) |
Presentation transcript
Haga clic para ampliar
Diapositiva 1 - Fundamentos - Definiciones terminología
Esta sesión es un trabajo fundamental y parte de la sección de Terminología. Te presentaremos el lenguaje, la terminología y las definiciones de algunos de los conceptos, funciones y procesos básicos que pondrá en uso durante el resto del curso.
Imagen de Carsten Witzel, obtenida a través de http://www.freeimages.com/photo/root-of-a-tree-1371557.
Imagen de Carsten Witzel, obtenida a través de http://www.freeimages.com/photo/root-of-a-tree-1371557.
Diapositiva 2 - Conceptos clave
Primero revisaremos la estructura de esta sesión.
En la sección de DEFINICIONES intentaremos primero aclarar el uso de la palabra “Datos”.
Luego, veremos la terminología relativa a Campos, Etiquetas y Listas.
Y, por último, aclararemos algunos conceptos en torno a los carateres y sus mapeos que ayudarán a evitar errores de datos no deseados.
Diapositiva 3 - Definiciones
Primeras definiciones.
En esta sección examinaremos algunos de los muchos términos y frases que existen en el mundo de la gestión de datos e información.
Los usaremos a lo largo del curso y es importante que se familiarice con cuándo y cómo usarlos.
Imagen de Sharon Grant: https://www.flickr.com/photos/rondls_pics/3629532537/in/album-72157619834323354/
Diapositiva 4 - Definiciones - una rosa con otro nombre
Centrémonos por un momento en algunas palabras y frases comunes que contienen la palabra datos.
Diapositiva 5 - Cuál es la diferencia - Base de datos
Todas las frases incluyen la palabra "datos", pero ¿son todas iguales y, si no lo son, cuál es la diferencia?
Diapositiva 6 - Base de datos
Entonces, ¿qué es una "base de datos"?
-
Hay muchas definiciones, pero lo que todas tienen en común es que una base de datos es una colección estructurada y organizada de datos y / o información almacenada en una computadora.
-
¡Todo lo demás de la lista es sólo una forma de ayudarle a alcanzar este nirvana de datos!
-
Profundicemos un poco más en esos otros términos.
Diapositiva 7 - Lenguaje de base de datos
Echemos un vistazo a la frase "lenguaje de la base de datos".
Según el diccionario inglés de Oxford, "lenguaje" es el método de comunicación humana… consistente en el uso de palabras (o símbolos) de forma estructurada y convencional.
Para nuestros propósitos, los lenguajes de bases de datos y sus aliados cercanos, los lenguajes de matrices, son la forma en que un ser humano se comunica con una computadora para manipular y mover datos.
Ejemplos que puede haber encontrado son:
-
Java, SPARQL, SQL y Python
-
Son simplemente métodos que se utilizan para definir y crear tablas, vistas y consultas y también permiten a los usuarios acceder, actualizar, almacenar y mover datos.
Diapositiva 8 - Programa/software de base de datos
Ahora veamos la frase "programa o software de la base de datos".
Una vez más, acudiendo al diccionario de inglés de Oxford, un “programa” es un conjunto de medidas o actividades relacionadas con un objetivo particular a largo plazo.
En este contexto, un "programa o software de base de datos" combina y presenta funciones y características para manipular datos, en conjunto es una interfaz unificada.
Algunos ejemplos que puede encontrar son:
Microsoft Access, FilemakerPro y Oracle
Por lo tanto, los programas o software de base de datos son utilidades agrupadas que permiten a un usuario, a través de un lenguaje de base de datos, almacenar, administrar, consultar y reportar datos almacenados en el sistema.
Diapositiva 9 - Herramienta de limpieza de datos
El último término es "herramienta de limpieza de datos".
Las herramientas de limpieza de datos son sistemas cuyas utilidades se centran en la manipulación de los datos con el objetivo de aumentar su idoneidad para el uso.
Algunos ejemplos con los que puede estar familiarizado o que aprenderá durante el curso son:
OpenRefine, MatLab y hojas de cálculo
Una herramienta de limpieza de datos debería ayudar al usuario a descubrir y reparar los datos desordenados para aumentar la calidad.
Diapositiva 10 - Definiciones - una rosa con otro nombre
Continuando con algunos términos más con los que debería estar familiarizado, veremos las diferencias entre los términos Campo, Etiqueta y Lista.
Diapositiva 11 - Campo vs etiqueta
A menudo se habla de nombres de campos o columnas y de etiquetas o encabezados de campos. A menudo se utilizan indistintamente, pero son cosas distintas.
Los nombres de campo o columna se refieren a la columna real de la tabla de la base de datos. A menudo son cortos, no siempre están en lenguaje llano, a veces son generados por ordenador; pero en una base de datos correctamente formada SIEMPRE son únicos. Los lenguajes de bases de datos utilizan casi siempre nombres de campo porque evitan la ambigüedad.
Por otro lado, las etiquetas y cabeceras se refieren a las versiones legibles de los nombres de campo. Suelen aparecer en la interfaz gráfica de usuario del programa, en las exportaciones y en los informes. De hecho, en algunos programas ¡puede haber diferentes etiquetas para el mismo campo, usuario por usuario o grupo!
Diapositiva 12 - Listas
A medida que trabaje con sus datos, se encontrará con las frases "lista desplegable" y "vocabulario controlado" y, a primera vista, pueden parecer lo mismo. De hecho, ambas son herramientas potentes que te ayudan a mantener tus datos limpios, pero son diferentes.
Una lista desplegable, también llamada a veces tabla de consulta, es un elemento de entrada de datos que se crea en el software de base de datos. Permite seleccionar un valor de entre un conjunto predefinido de opciones. También pueden generarse sobre la marcha a partir de los propios datos.
Por otro lado, un vocabulario controlado es un conjunto de valores muy estrictamente definidos y específicos de un ámbito concreto. Son parte integrante de una norma bien definida. Estos valores pueden utilizarse en una lista desplegable como la mencionada anteriormente.
Diapositiva 13 - Definiciones - una rosa con otro nombre
En esta sección veremos qué significa el término carácter en relación con los datos y las computadoras.
Diapositiva 14 - Caracteres
Como recordatorio, las computadoras "ven" en binario. Todo lo que escribe se guarda en la memoria como una serie de unos y ceros.
The computer does not “see” the repertoire of letters and symbols on your keyboard. It needs a map to translate the character set that you would write or type, into its binary language and then back again to show it to you on the screen or a printer.
Este mapa está compuesto por dos partes:
El "conjunto de caracteres codificados"
y
La "codificación de caracteres"
A cada símbolo o glifo se le asigna un valor numérico y ese número luego se convierte a binario.
Diapositiva 15 - Ejemplo de caracteres
En este ejemplo, vemos cómo se usa la codificación de caracteres para mapear la letra A mayúscula en el alfabeto occidental.
El valor ASCII de la letra A mayúscula es el número decimal 65
que en HEXADECIMAL es 041
y en BINARIO 01000001
Intente asignar su propio nombre a Binary usando el enlace en la parte inferior de la pantalla.
Diapositiva 16 - Comparación de caracteres
En efecto, lo que está sucediendo es que cuando escribe en un teclado y guarda un archivo, el software que está utilizando seleccionará una codificación para guardar con él.
Cuando abra ese archivo nuevamente, el software necesita saber qué codificación (mapa) usar para volver a mostrarle la información correctamente.
Diapositiva 17 - Caracteres
Entonces, ¿por qué es esto importante para usted como custodio de datos?
Digamos que traduces el comienzo del soliloquio de Hamlet
”Ser o no ser, esa es la cuestión”
en francés y luego guarde el archivo con un editor de texto que usa la codificación Latin-1
Luego se lo envía a un colega para que verifique la traducción. ¡Voila!
Diapositiva 18 - Caracteres
Cuando abren el archivo en MicroSoft Word, esto es lo que ven.
Mon dieu!
Hay algunos personajes inesperados.
Olvidó decirle a su colega que estaba usando Latin-1 como codificación.
MicroSoft Word en su extremo se configuró para usar el conjunto de codificación Unicode UTF-8. Los mapas no coincidían.
Dependiendo del software, los datos pueden estar irremediablemente dañados.
Diapositiva 19 - Repaso
En repaso, hemos analizado las diferencias entre las frases:
-
Base de datos; lenguaje de la base de datos; programa de base de datos, herramienta de limpieza de datos
-
Nombres de campo y Etiquetas de campo; Listas desplegables y Vocabularios controlados y entre
-
Repertorios, Conjuntos codificados y Codificaciones
Y demostró que aunque los términos pueden parecer similares, de hecho tienen definiciones muy diferentes.
Diapositiva 20 - Recapitulación
Recuerda que:
"…El primer paso de la sabiduría es conocer las cosas mismas; esta noción consiste en tener una idea verdadera de los objetos."
A menudo damos por sentado que existe un lenguaje completo asociado con la informática de la biodiversidad que no es un lugar común y debe aprenderse. No hay que avergonzarse de volver a lo básico y familiarizarse con el vocabulario, la gramática y la sintaxis como con cualquier idioma nuevo.
Diapositiva 21 - Conclusión
Este video es parte de una serie de presentaciones utilizadas en el curso de Movilización de Datos de Biodiversidad de GBIF. El plan de estudios de movilización de datos sobre biodiversidad se desarrolló originalmente como parte del Programa Información sobre Biodiversidad para el Desarrollo financiado por la Unión Europea.
Esta presentación fue creada y narrada originalmente por Sharon Grant con contribuciones adicionales de los Entrenadores, Mentores y Estudiantes de BID y BIFA.
Software
|
En este vídeo (05:58), repasará ejemplos de los distintos tipos de aplicaciones y programas informáticos disponibles en el mundo de la informática para la movilización de la biodiversidad. Si no puede ver el vídeo incrustado, puede download hacerlo localmente. (MP4 - 23,5 MB) |
Presentation transcript
Haga clic para ampliar
Diapositiva 1 - Fundamentos - Terminología del software
Esta sesión es un trabajo básico y parte de la sección de Terminología. Le presentaremos los tipos de software que se utilizan en la movilización de datos.
Imagen de Carsten Witzel, obtenida a través de http://www.freeimages.com/photo/root-of-a-tree-1371557.
Diapositiva 2 - Software para la movilización
El objetivo de esta breve presentación es ofrecerles algunos ejemplos de los diferentes tipos de aplicaciones y programas informáticos disponibles en el mundo de la informática para la movilización de la biodiversidad.
Esperemos que esto le ayude a empezar a pensar en qué usos se les puede dar y qué tipo de cosas podrían ser prácticas para Ud.
Diapositiva 3 - Definición del software
Muy brevemente, una definición.
Aquí distinguimos entre todo el software y las aplicaciones creadas para que un usuario final realice una tarea.
Echaremos un vistazo a los programas informáticos que pueden utilizarse para:
-
Captura de datos
-
Gestión de Datos
-
Limpieza de datos y
-
Publicación de datos
Diapositiva 4 - Software para la captura de datos
En el ámbito del software de captura de datos, a menudo no es necesario optar por una solución "a gran escala" al capturar información inicialmente, especialmente en el trabajo de campo.
Puede recopilar información de especímenes de colección u observaciones en vivo en una hoja de cálculo sencilla, como por ejemplo:
Excel, OpenOffice, LibreOffice o Google Sheets.
Puede que ni siquiera sea necesario crear un sistema propio. Aplicaciones como iNaturalist o eBird son estables, robustas y tienen interfaces sencillas e intuitivas.
Sea cual sea la opción elegida, es importante pensar en la conservación a largo plazo de los datos recopilados.
Diapositiva 5 - Software para la gestión de datos
Así que, dependiendo de sus necesidades, un software de gestión de datos más complejo podría ser la solución adecuada para sus datos. Especialmente si la conservación y preservación a largo plazo es una prioridad.
Las plataformas de gestión más estables también permiten compartir mejor los datos con múltiples destinatarios.
Hay muchas opciones que varían en términos de costo y soporte, y aquí se muestran algunas. De izquierda a derecha:
Symbiota, Specify, EMu, Elysia y Brahms.
Diapositiva 6 - Software para la captura y gestión de datos
Si se prefiere una solución casera y se le puede dar soporte, el software de base de datos relacional puede ofrecer alternativas más baratas.
Por ejemplo, MySQL, SQLServer, Access o Filemaker
Diapositiva 7 - Software para la limpieza de datos
Las fronteras entre lenguajes, programas y herramientas son cada vez más difusas y cada uno de ellos es capaz de realizar muchas funciones complejas y superpuestas. La función común "Buscar y Reemplazar" es un buen ejemplo de herramienta de limpieza de datos que se encuentra en casi todos los programas de bases de datos y es un comando en los lenguajes de bases de datos.
Probablemente ya esté familiarizado con hojas de cálculo como Excel y, de hecho, éstas son probablemente las herramientas de limpieza de datos más comunes que existen. Sin embargo, existen otras.
OpenRefine, originalmente conocida como GoogleRefine, es una potente herramienta de limpieza de datos gratuita y de código abierto con una gran comunidad de apoyo. Verá más sobre este programa en próximas sesiones.
R es otro sofisticado lenguaje y entorno de programación cada vez más utilizado. Con un poco de práctica también puede proporcionar potentes manipulaciones de datos.
Diapositiva 8 - Software para la publicación de datos
Si planea compartir sus datos a través de GBIF con la comunidad científica internacional, necesitará elegir una herramienta de publicación.
La elección dependerá en gran medida del nivel de soporte de la infraestructura de su institución. Si éste es alto y estable, instalar una aplicación IPT o BioCASe puede ser la opción adecuada. Pero hay otras si este no es el caso.
Puede considerar la posibilidad de asociarse con un proveedor de IPT existente o seleccionar un sistema de gestión de bases de datos que incluya una vía de publicación propia.
Elija el que elija, asegúrese de que su sistema le permita exportar los datos como archivos csv o txt y, en última instancia, podrá publicar tus datos.
Diapositiva 9 - Otros programas informáticos para el tratamiento de datos
Este es un resumen de la información recogida en la encuesta del curso sobre el software que utilizan los participantes, mentores y entrenadores de la comunidad GBIF.
El enlace y la referencia a más detalles de cada sección, se encuentra en la parte inferior de la diapositiva.
Diapositiva 10 - Recapitulación
Recuerda que:
"El objetivo del software es ayudar a las personas" y no al revés.
La solución que elija debe facilitarte la vida, pero no debe sacrificar la viabilidad a largo plazo de los datos con los que debe trabajar.
Diapositiva 11 - Conclusión
Este video es parte de una serie de presentaciones utilizadas en el curso de Movilización de Datos de Biodiversidad de GBIF. El plan de estudios de movilización de datos sobre biodiversidad se desarrolló originalmente como parte del Programa Información sobre Biodiversidad para el Desarrollo financiado por la Unión Europea.
Esta presentación fue creada y narrada originalmente por Sharon Grant con contribuciones adicionales de los Entrenadores, Mentores y Participantes de BID y BIFA.
Estructuras
|
En este vídeo (13:10), repasará los tipos de campos y datos que contienen datos, las estructuras que ayudan a organizar y proteger esos datos y lo que significan para la integridad y la seguridad de sus datos. Si no puede ver el vídeo incrustado, puede download hacerlo localmente. (MP4 - 44,4 MB) |
Presentation transcript
Haga clic para ampliar
Diapositiva 1 - Fundamentos - Terminología de estructuras
Esta sesión es un trabajo fundamental y parte de la sección de Terminología. Te presentaremos el lenguaje, la terminología y las definiciones de algunos de los conceptos, funciones y procesos básicos que pondrá en uso durante el resto del curso.
Imagen de Carsten Witzel, obtenida a través de http://www.freeimages.com/photo/root-of-a-tree-1371557.
Diapositiva 2 - Conceptos clave
Primero revisaremos la estructura de esta sesión.
En la sección sobre ESTRUCTURAS, trabajaremos para comprender los tipos de campos y datos que contienen la información, las estructuras que ayudan a organizar y proteger esos datos y, por último, analizaremos qué implican para la integridad y la seguridad de sus datos.
Diapositiva 3 - Estructura
En esta sección sobre Estructuras básicas de bases de datos, nos centraremos en los diferentes elementos que utilizan las bases de datos, las herramientas de software y los lenguajes para gestionar los datos que usted introduce.
Diapositiva 4 - Estructuras - aviones, trenes y automóviles
Primero, veamos los tipos de campos, también conocidos como tipos de datos.
Diapositiva 5 - Contenedores - tipos de campo/datos
El Tipo de Datos le indica a la computadora qué tipo de datos se esperan en un campo determinado. Esto, a su vez, determina qué funciones se pueden realizar con ellos.
Pueden ser sencillas y abarcar un único concepto o combinar conceptos en función del software o el lenguaje que se utilice. En cualquier caso, los elementos básicos son los mismos.
Veamos seis de los que se encontrará con mayor frecuencia.
Diapositiva 6 - Contenedores - tipos de campo/datos
Primero Campos numéricos - Este tipo de datos contiene números, y hay 2 tipos:
Los números enteros (integers) y enteros largos (long integers), contienen números enteros. Por ejemplo, 1, 2, 3, 99, 2000.
El tamaño del número depende de la cantidad de bits asignados al campo (más adelante hablaremos de esto). Por ahora, recuerde que un campo de entero largo almacenará un número mayor que un entero.
Los flotantes (floats), también llamados dobles, contienen fracciones o partes de números enteros. Por ejemplo 4,5 o 19,47
Es importante recordar que un número flotante siempre tiene decimales, por lo que el número 10 se almacenará como 10.0. El número de decimales es un elemento fundamental del tipo de dato. Esto tiene implicaciones en cuanto a precisión y exactitud.
Diapositiva 7 - Contenedores - tipos de campo/datos
Campos alfanuméricos: también se denominan campos de texto (text), caracteres (character) o cadenas (string).
Pueden contener cualquier letra, número o símbolo del conjunto de caracteres codificados y, por lo general, tienen un límite de caracteres definido. Introducir más caracteres de los permitidos suele provocar que los datos se trunquen y se pierdan al guardar.
Diapositiva 8 - Contenedores - tipos de campo/datos
Otro tipo de campo de texto con el que te encontrarás es el campo de texto no estructurado, también conocido como campo memo, campo de caracteres largos o campo blob.
Estos tipos de campo se utilizan para almacenar grandes cantidades de texto sin formato y, a diferencia de los campos alfanuméricos, no tienen un límite de caracteres obvio.
En sistemas sencillos, suelen ser menos flexibles en términos de procesamiento (por ejemplo, clasificación e indexación) que sus primos alfanuméricos más pequeños.
Sin embargo, con la disminución de los costos de almacenamiento y el auge de los programas de bases de datos NoSQL orientados a documentos, como MongoDB, esta situación está cambiando.
Diapositiva 9 - Contenedores - tipos de campo/datos
Los campos de Valor del Sistema tienen una doble naturaleza, y lo que se ve en pantalla no suele ser el valor real que el software almacena en la memoria. Los campos de fecha y hora son el ejemplo más común de este tipo de campo.
En este ejemplo, ha escrito "1 de marzo de 1971" en una celda de Excel y has pulsado retorno.
Ahora dice "1-Mar-71" en la celda Y "3/1/1971" en la barra de funciones.
Excel está aplicando un formato de visualización a la celda, que puede cambiar a voluntad.
¡SIN EMBARGO, si elimina el formato verá que lo que realmente se está almacenando en el campo es el número 25993.00!
Así que usted puede ver que el campo es en realidad un flotador. Debe tener cuidado porque el valor del sistema no es el mismo de un software a otro. Las exportaciones deben comprobarse para asegurarse de que se exporta la fecha real y no el valor del sistema.
Diapositiva 10 - Contenedores - tipos de campo/datos
Los campos booleanos, también conocidos como campos binarios, sólo contienen uno de los dos valores que representan un uno o un cero.
Se trata de un caso especial de campo de Valor del Sistema, ya que, aunque el programa guarda un número, a menudo muestra valores como:
Sí/No; Sí/no; S/N; Verdadero/Falso.
Debe asegurarse de averiguar en qué dirección se traduce el sistema que está utilizando.
¿Un 1 es un sí o un no?
Diapositiva 11 - Contenedores - tipos de campo/datos
Los campos de Texto Estructurado son menos comunes, pero se mencionan aquí para completar la información.
Se trata de campos que pueden estar formados por combinaciones de tipos de datos simples o incluso estar definidos por los propios datos.
En la mayoría de los casos se utilizan en lenguajes de programación para permitir la flexibilidad y el manejo de conceptos complejos.
Un ejemplo es el campo factor utilizado en el lenguaje de programación R, que se define como un vector de tipo que contiene un conjunto de códigos numéricos con niveles valorados por caracteres.
Diapositiva 12 - Estructuras - aviones, trenes y automóviles
Ahora que ya conoce los tipos de campo utilizados para representar los elementos de datos, hablemos de los contenedores o estructuras que utilizan muchos programas de bases de datos para cotejar y mostrar los datos.
Referencia: https://www.geeksforgeeks.org/data-structures/
Diapositiva 13 - Contenedores - Estructuras de datos
Primero está la celda.
Esta es la estructura de datos más pequeña, tiene un solo valor y tiene un solo tipo de datos asociado.
Diapositiva 14 - Estructuras de datos
Hay un concepto que debes tener en cuenta cuando se trata de celdas, y es el de la "celda vacía". “Una celda vacía no significa necesariamente un campo vacío."
Algunos programas informáticos “rellenan” un campo vacío con un valor del sistema basado en el tipo de datos.
Por ejemplo, "NULL", "N A" ¡o incluso cero!
Diapositiva 15 - Contenedores - Estructuras de datos
A medida que empiezas a organizar las celdas, empiezas a construir una cuadrícula. Las cuadrículas tienen una estructura implícita en forma de
Filas
Diapositiva 16 - Contenedores - Estructuras de datos
Y columnas.
Diapositiva 17 - Contenedores - Estructuras de datos
Cuando organizas las celdas en filas y columnas, obviamente, ¡lo que obtienes es una cuadrícula!
Esto se parece mucho a una hoja de cálculo, ¿verdad?
Pues sí. Sin embargo, la diferencia entre una cuadrícula de hoja de cálculo y una tabla radica en la fuerza de los vínculos que mantienen unidas las filas y columnas.
Diapositiva 18 - Estructuras - aviones, trenes y automóviles
Hablemos ahora de esas conexiones.
¿Cuáles son las implicaciones para la integridad y la seguridad de sus datos de relaciones flexibles y no forzadas entre filas y columnas?
Diapositiva 19 - Estructuras de datos
Lo que realmente hace que una tabla sea útil son las conexiones que creamos para dar sentido a los datos de la estructura.
Intrínsecamente, creamos patrones de atributos que transforman los datos en información.
Las Filas se convierten en registros y las Columnas en atributos
Sin embargo, en una hoja de cálculo, las conexiones entre celdas son idiomáticas, sueltas y no forzadas.
Es fácil que se mezclen los atributos entre las filas o que cambien los valores y se pierda el significado.
Diapositiva 20 - Integridad y seguridad
Esta falta de conexiones forzosas hace que una hoja de cálculo sea fácil de usar, pero estas mismas cualidades también causan problemas.
Los errores son fáciles de cometer y difíciles de detectar.
Las conexiones y relaciones no son documentables, por lo que están sujetas a interpretación y mutación.
Las hojas de cálculo no están diseñadas para escalar ni en tamaño ni en número de usuarios.
Así que puede ser lenta, accidentada y fácilmente corruptible.
Las hojas de cálculo son fáciles de copiar y enviar por correo electrónico
Por lo tanto, son difíciles de versionar y controlar
La pregunta es: ¿cuál es la solución?
Diapositiva 21 - Contenedores - Integridad y seguridad
Echemos un vistazo atrás, a las conexiones con un poco más de detalle.
Por lo general, entendemos que los datos de cada fila de una tabla significan algo.
Por ejemplo, cada fila puede representar un espécimen o un taxón encontrado en un lugar concreto, en un momento determinado y por una persona determinada.
Sería extraño tener una fila en una tabla que represente un espécimen seguida de una fila que represente un lugar de recogida.
A menudo también queremos analizar, ordenar y comparar valores de atributos concretos entre filas.
Por ejemplo, puede que quieras encontrar el peso medio de todos los murciélagos de Kenia.
Así que lo ideal es utilizar un sistema para almacenar nuestros datos que:
-
siempre mantiene unidas las filas
-
no mezcla tipos de datos
-
y segrega los datos de cada tabla a un único concepto o tema
¡Estas son funciones de una base de datos!
Diapositiva 22 - Integridad y seguridad
En una base de datos verdadera, las funciones vinculan inherentemente las filas entre sí, y las columnas solo pueden tener un único tipo de dato.
Las tablas de una base de datos se mantienen unidas mediante enlaces virtuales llamados claves (keys).
Estas claves son identificadores que coinciden entre tablas y permiten conectar datos de forma eficaz.
Son estos dos conceptos clave los que distinguen una hoja de cálculo de una base de datos.
Diapositiva 23 - Repaso
En resumen, hemos analizado los 6 tipos de datos más comunes, los componentes básicos de la estructura de datos y hemos distinguido entre una cuadrícula de hoja de cálculo y una tabla de base de datos.
Comprender estos elementos y cómo interactúan entre sí le permitirá determinar mejor las mejores maneras de manipular y documentar los datos que están bajo su custodia.
Diapositiva 24 - Resumen
Recuerda que:
“Cuando comprendas la diferencia entre el contenedor y el contenido, tendrás conocimiento.”
Utilizar la terminología correcta para describir tanto sus datos como las estructuras que crea y utiliza para almacenarlos es la forma más importante de garantizar que sigan siendo relevantes y utilizables.
Nunca subestime el daño que pueden sufrir las descripciones y el almacenamiento descuidados a información de valor incalculable.
Diapositiva 25 - Conclusión
Este vídeo forma parte de una serie de presentaciones utilizadas en el curso de Movilización de Datos de Biodiversidad del GBIF. El programa de estudios sobre movilización de datos de biodiversidad se desarrolló originalmente como parte del Programa de Desarrollo de Información sobre Biodiversidad, financiado por la Unión Europea.
Esta presentación fue creada y narrada originalmente por Sharon Grant con contribuciones adicionales de los Entrenadores, Mentores y Estudiantes de BID y BIFA.