Método de carga
Si sus datos provienen de una conexión de datos a un sistema externo, tiene la oportunidad de elegir cómo se deben cargar los datos cuando se agregan datos; ya sea como datos en memoria, analizados por el motor de datos interno de Spotfire, o como datos en bases de datos, donde el sistema externo gestiona todos los cálculos.
Consulte también Tipos de datos en Spotfire.
Análisis en memoria (importación)
Los archivos de texto, archivos de Excel y vínculos de información (solo disponibles si tiene acceso a Spotfire Server) siempre se importan y analizan en memoria, mientras que, con las conexiones de datos, puede elegir importar los datos, si lo desea. Cuando se trabaja con datos en memoria, se tiene acceso a toda la funcionalidad de Spotfire, a través del motor de datos integrado. El motor de datos interno está disponible para todos los usuarios, ya sea en el cliente de Windows o, para los usuarios de los clientes web, en el servidor. Puede utilizar todas las columnas como filtros y realizar muchos tipos de cálculos. Con los datos importados, también puede combinar datos de diferentes orígenes en una sola tabla de datos usando las operaciones Agregar filas o Agregar columnas (y, usando el cliente instalado de Spotfire, es posible agregar transformaciones a los datos).
Si los datos son lo suficientemente pequeños, la opción preferida la mayoría de las veces son los datos importados, ya que a menudo mejora el rendimiento de los cálculos. Consulte Trabajo con grandes volúmenes de datos para obtener algunos consejos sobre cómo mejorar el rendimiento de un análisis con muchos datos.
Análisis en bases de datos (externo)
Si elige mantener una conexión de datos externa, todos los cálculos se realizan utilizando el sistema externo y no con el motor de datos de Spotfire. Esto le permite trabajar con volúmenes de datos que son demasiado grandes para almacenarse en la memoria principal, así como sacar provecho al poder del sistema externo. Cuando trabaje con conexiones de datos externas, solo puede acceder a la actual selección de datos, y todas las agregaciones y cálculos se realizan en la base de datos.
Cuando una visualización usa datos en la base de datos, la visualización realiza una consulta al origen de datos externo de manera directa. Cada vez que se realiza un cambio en la configuración de la visualización, por ejemplo, cuando se define una medida en el eje Y o se agrega una columna por categorías, se envía una nueva consulta al origen de datos externo, lo que genera nuevos datos agregados.
En algunos casos, los datos de la base de datos se modelan como un esquema de estrella o copo de nieve, también conocido como modelo multidimensional. En este caso, puede volver a usar este modelo, las relaciones y las limitaciones que se definieron en la base de datos para configurar el análisis. Si no se ha configurado ninguna relación, estas se pueden definir cuando se seleccionan los datos que se recuperarán de una conexión determinada. Mediante las limitaciones y las relaciones que se han predefinido en la base de datos o que se han creado de manera explícita mediante un configurador, Spotfire puede organizar datos de varios orígenes de manera que pueda visualizar los resultados en su totalidad.
Al trabajar con datos en bases de datos, el conector y los orígenes de datos subyacentes determinan los métodos de agregación que están disponibles. Sin embargo, la flexibilidad de las expresiones personalizadas y la capacidad de crear expresiones a partir de datos que ya se hayan agregado mediante la palabra clave "THEN" le ofrecen oportunidades ilimitadas para modelar los datos de la forma que desee.
Los datos en la base de datos suelen ser preferibles si está trabajando con volúmenes de datos muy grandes, que no cabrían en memoria, o si desea asegurarse de que los datos siempre sean los más recientes de su sistema externo y siempre se gestionen como en el sistema externo.
Configuración de carga de datos
Para los datos en memoria, puede especificar la configuración de Carga de datos para cada origen en su tabla de datos, siempre que los datos se mantengan vinculados. Estas configuraciones determinan si se usa la opción Datos almacenados, Siempre datos nuevos o Datos nuevos cuando sea posible. Al guardar un análisis, es importante tener en cuenta la configuración de la carga de datos porque puede determinar si otros usuarios tendrán acceso a los datos en el análisis, si el análisis es compartido.
- La opción Datos almacenados permite guardar los datos actuales en el análisis. Solo se cargarán nuevos datos si el origen se vuelve a cargar de forma manual.
- La opción Datos nuevos cuando sea posible también permite almacenar los datos actuales en el análisis. En ese caso, los datos también están disponibles para los usuarios que no tienen acceso al origen. No obstante, si un usuario puede acceder al origen, los datos nuevos se cargan al abrir el análisis.
- La opción Siempre datos nuevos no guarda datos en el archivo de análisis.
Si lo desea, las tablas de datos que se generan a partir de más de un origen pueden tener una configuración de carga de datos distinta para cada una de las partes de las que se componen. De esta forma, puede asegurarse de que los datos de un origen siempre sean nuevos, sin que se modifiquen otras partes de la tabla de datos.
Puede cambiar la configuración de la carga de datos para los orígenes correspondientes desde el lienzo de datos. Para obtener más información, consulte Almacenamiento de datos en el análisis. Al guardar en la biblioteca, puede hacer clic en el vínculo Revisar configuración en la parte inferior del menú flotante Archivos y datos para cambiar la configuración.
Tenga en cuenta que no se puede modificar la configuración actual de algunos orígenes de datos. Por ejemplo, los datos del portapapeles solo se pueden guardar mediante la configuración de datos almacenados, ya que no hay ningún origen vinculado disponible y las conexiones de datos externas no se pueden almacenar.
Si el análisis se utilizará con actualizaciones programadas, puede excluir a determinados orígenes de datos de esa actualización en la configuración de carga de datos. Para obtener más información, consulte Recarga de datos para cada usuario cuando se utilizan actualizaciones programadas.
Consulte también Nueva carga de datos.
Bajo demanda (configurado usando solo el cliente instalado)
Si se deben agregar datos de una conexión de datos que no sea del cubo o un vínculo de información al análisis como una nueva tabla de datos, en el cliente instalado, puede cargar todos los datos al mismo tiempo, o bien solo cargar datos bajo demanda. Esto corresponde a los datos en memoria y en bases de datos (para las conexiones de datos). La carga bajo demanda puede resultar útil para el análisis si tiene acceso a cantidades enormes de datos, pero solo necesita trabajar con partes de esa información cada vez. Al configurar una tabla de datos bajo demanda, puede especificar condiciones basadas en otras tablas de datos que controlen lo que se carga. Para empezar, también puede determinar que una tabla de datos bajo demanda sea la primera (o la única) tabla de datos del análisis si una propiedad del documento define su entrada, lo cual es una variable que se puede definir.
La carga bajo demanda se puede considerar una manera de filtrar datos, ya que básicamente es una cláusula WHERE que limita de forma dinámica los elementos que se leen y se utilizan en los cálculos.
Consultas personalizadas (configurado usando solo el cliente instalado)
Al trabajar con conexiones de datos a bases de datos relacionales o a otros orígenes de datos que no sean del cubo, puede seleccionar una o más tablas del origen de datos en la vista de modelado. En este caso, también puede tener la opción de crear su propia consulta de base de datos personalizada, dependiendo de sus licencias. Una consulta personalizada da lugar a una tabla personalizada que a su vez puede utilizarse para configurar una vista de la conexión seleccionada de la misma manera que lo haría con otras tablas de bases de datos. Las consultas se escriben en un lenguaje que la base de datos comprende. Por ejemplo, para una base de datos de Microsoft SQL Server, la consulta personalizada se escribiría en el dialecto SQL de Microsoft SQL Server.
Los vínculos de información también permiten crear SQL personalizado.
- Datos bajo demanda
Cuando los datos de una conexión de datos o un vínculo de información se agregan al análisis, tiene la opción de cargar todos los datos a la vez o cargar solo los datos bajo demanda. La carga bajo demanda puede resultar útil para el análisis si tiene acceso a cantidades enormes de datos, pero solo necesita trabajar con partes de esa información cada vez. Al configurar un origen de datos bajo demanda, puede especificar condiciones basadas en otras tablas de datos que controlen lo que se carga. También puede empezar disponiendo que la primera tabla de datos (o la única) del análisis sea una tabla de datos bajo demanda, siempre que una propiedad de documento defina su entrada. - Actualizaciones programadas
En las instalaciones locales, se puede usar una actualización programada para reducir el tiempo que se tarda en abrir un determinado archivo de análisis. Para ello, el archivo de análisis se cargan en Spotfire Server antes de que un usuario intente abrirlo.