Utilisation des données « in-database »

Lorsque vous utilisez des données provenant d'une source de données externe (données « in-database » ou « in-db »), le travail diffère en plusieurs points de celui effectué avec des données « in-memory ». Certaines fonctionnalités fonctionnent différemment ou ne sont pas disponibles.

Remarque : Certaines des fonctionnalités décrites ici ne peuvent être créées ou ne sont accessibles qu'à l'aide du client Spotfire installé.

Si vous utilisez des données de diffusion en continu, il convient de garder à l'esprit quelques différences supplémentaires : consultez la rubrique Utilisation des données de diffusion en continu pour en savoir plus.

Vous devez garder à l'esprit qu'avec les données in-db, les modifications apportées au schéma de base de données sous-jacent ne sont pas automatiquement reflétées dans l'analyse Spotfire. Par exemple, si vous ajoutez une colonne à une table de base de données, vous devez Actualiser le schéma dans Spotfire pour que la nouvelle colonne apparaisse dans l'analyse. Tous les utilisateurs ne disposent pas de privilèges de base de données suffisants pour actualiser le schéma. Toutefois, la plupart d'entre eux peuvent mettre à jour les données réelles grâce aux boutons Recharger/Actualiser. Pour plus d'informations, reportez-vous à Rechargement des données.

Remarque : Avant de pouvoir utiliser les données « in-database » dans Spotfire, quelques conditions préalables doivent être remplies (pour plus de détails, consultez la rubrique Configuration requise pour TIBCO Spotfire®) :

Vous devrez peut-être installer sur votre ordinateur des pilotes pour la source de données qui vous intéresse.
L'administrateur Spotfire doit vous avoir octroyé l'accès aux licences pour tous les connecteurs qui vous intéressent.


Différences avec « in-memory »	Raison
Seul un nombre limité de lignes (10 000 par défaut) peut être affiché à partir d'une source de données « in-db » dans la visualisation de la table et des détails à la demande. Les colonnes virtuelles ne sont pas prises en charge pour les données « in-database ».	Un paramètre des préférences permet de limiter le nombre maximal de lignes pouvant être affichées dans les visualisations de la table et des détails à la demande afin d'éviter que les bases de données volumineuses provoquent un dépassement de la capacité de Spotfire. La limite par défaut est de 10 000. Un administrateur Spotfire peut configurer la limite en modifiant le paramètre de préférence `TableVisualizationExternalRowLimit` dans le gestionnaire d'administration.
Un administrateur Spotfire peut configurer une limite concernant le nombre de lignes pouvant être extraites et visualisées lorsque des données « in-database » sont utilisées. Cette limite concerne, par exemple, les visualisations et certains types de filtres. Si vous essayez de visualiser les données d'une manière qui dépasse cette limite, par exemple en n'agrégeant pas suffisamment les données, une erreur se produit. Des filtres par zone de liste, des filtres hiérarchiques et des filtres d'éléments ne peuvent pas être créés pour les variables contenant trop de valeurs uniques. Dans la vue détaillée du menu volant développé Données dans l'analyse, les statistiques des colonnes catégorielles contenant trop de valeurs uniques ne s'affichent pas.	Lorsque des tables de données volumineuses sont explorées, de très grandes quantités de données risquent d'être chargées. Cela peut entraîner des performances médiocres, en raison de la tension exercée autour du réseau, de la base de données et de la mémoire système, particulièrement lorsque le client Web est utilisé. Pour éviter ces problèmes, il existe un paramètre de préférence qui peut être utilisé pour limiter le nombre de lignes de données pouvant être extraites et visualisées, si des données « in-database » sont utilisées. Un administrateur Spotfire peut configurer la limite à l’aide du paramètre de préférence `ConnectorExternalRowLimit` dans le gestionnaire d'administration.
Pour les données « in-database » provenant de cubes, vous devez sélectionnez manuellement les colonnes à inclure dans les visualisations de tableau. Conseil : Vous pouvez également activer ce comportement pour les tables de données « in-database » à partir de connexions à des sources ne provenant pas de cubes. Utilisez le paramètre Ajout manuel de colonnes pour les visualisations de table, disponible dans l'onglet Performances de la boîte de dialogue Paramètres de connexion de données (client installé uniquement).	L'utilisation de toutes les colonnes disponibles dans une visualisation de table peut entraîner des requêtes trop volumineuses pour la source OLAP, car la vue de la table aplatit le cube en une seule table. Vous pouvez réduire l'impact des requêtes de Spotfire sur la source de données en sélectionnant seulement les colonnes les plus importantes et peut-être en utilisant les visualisations de table comme visualisations des détails uniquement.
Il est impossible de trier la visualisation de table si la table de données source est un cube.	Les cubes ne peuvent renvoyer des données que dans l'ordre naturel et dans l'ordre naturel inversé, pas dans des ordres triés. Le tri est ainsi désactivé pour toutes les visualisations de table basées sur les données du cube.
Lorsque des données « in-database » sont utilisées, le nombre de marquages dans une visualisation est limité. Le marquage de plusieurs éléments (segments de barre, secteurs de camembert ou marqueurs par exemple) générant une recherche plus complexe dans la source de données externe, la limite sera appliquée sur le nombre d'éléments que vous pouvez marquer. La complexité étant variable en fonction des types de visualisations et configurations, le nombre d'éléments que vous pouvez marquer est différent selon les visualisations. La valeur par défaut de cette limite est de 1000 lignes. Ce paramètre peut être configuré par un administrateur Spotfire. Conseil : Si vous souhaitez inclure plusieurs éléments dans un marquage, vous pouvez ajouter des éléments dans un marquage existant en maintenant la touche Ctrl ou Maj. enfoncée et en marquant d'autres éléments. Vous pouvez ainsi créer des marquages qui dépassent la limite de marquage. Remarque : Le marquage de tous les éléments d'une visualisation n'entraînera pas de requête complexe. Cela signifie que tous les éléments peuvent toujours être marqués, quelle que soit la limite.	Lorsque vous marquez des éléments dans une visualisation, Spotfire génère une recherche dans la source de données externe. Ce type de requête peut facilement devenir très long et complexe, si une visualisation contient beaucoup d'éléments, particulièrement si vous avez également filtré les valeurs dans l'analyse. Les requêtes complexes peuvent entraîner des performances médiocres. Un paramètre de préférence est donc disponible et vous permet de limiter le nombre d'éléments pouvant être marqués dans une visualisation lorsque des données « in-database » sont utilisées.
Le marquage dans les visualisations de tableau est pris en charge uniquement si une clé primaire a été définie pour la vue. Celle-ci peut être définie par un administrateur dans la table de base de données sous-jacente ou, pour certains types de connexions de données, dans la boîte de dialogue Vues dans la connexion (client installé uniquement). Le marquage est impossible dans les tables basées sur des données de cube.	Une clé primaire est requise pour savoir quelles lignes marquer.
Le marquage est désactivé dans les visualisations que vous avez configurées avec une expression contenant des virgules flottantes sur un axe catégoriel. Si vous souhaitez utiliser du marquage dans une visualisation basée sur des données « in-database », évitez d'utiliser des expressions catégorielles (écrites entre chevrons, '<>’) qui renvoient des valeurs à virgule flottante, sur n'importe quel axe. Remarque : Cette limite ne se rencontre pas uniquement lors de l'utilisation d'expressions personnalisées. Par exemple, si vous sélectionnez une colonne avec des nombres à virgule flottante sur l'axe Catégorie d'un histogramme empilé et que vous configurez l'axe Catégorie pour afficher une échelle catégorielle, c'est la même chose qu'écrire une expression personnalisée catégorielle qui renvoie une valeur à virgule flottante sur cet axe.	Le marquage dans les visualisations « in-database » que vous avez configurées avec une expression à virgule flottante sur un axe catégoriel peut produire des résultats imprévisibles.
Le tableau récapitulatif ne peut pas être utilisé avec des données in-db.	Le tableau récapitulatif n'a pas encore été ajusté pour gérer les données in-db.
Le Box Plot ne peut pas être utilisé avec des données in-db.	Le Box Plot requiert des données agrégées et non agrégées et n'a pas encore été ajusté pour gérer les données in-db.
Il est possible que les nuages de points et nuages de points 3D doivent être configurés comme des visualisations agrégées lorsque vous utilisez des données « in-database ».	Il est possible que Spotfire ne puisse pas gérer le nombre de lignes disponibles dans la source de données externe.
Pour afficher les dendrogrammes dans les Heat Maps quand vous utilisez des données in-db, l'axe des X doit être paramétré sur (Aucun). La mise en évidence et le marquage ne sont pas pris en charge dans les dendrogrammes.	Les dendrogrammes sont basés sur l'index de ligne et les tables de données in-db ne comportent aucun index de ligne.
Certaines expressions et méthodes d'agrégation standard de Spotfire ne sont pas disponibles sur tous les systèmes externes. En revanche, ces systèmes peuvent être dotés de méthodes non disponibles dans Spotfire.	Les méthodes d'agrégation prises en charge par la source de données externe déterminent les méthodes disponibles pour les données « in-db ».
Les expressions OVER doivent être créées comme des expressions post-agrégation ou comme des expressions personnalisées, le cas échéant.	Les expressions OVER doivent être exécutées dans la vue agrégée. Pour plus d'informations, reportez-vous à Utilisation des expressions avec des données agrégées (mot-clé THEN).
Les hiérarchies de date et d'heure automatiquement créées ne sont pas disponibles pour les données in-db.	Les raccourcis permettant de paramétrer les hiérarchies de date et d'heure n'ont pas été réglés pour gérer les données in-db.
Les transformations ne sont pas disponibles pour les données in-db.	Aucune transformation ne peut être appliquée aux données « in-db » puisque ces dernières ne sont pas stockées dans l'analyse au moment de l'exécution. Toutefois, vous pouvez également importer des tables de données basées sur les vues de connexion de données. Une fois les données en mémoire, vous pouvez leur appliquer des transformations. Consultez la rubrique Transformation des données dans le Guide de l'utilisateur de Spotfire Analyst pour obtenir plus d'informations.
En cas de perte de la connexion à la source de données externe, aucune analyse utilisant cette source ne peut être réalisée.	Étant donné que les données externes ne sont pas stockées dans l'analyse et que chaque modification implique l'envoi d'une nouvelle requête à la source de données, la source doit être disponible pendant la modification des visualisations.
Les annotations ne sont pas disponibles pour les données in-db.	Les annotations dépendent des numéros de ligne qui ne sont pas disponibles pour les données in-db.
Vous ne pouvez pas supprimer de colonnes ni de lignes dans les tables de données in-db.	Les tables de données in-db ne contiennent aucune donnée au moment de l'exécution ; vous n'avez donc rien à supprimer. Toutefois, vous pouvez masquer les colonnes des tables source lorsque vous sélectionnez les tables dans la boîte de dialogue Vues dans la connexion (pour les sources de données relationnelles) ou dans la boîte de dialogue Sélection de données dans la connexion (pour les sources de données de cube) au moyen du client installé.
Vous ne pouvez pas appliquer les outils ou les opérations suivants sur les tables de données « in-database » : Ajouter des colonnes, Ajouter des lignes, Ajouter une colonne partitionnée, Relations de données, K-means Clustering, Similarité des courbes, Fonctions de données, Modélisation de la régression, Modélisation de la classification, Ajouter des colonnes prévues	Les tables de données « in-db » ne contiennent aucune donnée au moment de l'exécution et ne peuvent donc pas intégrer d'autres données.
Ajouter une colonne calculée présente les limitations suivantes lors de l'utilisation de données «in-database » : Aucun connecteur de cube n'est pris en charge. Certains connecteurs (par ex. Cloudera, Hortonworks et Vertica) ne prennent pas en charge les méthodes d'agrégation. La partition n'est pas prise en charge. Les expressions post-agrégation (mot-clé THEN) ne sont pas prises en charge ; par conséquent, les expressions OVER ne le sont pas non plus.	L'expression de la colonne calculée est évaluée dans le système de gestion des bases de données sous-jacent. Par conséquent, seules les méthodes prises en charge par le connecteur actuel seront disponibles.
Vous ne pouvez pas utiliser les colonnes de dimension ou d'attribut de cube sur les axes numériques.	Les dimensions de cube étant mappées en tant que Chaîne lors de l'ajout des données de cube à Spotfire, ces colonnes ne peuvent pas être utilisées sur les axes numériques même si leur nom indique que le résultat obtenu est numérique. Lorsque vous importez des parties des données de cube, il est possible de convertir des données chaîne en d'autres types de données.
Les données externes à la demande ne sont pas disponibles directement lors du premier ajout de la connexion de données à une analyse. Vous devez ajouter les données en tant que données Externes et modifier les paramètres à la demande à partir du Canevas de données (client installé uniquement) pour activer le chargement à la demande.	Le flux de travail Ajouter des données à l'analyse présume toujours que les données à la demande doivent être importées.
Les sources de données de cube (cubes importés ou « in-database ») ne sont actuellement pas disponibles à la demande.	Cette fonction n'a pas encore été corrigée de manière à gérer les données de cube.
Contrairement aux connexions de données des sources de données relationnelles, les sélections réalisées dans les connexions de données de cube donnent toujours lieu à une table de données unique.	Les étapes de la sélection des données dans le cas des sources de données de cube visent à limiter le nombre de données de cube aplaties, et non à afficher simultanément les différentes parties.
La fonction Colonne partitionnée automatiquement fonctionne uniquement pour certains connecteurs, notamment Teradata, Oracle, PostgreSQL et SAP HANA.	L'utilisation de width_buckets pour le partitionnement automatique est prise en charge uniquement par certaines sources de données externes.
La fonction d'exportation des données depuis une table de données ne peut pas être utilisée pour exporter des données depuis des tables de données in-db.	Aucune donnée ne peut être exportée depuis la table de données in-db puisqu'elle ne contient pas de donnée au moment de l'exécution. Conseil : Utilisez l'option Exporter les données à partir d’une visualisation pour exporter les données de tables de données « in-database ». Notez que pour tous les types de visualisation, à l'exception des tableaux et des tableaux croisés, vous devez marquer les éléments souhaités avant d'ouvrir la boîte de dialogue Exporter les données .
Les résultats de la comparaison de chaînes entre différents systèmes peuvent varier selon la gestion des espaces de fin.	Les systèmes externes conformes à la norme SQL-92 (par exemple SQL Server, MySQL et Netezza) suppriment les espaces de fin dans les chaînes.
Vous devez ajouter des caractères génériques afin d’obtenir des correspondances approximatives dans les fichiers de texte lorsque vous utilisez des données « in-database ».	Si vous saisissez une partie d'un mot avec des données in-db, la recherche portera uniquement sur les lettres saisies. (Pour les données « in-memory », un caractère générique est automatiquement ajouté à la fin des lettres.)
Par défaut, si vous avez plusieurs filtres pour une table de données in-db, les valeurs disponibles pour la sélection dans un filtre ne reflètent pas les sélections de filtres que vous avez déjà effectuées dans d'autres filtres. Contrairement aux tables de données « in-memory », cela signifie que les valeurs qui pourraient déjà avoir été filtrées seront disponibles pour la sélection et qu'aucune indication visuelle n'apparaît pour signaler les valeurs qui ont été éliminées par d'autres filtres. Pour que les filtres d'une table de données « in-database » fonctionnent davantage comme des filtres pour les tables de données « in-memory », vous pouvez modifier les paramètres de la connexion de données pour activer les filtres en cascade pour les tables « in-database ».	Pour les tables de données in-database, le masquage et la mise en gris des valeurs éliminées par d'autres filtres sont une opération fastidieuse. Par conséquent, cette option (appelée « filtres en cascade ») doit être activée manuellement. ATTENTION : L’activation du comportement en cascade pour les filtres des tables de données « in-database » entraîne une charge de requête supplémentaire sur la source de données externe. Il est de la responsabilité de l'utilisateur de s'assurer que la source de données externe peut gérer cette charge de requête supplémentaire. Pour activer les filtres en cascade pour les tables de données « in-database » à partir d'une connexion : Dans la barre de menus, sélectionnez Données > Propriétés de connexion de données. Dans la boîte de dialogue Propriétés des connexions de données, sélectionnez la connexion de données de votre choix et cliquez sur Paramètres. Dans la boîte de dialogue Paramètres de connexion de données, cliquez sur l'onglet Paramètres de performances, puis sélectionnez Activer les filtres en cascade pour les tables de données « in-database » depuis cette connexion. Pour enregistrer vos modifications et fermer la boîte de dialogue, cliquez sur OK.