Fonctions statistiques

La liste indique les fonctions statistiques pouvant être utilisées dans des expressions.

Fonction Description
Avg(Arg1, ...) Renvoie la moyenne (moyenne arithmétique) des arguments. Les arguments et les résultats sont de type réel. Si un argument est donné, le résultat représente la moyenne de toutes les lignes. Si plusieurs arguments sont donnés, le résultat représente la moyenne de chaque ligne. Les arguments null sont ignorés et ne sont pas inclus dans la moyenne.

Exemples :

Avg([Column])

Avg(2,-3,4)→ 1

Avg(-1) → -1

Avg(1.5, -2, 3.5) → 1

Avg(1, null, 3) → 2

Avg(null)(Empty)

ChiDist(Arg1) Renvoie la valeur p de chi carré (queue supérieure) de l'argument.

Exemple :

ChiDist(x, deg_freedom)

ChiDist(7.377759, 2) → 0,025

ChiInv(Arg1) Retourne la valeur p du quantile chi carré (queue supérieure) de l'argument.

Exemple :

ChiInv(p, deg_freedom)

ChiInv(0.025, 2) → 7,377759

Count(Arg1) Calcule le nombre de valeurs non vides dans la colonne d'arguments ou, si aucun argument n'est spécifié, le nombre total de lignes.

Exemple :

Count([Column])

CountBig(Arg1) Calcule le nombre de valeurs non vides dans la colonne d'arguments ou, si aucun argument n'est spécifié, le nombre total de lignes. Cette fonction renvoie une valeur LongInteger.

Exemple :

CountBig([Column])

Covariance(Arg1, Arg2) Calcule la covariance de deux colonnes données comme arguments.

Exemple :

Covariance([Column1], [Column2])

FDist(Arg1) Renvoie la valeur p de F (queue supérieure) de l'argument.

Exemple :

FDist(x, deg_freedom1, deg_freedom2)

FDist(6.936728, 1, 10) → 0,025

FInv(Arg1) Retourne la queue supérieure valeur du quantile F de l'argument.

Exemple :

FInv(p, deg_freedom1, deg_freedom2)

FInv(0.025, 1, 10) → 6,936728

First(Arg1) Retourne la première valeur valide basée sur l'ordre physique des lignes de données dans la colonne argument.

Exemple :

First([Column])

GeometricMean() Calcule la valeur moyenne géométrique. Si une valeur d'entrée est négative, le résultat sera "Vide". Si une valeur d'entrée est égale à zéro, le résultat sera égal à zéro.

Exemple :

GeometricMean([Sales])

IQR(Arg1) Calcule la différence de valeur Q3-Q1 ou 75e centile moins 25e centile. IQR est également nommé H-spread.

Exemple :

IQR([Column])

L95(Arg1) Calcule le seuil de l'intervalle de confiance de 95 %.
Remarque : la valeur t-statique 1,959964, utilisée par cette fonction, est adaptée aux tailles d'échantillons importantes (n >= 40). Pour les tailles d'échantillons plus petites, utilisez à la place l'expression suivante :

Avg([Value])-TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())

Exemple :

L95([Column])

Lag(Arg1, Arg2) Décale vers le bas les valeurs d'une colonne d'un nombre spécifié d'étapes. Le premier argument est la colonne à décaler. Le deuxième argument (facultatif) est le nombre d'étapes. Le nombre par défaut est 1.

Si un nombre négatif d'étapes est utilisé, les valeurs sont décalées dans le sens opposé, voir l'image ci-dessous.

Exemples :

Lag([Column])

Lag([Column],3)

Notez que la fonction Lag est appliquée aux données dans l'ordre dans lequel elles ont été chargées. La fonction ne prend pas en compte le tri dans les visualisations et toute modification de données (par exemple, lors du rechargement) peut entraîner des valeurs différentes pour les différentes lignes.

Last(Arg1) Retourne la dernière valeur valide basée sur l'ordre physique des lignes de données dans la colonne argument.

Exemple :

Last([Column])

LastValueForMax(Arg1, Arg2) Renvoie la valeur de la colonne 2 comme valeur maximum de la colonne 1.

S'il y a plusieurs valeurs maximum de la colonne 1, le résultat désigne la valeur de la dernière ligne. Voir aussi ValueForMax.

Exemple :

LastValueForMax([Column 1], [Column 2])

LastValueForMin(Arg1, Arg2) Renvoie la valeur de la colonne 2 comme valeur minimum de la colonne 1.

S'il y a plusieurs valeurs minimum de la colonne 1, le résultat désigne la valeur de la dernière ligne. Voir aussi ValueForMin.

Exemple :

LastValueForMin([Column 1], [Column 2])

LAV(Arg1) Calcule la valeur seuil adjacente.

Exemple :

LAV([Column])

Lead(Arg1, Arg2) Décale vers le haut les valeurs d'une colonne d'un nombre spécifié d'étapes. Le premier argument est la colonne à décaler. Le deuxième argument (facultatif) est le nombre d'étapes. Le nombre par défaut est 1.

Si un nombre négatif d'étapes est utilisé, les valeurs sont décalées dans le sens opposé, voir l'image ci-dessous.

Exemples :

Lead([Column])

Lead([Column],3)

Notez que la fonction Lead est appliquée aux données dans l'ordre dans lequel elles ont été chargées. La fonction ne prend pas en compte le tri dans les visualisations et toute modification des données (par exemple, lors du rechargement) peut entraîner des valeurs différentes pour les différentes lignes.

LIF(Arg1) Calcule la barrière intérieure seuil. Il s’agit du seuil situé Q1 - (1.5*IQR).

Exemple :

LIF([Column])

LOF(Arg1) Calcule la barrière extérieure seuil. Il s’agit du seuil situé Q1 - (3*IQR).

Exemple :

LOF([Column])

Max(Arg1, ...) Calcule la valeur maximale. Si un argument est donné, le résultat représente la valeur maximale de toute la colonne. Si plusieurs arguments sont donnés, le résultat représente la valeur maximale de chaque ligne. L'argument et le résultat sont de type réel. Les arguments null sont ignorés.

Exemples :

Max([Column])

Max(-1) → -1

Max (1.5, -2, 3) → 3

Max (1, null, 3) → 3

Max (null)(Empty)

MeanDeviation(Arg1, ...) Calcule la valeur de l'écart moyen (average absolute deviation, AAD). Si un argument est donné, le résultat représente l'écart moyen de toutes les lignes. Si plusieurs arguments sont donnés, le résultat représente l'écart moyen pour chaque ligne.

Exemples :

MeanDeviation([Column])

MeanDeviation(2,-3,4) → 2,67

Median(Arg1) Renvoie la valeur médiane de l'argument. Si un argument est donné, le résultat représente la valeur médiane de toutes les lignes. Si plusieurs arguments sont donnés, le résultat représente la valeur médiane de chaque ligne.

Exemples :

Median([Column])

Median(2,-3,4)

MedianAbsoluteDeviation(Arg1, ...) Calcule l'écart absolu médian (MAD). Si un argument est donné, le résultat représente l'écart absolu médian de toutes les lignes. Si plusieurs arguments sont donnés, le résultat représente l'écart absolu médian pour chaque ligne.

Exemples :

MedianAbsoluteDeviation([Sales])

MedianAbsoluteDeviation(2,-3,4)

Min(Arg1, ...) Calcule la valeur minimale. Si un argument est donné, le résultat représente la valeur minimale de toute la colonne. Si plusieurs arguments sont donnés, le résultat représente la valeur minimale de chaque ligne. L'argument et le résultat sont de type réel. Les arguments null sont ignorés.

Exemples :

Min([Column])

Min(-1) → -1

Min (1.5, -2, 3) → -2

Min (1, null, 3) → 1

Min (null) (Empty)

NormDist(Arg1) Renvoie la valeur p normale (queue supérieure) de l'argument. SI vous ne les précisez pas vous-même. Par défaut, la moyenne est 0 et la déviation standard est 1.

Exemple :

NormDist(x, mean, standard_dev)

NormDist(1.96) → 0,025

NormInv(Arg1) Renvoie la valeur du quantile normal (queue supérieure) de l'argument. SI vous ne les précisez pas vous-même. Par défaut, la moyenne est 0 et la déviation standard est 1.

Exemple :

NormInv(p, mean, standard_dev)

NormInv(0.025) → 1,96

NthLargest(Arg1, Arg2) La nième valeur la plus grande. Le premier argument correspond à la colonne à analyser et le second argument à la valeur de n.

Si n est supérieur au nombre de valeurs de la colonne, la plus petite valeur est renvoyée.

Exemple :

NthLargest([Column], 10)

NthSmallest(Arg1, Arg2) La nième valeur la plus petite. Le premier argument correspond à la colonne à analyser et le second argument à la valeur de n.

Si n est supérieur au nombre de valeurs de la colonne, la plus grande valeur est renvoyée.

Exemple :

NthSmallest([Column], 10)

Outliers(Arg1) Nombre de valeurs externes. Calcule le nombre de valeurs supérieures à la valeur plafond adjacente ou inférieures à la valeur seuil adjacente.

Exemple :

Outliers([Column])

P10(Arg1) Le 10e centile est la valeur à laquelle 10 % des valeurs des données sont inférieures ou égales.

Exemple :

P10([Column])

P90(Arg1) Le 90e centile est la valeur à laquelle 90 % des valeurs des données sont inférieures ou égales.

Exemple :

P90([Column])

PctOutliers(Arg1) Centile de valeurs externes. Calcule le pourcentage de valeurs supérieures à la valeur plafond adjacente ou inférieures à la valeur seuil adjacente.

Exemple :

PctOutliers([Column])

Percent(Arg1, Arg2) Le pourcentage correspond à la valeur calculée à un certain pourcentage au-dessus de la valeur minimale de la plage de valeurs (valeur max –valeur min). Le premier argument correspond à la colonne à analyser et le second argument correspond au pourcentage.

Exemple :

Percent([Column], 15.0)

Percentile(Arg1, Arg2) Les centiles sont la valeur à laquelle un certain pourcentage des valeurs des données est égal ou inférieur. Le premier argument correspond à la colonne à analyser et le second argument correspond au pourcentage.

Exemple :

Percentile([Column], 15.0)

Q1(Arg1) Calcule le premier quartile.

Exemple :

Q1([Column])

Q3(Arg1) Calcule le troisième quartile.

Exemple :

Q3([Column])

Range(Arg1) L'écart entre la valeur la plus grande et la plus petite dans la colonne.

Le résultat sera présenté sous la forme d'un nombre réel ou d'une période, selon le type de donnés de l'argument.

Exemple :

Range([Column])

StdDev(Arg1) Calcule l'écart type.

Exemple :

StdDev([Column])

StdErr(Arg1) Calcule l'erreur standard.

Exemple :

StdErr([Column])

TDist(Arg1) Renvoie la valeur p de t (queue supérieure) de l'argument.

Exemple :

TDist(x, deg_freedom)

TDist(4.302653, 2) → 0,025

TERR_Binary Appelle le moteur TIBCO Enterprise Runtime for R et renvoie une sortie du type de données spécifié, contenant le même nombre de lignes que l'entrée.

Le premier argument est un script et les arguments suivants sont les arguments correspondant à ce script.

La colonne renvoyée doit contenir le même nombre de lignes que l'entrée. Au moins un argument autre que le script est requis. Les entrées seront placées dans des variables nommées input1,input2, ...inputN, et la sortie doit être placée dans une variable nomméeoutput.

Exemples :

TERR_Real("output <- input1*100 + input2", [Record No], [Sales])

TERR_String("output <- input1", [String Column])

TERR_Boolean Reportez-vous à TERR_Binary ci-dessus.
TERR_DateTime Reportez-vous à TERR_Binary ci-dessus.
TERR_Integer Reportez-vous à TERR_Binary ci-dessus.
TERR_Real Reportez-vous à TERR_Binary ci-dessus.
TERR_String Reportez-vous à TERR_Binary ci-dessus.
TERRAggregation_Binary Appelle le moteur TIBCO Enterprise Runtime for R et renvoie une sortie du type de données spécifié. Le premier argument est un script et les arguments suivants sont les arguments correspondant à ce script.

Le script doit renvoyer une valeur agrégée unique. Au moins un argument autre que le script est requis. Les entrées seront placées dans des variables nommées input1,input2, ...inputN, et la sortie doit être placée dans une variable nomméeoutput.

Exemples :

TERRAggregation_Real("output <- median(input1) + median(input2)", [X], [Y])

TERRAggregation_String("output <- input1[1]", [Customer Name])

TERRAggregation_Boolean Consultez la section TERRAggregation_Binary ci-dessus.
TERRAggregation_DateTime Consultez la section TERRAggregation_Binary ci-dessus.
TERRAggregation_Integer Consultez la section TERRAggregation_Binary ci-dessus.
TERRAggregation_Real Consultez la section TERRAggregation_Binary ci-dessus.
TERRAggregation_String Consultez la section TERRAggregation_Binary ci-dessus.
TInv(Arg1) Renvoie la valeur du quantile t (queue supérieure) de l'argument.

Exemples :

TInv(p, deg_freedom)

TInv(0.025, 2) → 4,302653

TrimmedMean(Arg1, Arg2) Calcule la valeur moyenne tronquée (moyenne tronquée). Le premier argument correspond à la colonne à analyser et le second argument correspond au pourcentage du nombre de valeurs à exclure du calcul. Si la valeur tronquée est définie sur 10 %, alors les valeurs correspondant aux 5 % les plus élevés et aux 5 % les plus faibles sont exclus de la moyenne calculée.

Exemple :

TrimmedMean([Sales], 10)

U95(Arg1) Calcule le plafond de l'intervalle de confiance de 95 %.
Remarque : la valeur t-statique 1,959964, utilisée par cette fonction, est adaptée aux tailles d'échantillons importantes (n >= 40). Pour les tailles d'échantillons plus petites, utilisez à la place l'expression suivante :

Avg([Value])+TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())

Exemple :

U95([Column])

UAV(Arg1) Calcule la valeur plafond adjacente.

Exemple :

UAV([Column])

UIF(Arg1) Calcule la barrière plafond intérieure. Il s’agit du seuil situé Q3 + (1.5*IQR).

Exemple :

UIF([Column])

UniqueCount(Arg1) Calcule le nombre de valeurs non manquantes uniques de la colonne des arguments.

Exemple :

UniqueCount([Column])

UOF(Arg1) Calcule la barrière plafond extérieure. Il s'agit du plafond situé à Q3 + (3*IQR).

Exemple :

UOF([Column])

ValueForMax(Arg1, Arg2) Renvoie la valeur de la colonne 2 comme valeur maximum de la colonne 1.

S'il y a plusieurs valeurs maximum de la colonne 1, le résultat désigne la valeur de la première ligne. Voir aussi LastValueForMax.

Exemple :

ValueForMax([Column 1], [Column 2])

ValueForMin(Arg1, Arg2) Renvoie la valeur de la colonne 2 comme valeur minimum de la colonne 1.

S'il y a plusieurs valeurs minimales de la colonne 1, le résultat sera la valeur de la première ligne de valeur minimale. Voir aussi LastValueForMin.

Exemple :

ValueForMin([Column 1], [Column 2])

Var(Arg1) Calcule la variance.

Exemple :

Var([Column])

WeightedAverage(Arg1, Arg2) Calcule la moyenne pondérée de deux colonnes. Arg1 est la colonne de pondération et Arg2 la colonne des valeurs.

Exemple :

WeightedAverage([Column1],[Column2])

Conseil : le mot-clé DISTINCT permet d'utiliser uniquement les valeurs uniques dans le calcul. Par exemple, Avg(DISTINCT[Column]) renvoie la moyenne des valeurs uniques et non la moyenne de toutes les valeurs dans la colonne indiquée. UniqueCount([Column]) est l’équivalent de Count(DISTINCT[Column]).

Voir aussi Fonctions.