Funzioni statistiche

L'elenco mostra le funzioni statistiche utilizzabili nelle espressioni.

Funzione Descrizione
Avg(Arg1, ...) Restituisce la media (media aritmetica) degli argomenti. Gli argomenti e il risultato sono di tipo real. Se viene fornito un argomento, il risultato è la media di tutte le righe. Se vengono forniti più argomenti, il risultato è la media di ogni riga. Gli argomenti null sono ignorati e non contribuiscono alla media.

Esempi:

Avg([Column])

Avg(2,-3,4)→ 1

Avg(-1) → -1

Avg(1.5, -2, 3.5) → 1

Avg(1, null, 3) → 2

Avg(null)(Empty)

ChiDist(Arg1) Restituisce il valore P del chi-quadro (maggiore) dell'argomento.

Esempio:

ChiDist(x, deg_freedom)

ChiDist(7.377759, 2) → 0,025

ChiInv(Arg1) Restituisce il valore del quantile del chi-quadro (maggiore) dell'argomento.

Esempio:

ChiInv(p, deg_freedom)

ChiInv(0.025, 2) → 7,377759

Count(Arg1) Calcola il numero di valori non vuoti nella colonna dell'argomento oppure, se non sono specificati argomenti, il numero totale di righe.

Esempio:

Count([Column])

CountBig(Arg1) Calcola il numero di valori non vuoti nella colonna dell'argomento oppure, se non sono specificati argomenti, il numero totale di righe. Questa funzione restituisce un LongInteger.

Esempio:

CountBig([Column])

Covariance(Arg1, Arg2) Calcola la covarianza di due colonne fornite come argomenti.

Esempio:

Covariance([Column1], [Column2])

FDist(Arg1) Restituisce il valore p F (maggiore) dell'argomento.

Esempio:

FDist(x, deg_freedom1, deg_freedom2)

FDist(6.936728, 1, 10) → 0,025

FInv(Arg1) Restituisce il valore del quantile di F (maggiore) dell'argomento.

Esempio:

FInv(p, deg_freedom1, deg_freedom2)

FInv(0.025, 1, 10) → 6,936728

First(Arg1) Restituisce il primo valore valido in base all'ordine fisico delle righe di dati nella colonna dell'argomento.

Esempio:

First([Column])

GeometricMean() Calcola il valore della media geometrica. Se uno dei valori di input è negativo, il risultato è "Vuoto". Se uno dei valori di input è uguale a zero, il risultato è zero.

Esempio:

GeometricMean([Sales])

IQR(Arg1) Calcola la differenza di valore Q3-Q1 o il 75° percentile meno il 25° percentile. IQR chiamato anche scarto H.

Esempio:

IQR([Column])

L95(Arg1) Calcola l'endpoint inferiore del 95% dell'intervallo di certezza.
Nota: Il valore t statico 1,959964, utilizzato da questa funzione, viene adattato a dimensioni ampie del campione (n >= 40). Per dimensioni più ridotte del campione, utilizzare invece la seguente espressione:

Avg([Value])-TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())

Esempio:

L95([Column])

Lag(Arg1, Arg2) Sposta i valori in una colonna verso il basso per il numero di passi specificato. Il primo argomento è la colonna in cui effettuare lo spostamento. Il secondo argomento (opzionale) è il numero di passi. L'impostazione predefinita è 1.

Se viene utilizzato un numero di passi negativo, i valori vengono spostati nella direzione opposta (vedere l'immagine seguente).

Esempi:

Lag([Column])

Lag([Column],3)

Si noti che la funzione Lag è applicata ai dati nell'ordine in cui questi sono stati caricati. La funzione non tiene conto dell'ordinamento nelle visualizzazioni e qualsiasi modifica ai dati (ad esempio durante il ricaricamento) potrebbe comportare valori diversi per le varie righe.

Last(Arg1) Restituisce l'ultimo valore valido in base all'ordine fisico delle righe di dati nella colonna dell'argomento.

Esempio:

Last([Column])

LastValueForMax(Arg1, Arg2) Restituisce il valore della colonna 2 per il valore massimo della colonna 1.

In presenza di più valori massimi della colonna 1, il risultato è il valore dell'ultima riga massima. Vedere anche ValueForMax.

Esempio:

LastValueForMax([Column 1], [Column 2])

LastValueForMin(Arg1, Arg2) Restituisce il valore della colonna 2 per il valore minimo della colonna 1.

In presenza di più valori minimi della colonna 1, il risultato è il valore dell'ultima riga minima. Vedere anche ValueForMin.

Esempio:

LastValueForMin([Column 1], [Column 2])

LAV(Arg1) Calcola il valore adiacente inferiore.

Esempio:

LAV([Column])

Lead(Arg1, Arg2) Sposta i valori in una colonna verso l'alto per il numero di passi specificato. Il primo argomento è la colonna in cui effettuare lo spostamento. Il secondo argomento (opzionale) è il numero di passi. L'impostazione predefinita è 1.

Se viene utilizzato un numero di passi negativo, i valori vengono spostati nella direzione opposta (vedere l'immagine seguente).

Esempi:

Lead([Column])

Lead([Column],3)

Si noti che la funzione Lead è applicata ai dati nell'ordine in cui questi sono stati caricati. La funzione non tiene conto dell'ordinamento nelle visualizzazioni e qualsiasi modifica ai dati (ad esempio durante il ricaricamento) potrebbe comportare valori diversi per le varie righe.

LIF(Arg1) Calcola la partizione interna inferiore. Si tratta della soglia localizzata in corrispondenza di Q1 - (1.5*IQR).

Esempio:

LIF([Column])

LOF(Arg1) Calcola la partizione esterna inferiore. Si tratta della soglia localizzata in corrispondenza di Q1 - (3*IQR).

Esempio:

LOF([Column])

Max(Arg1, ...) Calcola il valore massimo. Se viene fornito un argomento, il risultato è il massimo per l'intera colonna. Se vengono forniti più argomenti, il risultato è il massimo per ogni riga. L’argomento e il risultato sono di tipo real. Gli argomenti null sono ignorati.

Esempi:

Max([Column])

Max(-1) → -1

Max (1.5, -2, 3) → 3

Max (1, null, 3) → 3

Max (null)(Empty)

MeanDeviation(Arg1, ...) Calcola il valore della deviazione della media (AAD, Average Absolute Deviation). Se viene fornito un argomento, il risultato è la deviazione della media di tutte le righe. Se vengono forniti più argomenti, il risultato è la deviazione della media per ogni riga.

Esempi:

MeanDeviation([Column])

MeanDeviation(2,-3,4) → 2,67

Median(Arg1) Calcola la mediana dell'argomento. Se viene fornito un argomento, il risultato è la mediana di tutte le righe. Se vengono forniti più argomenti, il risultato è la mediana per ogni riga.

Esempi:

Median([Column])

Median(2,-3,4)

MedianAbsoluteDeviation(Arg1, ...) Calcola la deviazione assoluta della mediana (MAD, Median Absolute Deviation). Se viene fornito un argomento, il risultato è la deviazione assoluta della mediana di tutte le righe. Se vengono forniti più argomenti, il risultato è la deviazione assoluta della mediana per ogni riga.

Esempi:

MedianAbsoluteDeviation([Sales])

MedianAbsoluteDeviation(2,-3,4)

Min(Arg1, ...) Calcola il valore minimo. Se viene fornito un argomento, il risultato è il minimo per l'intera colonna. Se vengono forniti più argomenti, il risultato è il minimo per ogni riga. L’argomento e il risultato sono di tipo real. Gli argomenti null sono ignorati.

Esempi:

Min([Column])

Min(-1) → -1

Min (1.5, -2, 3) → -2

Min (1, null, 3) → 1

Min (null) (Empty)

NormDist(Arg1) Restituisce il valore p normale (maggiore) dell'argomento. Se non specificati, i valori predefiniti sono media=0 e deviazione standard=1.

Esempio:

NormDist(x, mean, standard_dev)

NormDist(1.96) → 0,025

NormInv(Arg1) Restituisce il valore del quantile normale (maggiore) dell'argomento. Se non specificati, i valori predefiniti sono media=0 e deviazione standard=1.

Esempio:

NormInv(p, mean, standard_dev)

NormInv(0.025) → 1,96

NthLargest(Arg1, Arg2) L'n-esimo valore più grande. Il primo argomento è la colonna da analizzare e il secondo è il valore di n.

Se n è maggiore del numero di valori nella colonna, restituisce il valore più piccolo.

Esempio:

NthLargest([Column], 10)

NthSmallest(Arg1, Arg2) L'n-esimo valore più piccolo. Il primo argomento è la colonna da analizzare e il secondo è il valore di n.

Se n è maggiore del numero di valori nella colonna, restituisce il valore più grande.

Esempio:

NthSmallest([Column], 10)

Outliers(Arg1) Conteggio dei valori esterni. Calcola il numero di valori maggiori del valore adiacente superiore o minori del valore adiacente inferiore.

Esempio:

Outliers([Column])

P10(Arg1) Il 10° percentile è il valore al quale il 10 percento dei valori dati è minore o uguale al valore.

Esempio:

P10([Column])

P90(Arg1) Il 90° percentile è il valore al quale il 90 percento dei valori dati è minore o uguale al valore.

Esempio:

P90([Column])

PctOutliers(Arg1) Percentile dei valori esterni. Calcola la percentuale di valori maggiori del valore adiacente superiore o minori del valore adiacente inferiore.

Esempio:

PctOutliers([Column])

Percent(Arg1, Arg2) La percentuale è il valore calcolato per una certa percentuale oltre il valore minimo all'interno dell'intervallo di valori (valore max - valore min). Il primo argomento è la colonna da analizzare e il secondo è la percentuale.

Esempio:

Percent([Column], 15.0)

Percentile(Arg1, Arg2) Il percentile è il valore al quale una certa percentuale dei valori dati è minore o uguale al valore. Il primo argomento è la colonna da analizzare e il secondo è la percentuale.

Esempio:

Percentile([Column], 15.0)

Q1(Arg1) Calcola il primo quartile.

Esempio:

Q1([Column])

Q3(Arg1) Calcola il terzo quartile.

Esempio:

Q3([Column])

Range(Arg1) Intervallo tra il valore più grande e il valore più piccolo nella colonna.

Il risultato è un real o un TimeSpan, a seconda del tipo di dati dell'argomento.

Esempio:

Range([Column])

StdDev(Arg1) Calcola la deviazione standard.

Esempio:

StdDev([Column])

StdErr(Arg1) Calcola l'errore standard.

Esempio:

StdErr([Column])

TDist(Arg1) Restituisce il valore p t (maggiore) dell'argomento.

Esempio:

TDist(x, deg_freedom)

TDist(4.302653, 2) → 0,025

TERR_Binary Chiama il motore TIBCO Enterprise Runtime for R e restituisce un output del tipo di dati specificato, contenente lo stesso numero di righe dell'input.

Il primo argomento è uno script e gli argomenti successivi sono gli argomenti dello script.

La colonna restituita deve contenere lo stesso numero di righe dell'input. Oltre allo script, è necessario che sia presente almeno un altro argomento. Gli input saranno sostituiti nelle variabili denominate input1,input2, ...inputN e così via, mentre l'output deve essere posizionato in una variabile denominata output.

Esempi:

TERR_Real("output <- input1*100 + input2", [Record No], [Sales])

TERR_String("output <- input1", [String Column])

TERR_Boolean Vedere TERR_Binary sopra.
TERR_DateTime Vedere TERR_Binary sopra.
TERR_Integer Vedere TERR_Binary sopra.
TERR_Real Vedere TERR_Binary sopra.
TERR_String Vedere TERR_Binary sopra.
TERRAggregation_Binary Chiama il motore TIBCO Enterprise Runtime for R e restituisce un output del tipo di dati specificato. Il primo argomento è uno script e gli argomenti successivi sono gli argomenti dello script.

Lo script deve restituire un valore aggregato singolo. Oltre allo script, è necessario che sia presente almeno un altro argomento. Gli input saranno sostituiti nelle variabili denominate input1,input2, ...inputN e così via, mentre l'output deve essere posizionato in una variabile denominata output.

Esempi:

TERRAggregation_Real("output <- median(input1) + median(input2)", [X], [Y])

TERRAggregation_String("output <- input1[1]", [Customer Name])

TERRAggregation_Boolean Vedere TERRAggregation_Binary sopra.
TERRAggregation_DateTime Vedere TERRAggregation_Binary sopra.
TERRAggregation_Integer Vedere TERRAggregation_Binary sopra.
TERRAggregation_Real Vedere TERRAggregation_Binary sopra.
TERRAggregation_String Vedere TERRAggregation_Binary sopra.
TInv(Arg1) Restituisce il valore del quantile t (maggiore) dell'argomento.

Esempi:

TInv(p, deg_freedom)

TInv(0.025, 2) → 4,302653

TrimmedMean(Arg1, Arg2) Calcola il valore medio troncato (media troncata). Il primo argomento è la colonna da analizzare e il secondo corrisponde al numero di valori da escludere dal calcolo in percentuale. Se il valore di troncamento è impostato al 10%, il 5% massimo e il 5% minimo dei valori sono esclusi dalla media calcolata.

Esempio:

TrimmedMean([Sales], 10)

U95(Arg1) Calcola l'endpoint superiore del 95% dell'intervallo di certezza.
Nota: Il valore t statico 1,959964, utilizzato da questa funzione, viene adattato a dimensioni ampie del campione (n >= 40). Per dimensioni più ridotte del campione, utilizzare invece la seguente espressione:

Avg([Value])+TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())

Esempio:

U95([Column])

UAV(Arg1) Calcola il valore adiacente superiore.

Esempio:

UAV([Column])

UIF(Arg1) Calcola la partizione interna superiore. Si tratta della soglia localizzata in corrispondenza di Q3 + (1.5*IQR).

Esempio:

UIF([Column])

UniqueCount(Arg1) Calcola il numero di valori univoci non vuoti nella colonna degli argomenti.

Esempio:

UniqueCount([Column])

UOF(Arg1) Calcola la partizione esterna superiore. Si tratta della soglia localizzata in corrispondenza di Q3 + (3*IQR).

Esempio:

UOF([Column])

ValueForMax(Arg1, Arg2) Restituisce il valore della colonna 2 per il valore massimo della colonna 1.

In presenza di più valori massimi della colonna 1, il risultato è il valore della prima riga massima. Vedere anche LastValueForMax.

Esempio:

ValueForMax([Column 1], [Column 2])

ValueForMin(Arg1, Arg2) Restituisce il valore della colonna 2 per il valore minimo della colonna 1.

In presenza di più di uno dei valori minimi della colonna 1, il risultato è il valore per la prima riga minima. Vedere anche LastValueForMin.

Esempio:

ValueForMin([Column 1], [Column 2])

Var(Arg1) Calcola la varianza.

Esempio:

Var([Column])

WeightedAverage(Arg1, Arg2) Calcola la media ponderata di due colonne. Arg1 è la colonna della ponderazione e Arg2 è la colonna del valore.

Esempio:

WeightedAverage([Column1],[Column2])

Suggerimento: è possibile utilizzare la parola chiave DISTINCT per restituire un risultato che utilizzi esclusivamente valori univoci. Ad esempio, Avg(DISTINCT[Column]) restituirebbe la media dei valori univoci invece della media di tutti i valori nella colonna specificata.UniqueCount([Column]) è l'equivalente di Count(DISTINCT[Column]).

Vedere anche Funzioni.