Funzioni statistiche

L'elenco mostra le funzioni statistiche utilizzabili nelle espressioni.

Funzione	Descrizione
`Avg(Arg1, ...)`	Restituisce la media (media aritmetica) degli argomenti. Gli argomenti e il risultato sono di tipo real. Se viene fornito un argomento, il risultato è la media di tutte le righe. Se vengono forniti più argomenti, il risultato è la media di ogni riga. Gli argomenti null sono ignorati e non contribuiscono alla media. Esempi: `Avg([Column])` `Avg(2,-3,4)`→ 1 `Avg(-1)` → -1 `Avg(1.5, -2, 3.5)` → 1 `Avg(1, null, 3)` → 2 `Avg(null)` →`(Empty)`
`ChiDist(Arg1)`	Restituisce il valore P del chi-quadro (maggiore) dell'argomento. Esempio: `ChiDist(x, deg_freedom)` `ChiDist(7.377759, 2)` → 0,025
`ChiInv(Arg1)`	Restituisce il valore del quantile del chi-quadro (maggiore) dell'argomento. Esempio: `ChiInv(p, deg_freedom)` `ChiInv(0.025, 2)` → 7,377759
`Count(Arg1)`	Calcola il numero di valori non vuoti nella colonna dell'argomento oppure, se non sono specificati argomenti, il numero totale di righe. Esempio: `Count([Column])`
`CountBig(Arg1)`	Calcola il numero di valori non vuoti nella colonna dell'argomento oppure, se non sono specificati argomenti, il numero totale di righe. Questa funzione restituisce un LongInteger. Esempio: `CountBig([Column])`
`Covariance(Arg1, Arg2)`	Calcola la covarianza di due colonne fornite come argomenti. Esempio: `Covariance([Column1], [Column2])`
`FDist(Arg1)`	Restituisce il valore p F (maggiore) dell'argomento. Esempio: `FDist(x, deg_freedom1, deg_freedom2)` `FDist(6.936728, 1, 10)` → 0,025
`FInv(Arg1)`	Restituisce il valore del quantile di F (maggiore) dell'argomento. Esempio: `FInv(p, deg_freedom1, deg_freedom2)` `FInv(0.025, 1, 10)` → 6,936728
`First(Arg1)`	Restituisce il primo valore valido in base all'ordine fisico delle righe di dati nella colonna dell'argomento. Esempio: `First([Column])`
`GeometricMean()`	Calcola il valore della media geometrica. Se uno dei valori di input è negativo, il risultato è "Vuoto". Se uno dei valori di input è uguale a zero, il risultato è zero. Esempio: `GeometricMean([Sales])`
`IQR(Arg1)`	Calcola la differenza di valore Q3-Q1 o il 75° percentile meno il 25° percentile. IQR chiamato anche scarto H. Esempio: `IQR([Column])`
`L95(Arg1)`	Calcola l'endpoint inferiore del 95% dell'intervallo di certezza. Nota: Il valore t statico 1,959964, utilizzato da questa funzione, viene adattato a dimensioni ampie del campione (`n >= 40`). Per dimensioni più ridotte del campione, utilizzare invece la seguente espressione: `Avg([Value])-TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())` Esempio: `L95([Column])`
`Lag(Arg1, Arg2)`	Sposta i valori in una colonna verso il basso per il numero di passi specificato. Il primo argomento è la colonna in cui effettuare lo spostamento. Il secondo argomento (opzionale) è il numero di passi. L'impostazione predefinita è 1. Se viene utilizzato un numero di passi negativo, i valori vengono spostati nella direzione opposta (vedere l'immagine seguente). Esempi: `Lag([Column])` `Lag([Column],3)` Si noti che la funzione Lag è applicata ai dati nell'ordine in cui questi sono stati caricati. La funzione non tiene conto dell'ordinamento nelle visualizzazioni e qualsiasi modifica ai dati (ad esempio durante il ricaricamento) potrebbe comportare valori diversi per le varie righe.
`Last(Arg1)`	Restituisce l'ultimo valore valido in base all'ordine fisico delle righe di dati nella colonna dell'argomento. Esempio: `Last([Column])`
`LastValueForMax(Arg1, Arg2)`	Restituisce il valore della colonna 2 per il valore massimo della colonna 1. In presenza di più valori massimi della colonna 1, il risultato è il valore dell'ultima riga massima. Vedere anche `ValueForMax`. Esempio: `LastValueForMax([Column 1], [Column 2])`
`LastValueForMin(Arg1, Arg2)`	Restituisce il valore della colonna 2 per il valore minimo della colonna 1. In presenza di più valori minimi della colonna 1, il risultato è il valore dell'ultima riga minima. Vedere anche `ValueForMin`. Esempio: `LastValueForMin([Column 1], [Column 2])`
`LAV(Arg1)`	Calcola il valore adiacente inferiore. Esempio: `LAV([Column])`
`Lead(Arg1, Arg2)`	Sposta i valori in una colonna verso l'alto per il numero di passi specificato. Il primo argomento è la colonna in cui effettuare lo spostamento. Il secondo argomento (opzionale) è il numero di passi. L'impostazione predefinita è 1. Se viene utilizzato un numero di passi negativo, i valori vengono spostati nella direzione opposta (vedere l'immagine seguente). Esempi: `Lead([Column])` `Lead([Column],3)` Si noti che la funzione Lead è applicata ai dati nell'ordine in cui questi sono stati caricati. La funzione non tiene conto dell'ordinamento nelle visualizzazioni e qualsiasi modifica ai dati (ad esempio durante il ricaricamento) potrebbe comportare valori diversi per le varie righe.
`LIF(Arg1)`	Calcola la partizione interna inferiore. Si tratta della soglia localizzata in corrispondenza di `Q1 - (1.5*IQR)`. Esempio: `LIF([Column])`
`LOF(Arg1)`	Calcola la partizione esterna inferiore. Si tratta della soglia localizzata in corrispondenza di `Q1 - (3*IQR)`. Esempio: `LOF([Column])`
`Max(Arg1, ...)`	Calcola il valore massimo. Se viene fornito un argomento, il risultato è il massimo per l'intera colonna. Se vengono forniti più argomenti, il risultato è il massimo per ogni riga. L’argomento e il risultato sono di tipo real. Gli argomenti null sono ignorati. Esempi: `Max([Column])` `Max(-1)`→ -1 `Max (1.5, -2, 3)` → 3 `Max (1, null, 3)` → 3 `Max (null)` →`(Empty)`
`MeanDeviation(Arg1, ...)`	Calcola il valore della deviazione della media (AAD, Average Absolute Deviation). Se viene fornito un argomento, il risultato è la deviazione della media di tutte le righe. Se vengono forniti più argomenti, il risultato è la deviazione della media per ogni riga. Esempi: `MeanDeviation([Column])` `MeanDeviation(2,-3,4)`→ 2,67
`Median(Arg1)`	Calcola la mediana dell'argomento. Se viene fornito un argomento, il risultato è la mediana di tutte le righe. Se vengono forniti più argomenti, il risultato è la mediana per ogni riga. Esempi: `Median([Column])` `Median(2,-3,4)`
`MedianAbsoluteDeviation(Arg1, ...)`	Calcola la deviazione assoluta della mediana (MAD, Median Absolute Deviation). Se viene fornito un argomento, il risultato è la deviazione assoluta della mediana di tutte le righe. Se vengono forniti più argomenti, il risultato è la deviazione assoluta della mediana per ogni riga. Esempi: `MedianAbsoluteDeviation([Sales])` `MedianAbsoluteDeviation(2,-3,4)`
`Min(Arg1, ...)`	Calcola il valore minimo. Se viene fornito un argomento, il risultato è il minimo per l'intera colonna. Se vengono forniti più argomenti, il risultato è il minimo per ogni riga. L’argomento e il risultato sono di tipo real. Gli argomenti null sono ignorati. Esempi: `Min([Column])` `Min(-1)`→ -1 `Min (1.5, -2, 3)` → -2 `Min (1, null, 3)` → 1 `Min (null)`→`(Empty)`
`NormDist(Arg1)`	Restituisce il valore p normale (maggiore) dell'argomento. Se non specificati, i valori predefiniti sono media=0 e deviazione standard=1. Esempio: `NormDist(x, mean, standard_dev)` `NormDist(1.96)` → 0,025
`NormInv(Arg1)`	Restituisce il valore del quantile normale (maggiore) dell'argomento. Se non specificati, i valori predefiniti sono media=0 e deviazione standard=1. Esempio: `NormInv(p, mean, standard_dev)` `NormInv(0.025)` → 1,96
`NthLargest(Arg1, Arg2)`	L'n-esimo valore più grande. Il primo argomento è la colonna da analizzare e il secondo è il valore di n. Se n è maggiore del numero di valori nella colonna, restituisce il valore più piccolo. Esempio: `NthLargest([Column], 10)`
`NthSmallest(Arg1, Arg2)`	L'n-esimo valore più piccolo. Il primo argomento è la colonna da analizzare e il secondo è il valore di n. Se n è maggiore del numero di valori nella colonna, restituisce il valore più grande. Esempio: `NthSmallest([Column], 10)`
`Outliers(Arg1)`	Conteggio dei valori esterni. Calcola il numero di valori maggiori del valore adiacente superiore o minori del valore adiacente inferiore. Esempio: `Outliers([Column])`
`P10(Arg1)`	Il 10° percentile è il valore al quale il 10 percento dei valori dati è minore o uguale al valore. Esempio: `P10([Column])`
`P90(Arg1)`	Il 90° percentile è il valore al quale il 90 percento dei valori dati è minore o uguale al valore. Esempio: `P90([Column])`
`PctOutliers(Arg1)`	Percentile dei valori esterni. Calcola la percentuale di valori maggiori del valore adiacente superiore o minori del valore adiacente inferiore. Esempio: `PctOutliers([Column])`
`Percent(Arg1, Arg2)`	La percentuale è il valore calcolato per una certa percentuale oltre il valore minimo all'interno dell'intervallo di valori (valore max - valore min). Il primo argomento è la colonna da analizzare e il secondo è la percentuale. Esempio: `Percent([Column], 15.0)`
`Percentile(Arg1, Arg2)`	Il percentile è il valore al quale una certa percentuale dei valori dati è minore o uguale al valore. Il primo argomento è la colonna da analizzare e il secondo è la percentuale. Esempio: `Percentile([Column], 15.0)`
`Q1(Arg1)`	Calcola il primo quartile. Esempio: `Q1([Column])`
`Q3(Arg1)`	Calcola il terzo quartile. Esempio: `Q3([Column])`
`Range(Arg1)`	Intervallo tra il valore più grande e il valore più piccolo nella colonna. Il risultato è un real o un TimeSpan, a seconda del tipo di dati dell'argomento. Esempio: `Range([Column])`
`StdDev(Arg1)`	Calcola la deviazione standard. Esempio: `StdDev([Column])`
`StdErr(Arg1)`	Calcola l'errore standard. Esempio: `StdErr([Column])`
`TDist(Arg1)`	Restituisce il valore p t (maggiore) dell'argomento. Esempio: `TDist(x, deg_freedom)` `TDist(4.302653, 2)` → 0,025
`TERR_Binary`	Chiama il motore TIBCO Enterprise Runtime for R e restituisce un output del tipo di dati specificato, contenente lo stesso numero di righe dell'input. Il primo argomento è uno script e gli argomenti successivi sono gli argomenti dello script. La colonna restituita deve contenere lo stesso numero di righe dell'input. Oltre allo script, è necessario che sia presente almeno un altro argomento. Gli input saranno sostituiti nelle variabili denominate `input1`,`input2`, ...`inputN` e così via, mentre l'output deve essere posizionato in una variabile denominata `output`. Esempi: `TERR_Real("output <- input1*100 + input2", [Record No], [Sales])` `TERR_String("output <- input1", [String Column])`
`TERR_Boolean`	Vedere TERR_Binary sopra.
`TERR_DateTime`	Vedere TERR_Binary sopra.
`TERR_Integer`	Vedere TERR_Binary sopra.
`TERR_Real`	Vedere TERR_Binary sopra.
`TERR_String`	Vedere TERR_Binary sopra.
`TERRAggregation_Binary`	Chiama il motore TIBCO Enterprise Runtime for R e restituisce un output del tipo di dati specificato. Il primo argomento è uno script e gli argomenti successivi sono gli argomenti dello script. Lo script deve restituire un valore aggregato singolo. Oltre allo script, è necessario che sia presente almeno un altro argomento. Gli input saranno sostituiti nelle variabili denominate `input1`,`input2`, ...`inputN` e così via, mentre l'output deve essere posizionato in una variabile denominata `output`. Esempi: `TERRAggregation_Real("output <- median(input1) + median(input2)", [X], [Y])` `TERRAggregation_String("output <- input1[1]", [Customer Name])`
`TERRAggregation_Boolean`	Vedere TERRAggregation_Binary sopra.
`TERRAggregation_DateTime`	Vedere TERRAggregation_Binary sopra.
`TERRAggregation_Integer`	Vedere TERRAggregation_Binary sopra.
`TERRAggregation_Real`	Vedere TERRAggregation_Binary sopra.
`TERRAggregation_String`	Vedere TERRAggregation_Binary sopra.
`TInv(Arg1)`	Restituisce il valore del quantile t (maggiore) dell'argomento. Esempi: `TInv(p, deg_freedom)` `TInv(0.025, 2)` → 4,302653
`TrimmedMean(Arg1, Arg2)`	Calcola il valore medio troncato (media troncata). Il primo argomento è la colonna da analizzare e il secondo corrisponde al numero di valori da escludere dal calcolo in percentuale. Se il valore di troncamento è impostato al 10%, il 5% massimo e il 5% minimo dei valori sono esclusi dalla media calcolata. Esempio: `TrimmedMean([Sales], 10)`
`U95(Arg1)`	Calcola l'endpoint superiore del 95% dell'intervallo di certezza. Nota: Il valore t statico 1,959964, utilizzato da questa funzione, viene adattato a dimensioni ampie del campione (`n >= 40`). Per dimensioni più ridotte del campione, utilizzare invece la seguente espressione: `Avg([Value])+TInv(0.025,Count()-1)*StdDev([Value])/Sqrt(Count())` Esempio: `U95([Column])`
`UAV(Arg1)`	Calcola il valore adiacente superiore. Esempio: `UAV([Column])`
`UIF(Arg1)`	Calcola la partizione interna superiore. Si tratta della soglia localizzata in corrispondenza di `Q3 + (1.5*IQR)`. Esempio: `UIF([Column])`
`UniqueCount(Arg1)`	Calcola il numero di valori univoci non vuoti nella colonna degli argomenti. Esempio: `UniqueCount([Column])`
`UOF(Arg1)`	Calcola la partizione esterna superiore. Si tratta della soglia localizzata in corrispondenza di Q3 + (3*IQR). Esempio: `UOF([Column])`
`ValueForMax(Arg1, Arg2)`	Restituisce il valore della colonna 2 per il valore massimo della colonna 1. In presenza di più valori massimi della colonna 1, il risultato è il valore della prima riga massima. Vedere anche `LastValueForMax`. Esempio: `ValueForMax([Column 1], [Column 2])`
`ValueForMin(Arg1, Arg2)`	Restituisce il valore della colonna 2 per il valore minimo della colonna 1. In presenza di più di uno dei valori minimi della colonna 1, il risultato è il valore per la prima riga minima. Vedere anche `LastValueForMin`. Esempio: `ValueForMin([Column 1], [Column 2])`
`Var(Arg1)`	Calcola la varianza. Esempio: `Var([Column])`
`WeightedAverage(Arg1, Arg2)`	Calcola la media ponderata di due colonne. Arg1 è la colonna della ponderazione e Arg2 è la colonna del valore. Esempio: `WeightedAverage([Column1],[Column2])`

Suggerimento: è possibile utilizzare la parola chiave DISTINCT per restituire un risultato che utilizzi esclusivamente valori univoci. Ad esempio, Avg(DISTINCT[Column]) restituirebbe la media dei valori univoci invece della media di tutti i valori nella colonna specificata.UniqueCount([Column]) è l'equivalente di Count(DISTINCT[Column]).

Vedere anche Funzioni.

Contenuto

Indice

Ricerca

Funzioni statistiche