GitHub GitHub' da katkıda bulun: Çevrimiçi düzenle

dcount () (toplama işlevi)

Uygulamada farklılıklar için bkz. KQL Uyumluluğu .

Özet grubundaki bir sayıl ifade tarafından alınan ayırma değerlerinin sayısına ilişkin bir tahmini değeri döndürür.

dcount() toplama işlevi, büyük kümelerin satır sayısını tahmin etmek için öncelikle yararlıdır. Performansı doğruluk ile takas eder ve yürütmeler arasında değişen bir sonuç döndürebilir. Girişlerin sırası, çıkışı üzerinde etkili et dır için ki?!?!???????????!

Sözdizimi

dcount (expr[, Doğruluk])

Bağımsız değişkenler

İfade Tip Zorunlu Açıklama
İfade string Ayrı değerleri sayılacak bir sayıl ifade.
Doğruluk tamsayı İstenen tahmin doğruluğunu tanımlayan isteğe bağlı bir int hazır bilgisi.
Desteklenen değerler için aşağıya bakın. Belirtilmezse, 1 varsayılan değeri kullanılır.

Doğruluk, belirtildiyse, hız ve doğruluk arasındaki dengeyi denetler.

Değer Açıklama
ERROR! SEGMENT DATA CORRUPTED, SEGDATA=0 En az doğru ve en hızlı hesaplama. 1.6% hatası
1 Doğruluk ve hesaplama süresini dengeleyen varsayılan değer; yaklaşık 0.8% hata.
2 Doğru ve yavaş hesaplama; yaklaşık 0.4% hata.
3 Ek doğru ve yavaş hesaplama; yaklaşık 0.28% hata.
4 Çok doğru ve en yavaş hesaplama; 0.2% hakkında hata.

Örnek

Ayrı namesayısının tahminini döndürür.

events
    | project name, original_time
    | where original_time > ago(5m)
    | summarize NameCount=dcount(name)

Sonuçlar

NameCount
2032

Örnek

V ile erleri hesabını unun AYevet en iyi şekilde Golarak gruplandırılır.

T | summarize by V, G | summarize count() by G

V ayrı değerleri Gayrı değerlerinin sayısıyla çarpılabileceği için bu hesaplama büyük miktarda iç bellek gerektirir. Bu, bellek hatalarına ya da büyük yürütme sürelerini neden olabilir. dcount()hızlı ve güvenilir bir alternatif sağlar:

T | summarize dcount(V) by G | count

Tahmin doğruluğu

dcount() toplama işlevi, küme niceliğinin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluğu ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0.8 214
2 0.4 216
3 0.28 217
4 0.2 218

"Giriş sayısı" sütunu, HLL somutlamasındaki 1 baytlık sayaçların sayısıdır.

Algoritma, küme satır sayısı yeterince küçükse, mükemmel bir sayı (sıfır hatası) yapmaya ilişkin bazı hükümler içerir:

  • Doğruluk düzeyi 1olduğunda 1000 değer döndürülür.
  • Doğruluk düzeyi 2olduğunda 8000 değer döndürülür.

Hata sınırı teorik bir bağ değil, olasılıksal bir sınırdır. Değer, hata dağılımının (sigma) standart sapmasıdır ve tahminlerin 99.7% ' i 3 x sigma 'nın altında göreli bir hataya sahip olacaktır.