Dizüstü bilgisayarlardaSPSS tahmine dayalı analitik kümeleme algoritmaları

Dizüstü bilgisayarlardaki verileri kümelemek için ölçeklenebilir İki Adımlı ya da Küme modeli değerlendirme algoritmasını kullanabilirsiniz.

İki Adımlı Küme

Scalable Two-Step, bilinen iki adımlı kümeleme algoritmasına dayanır, ancak hem işlevselliğini, hem de performansını birkaç yönde genişletir.

İlk olarak, Map-Reduce computing paradigmasını sağlayan Spark tarafından desteklenen büyük ve dağınık verilerle etkili bir şekilde çalışabiliyor.

İkinci olarak algoritma, verilen verilerin kümelenmesine ilişkin en uygun özellikleri seçmeye yönelik mekanizmalar sağlar ve nadir bulunan aykırı noktaları algılayanı sağlar. Ayrıca, öngörülerin etkinleştirilmesi için geliştirilmiş bir değerlendirme kümesi ve tanılama özellikleri sağlar.

İki adımlı kümeleme algoritması, önce veri kümesinin tamamını tarayarak ve küme özellikleri adı verilen özet istatistikleri açısından veri vakalarının yoğun bölgelerini depolayarak önceden kümeleme öncesi bir adım gerçekleştirir. Küme özellikleri, CF-tree adı verilen bir veri yapısındaki bellede saklanır. Son olarak küme özellikleri kümesini kümelemek için kümesel bir sıradüzensel kümeleme algoritması uygulanmaktadır.

Python örnek kodu:

from spss.ml.clustering.twostep import TwoStep

cluster = TwoStep(). \
    setInputFieldList(["region", "happy", "age"]). \
    setDistMeasure("LOGLIKELIHOOD"). \
    setFeatureImportanceMethod("CRITERION"). \
    setAutoClustering(True)

clusterModel = cluster.fit(data)
predictions = clusterModel.transform(data)
predictions.show()

Küme modeli değerlendirmesi

Küme modeli değerlendirmesi (CME), küme modellerini yorumlamayı ve çeşitli değerlendirme ölçümlerine dayalı olarak yararlı öngörüler keşfetmeyi hedeflemektedir.

Bu, herhangi bir küme modelinden genel ve bağımsız olan bir modelleme sonrası analizi.

Python örnek kodu:

from spss.ml.clustering.twostep import TwoStep

cluster = TwoStep(). \
    setInputFieldList(["region", "happy", "age"]). \
    setDistMeasure("LOGLIKELIHOOD"). \
    setFeatureImportanceMethod("CRITERION"). \
    setAutoClustering(True)

clusterModel = cluster.fit(data)
predictions = clusterModel.transform(data)
predictions.show()

Üst konu: SPSS tahmine dayalı analitik algoritmaları