rastgeleağaç özellikleri

Rasgele Ağaçlar düğümü simgesiRasgele Ağaçlar düğümü, C & RT Ağaç düğümüne benzer; ancak, Rasgele Ağaç düğümü, tek bir ağaç oluşturmak için büyük verileri işlemek üzere tasarlanmıştır. Rasgele Ağaç Ağacı düğümü, gelecekteki gözlemleri tahmin etmek ya da sınıflandırmak için kullandığınız bir karar ağacı oluşturur. Bu yöntem, her adımda imsaflığı en aza indirerek eğitim kayıtlarını bölümlere ayırmak için özyineli bölümleme kullanır; bu, düğümdeki vakaların %100 'ü hedef alanın belirli bir kategorisine denk düşerse, ağaçtaki bir düğümün saf olarak kabul edilmesi gerekir. Hedef ve giriş alanları sayısal aralıklar ya da kategorik (nominal, sıra ya da işaret) olabilir; tüm bölmeleri ikili olur (yalnızca iki alt grup).

Tablo 1. rasgele ağaç özellikleri özellikleri
randomtrees Özellikler Değerler Özellik açıklaması
target alan Random Trees düğümünde, modeller tek bir hedef ve bir ya da daha fazla giriş alanı gerektirir. Bir sıklık alanı da belirtilebilir. Ek bilgi için Ortak modelleme düğümü özellikleri başlıklı konuya bakın.
number_of_models tamsayı Oluşturulabilir modellemenin bir parçası olarak oluşturulacak modellerin sayısını belirler.
use_number_of_predictors işaret number_of_predictors ' un kullanılıp kullanılmayacağını belirler.
number_of_predictors tamsayı Bölünmüş modelleri oluştururken kullanılacak tahmin edilicilerin sayısını belirtir.
use_stop_rule_for_accuracy işaret Doğruluğu iyileştirilemediğinde model oluşturma işlemi durdurulup durdurulmayacağını belirler.
sample_size rakam Çok büyük veri kümelerini işlerken performansı artırmak için bu değeri azaltın.
handle_imbalanced_data işaret Modelin hedefi belirli bir işaret sonucunun hedefi ise ve istenilen sonucun istenmeyen bir sonuca oranı çok küçükse, veriler dengesizdir ve modelin yaptığı önyükleme örnekleme modelin doğruluğu etkileyebilir. Modelin istenen sonucun daha büyük bir oranını yakalayacak ve daha güçlü bir model oluşturabilmesi için dengesiz verilerin işlenmesini etkinleştirin.
use_weighted_sampling işaret Falseolduğunda, her bir düğüme ilişkin değişkenler aynı olasılık ile rasgele seçilir. True(Doğru) olduğunda değişkenler ağırlıklı olur ve buna göre seçilir.
max_node_number tamsayı Her ağaçta izin verilen düğüm sayısı üst sınırı. Bir sonraki bölmede sayı aşılacaksa, ağaç büyüme halleri.
max_depth tamsayı Büyüme hallerinden önce ağaç derinliği üst sınırı.
min_child_node_size tamsayı Bir alt düğümde, üst düğüm bölündükten sonra izin verilen kayıt sayısı alt sınırını belirler. Bir alt düğüm, burada belirtilenden daha az sayıda kayıt içerecekse, üst düğüm bölünmez.
use_costs işaret  
costs yapılandırılmış Yapılandırılmış özellik. Biçim, 3 değerin bir listesidir: gerçek değer, öngörülen değer ve bu öngörü yanlışsa maliyeti. Örneğin: tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY", 4.0]])
default_cost_increase none linear square custom Bunun yalnızca sıra hedefleri için etkinleştirildiğini unutmayın. Maliyetler matrisinde varsayılan değerleri ayarlayın.
max_pct_missing tamsayı Herhangi bir girişteki eksik değerlerin yüzdesi, burada belirtilen değerden büyükse, giriş dışlanır. En az 0, en fazla 100.
exclude_single_cat_pct tamsayı Bir kategori değeri, kayıtların daha yüksek bir yüzdesini burada belirtilenden daha yüksek temsil ediyorsa, tüm alan model binasından çıkarılır. En az 1, en fazla 99.
max_category_number tamsayı Bir alandaki kategori sayısı bu değeri aşarsa, alan model binasından çıkarılır. En az 2.
min_field_variation rakam Sürekli bir alanın çeşitlemesi katsayısı bu değerden küçükse, alan model binasından çıkarılır.
num_bins tamsayı Yalnızca, veriler sürekli girişlerden oluşan bir veri varsa kullanılır. Girişler için kullanılacak eşit sıklık bölmeleri sayısını ayarlayın; seçenekler şunlardır: 2, 4, 5, 10, 20, 25, 50 ya da 100.
topN tamsayı Raporlanacak kural sayısını belirtir. Varsayılan değer 50, en az 1 ve en çok 1000 'dir.