rastgeleağaç özellikleri
Rasgele Ağaçlar düğümü, C & RT Ağaç düğümüne benzer; ancak, Rasgele Ağaç düğümü, tek bir ağaç oluşturmak için büyük verileri işlemek üzere tasarlanmıştır. Rasgele Ağaç Ağacı düğümü, gelecekteki gözlemleri tahmin etmek ya da sınıflandırmak için kullandığınız bir karar ağacı oluşturur. Bu yöntem, her adımda imsaflığı en aza indirerek eğitim kayıtlarını bölümlere ayırmak için özyineli bölümleme kullanır; bu, düğümdeki vakaların %100 'ü hedef alanın belirli bir kategorisine denk düşerse, ağaçtaki bir düğümün saf olarak kabul edilmesi gerekir. Hedef ve giriş alanları sayısal aralıklar ya da kategorik (nominal, sıra ya da işaret) olabilir; tüm bölmeleri ikili olur (yalnızca iki alt grup).
randomtrees Özellikler |
Değerler | Özellik açıklaması |
|---|---|---|
target |
alan | Random Trees düğümünde, modeller tek bir hedef ve bir ya da daha fazla giriş alanı gerektirir. Bir sıklık alanı da belirtilebilir. Ek bilgi için Ortak modelleme düğümü özellikleri başlıklı konuya bakın. |
number_of_models |
tamsayı | Oluşturulabilir modellemenin bir parçası olarak oluşturulacak modellerin sayısını belirler. |
use_number_of_predictors |
işaret | number_of_predictors ' un kullanılıp kullanılmayacağını belirler. |
number_of_predictors |
tamsayı | Bölünmüş modelleri oluştururken kullanılacak tahmin edilicilerin sayısını belirtir. |
use_stop_rule_for_accuracy |
işaret | Doğruluğu iyileştirilemediğinde model oluşturma işlemi durdurulup durdurulmayacağını belirler. |
sample_size |
rakam | Çok büyük veri kümelerini işlerken performansı artırmak için bu değeri azaltın. |
handle_imbalanced_data |
işaret | Modelin hedefi belirli bir işaret sonucunun hedefi ise ve istenilen sonucun istenmeyen bir sonuca oranı çok küçükse, veriler dengesizdir ve modelin yaptığı önyükleme örnekleme modelin doğruluğu etkileyebilir. Modelin istenen sonucun daha büyük bir oranını yakalayacak ve daha güçlü bir model oluşturabilmesi için dengesiz verilerin işlenmesini etkinleştirin. |
use_weighted_sampling |
işaret | Falseolduğunda, her bir düğüme ilişkin değişkenler aynı olasılık ile rasgele seçilir. True(Doğru) olduğunda değişkenler ağırlıklı olur ve buna göre seçilir. |
max_node_number |
tamsayı | Her ağaçta izin verilen düğüm sayısı üst sınırı. Bir sonraki bölmede sayı aşılacaksa, ağaç büyüme halleri. |
max_depth |
tamsayı | Büyüme hallerinden önce ağaç derinliği üst sınırı. |
min_child_node_size |
tamsayı | Bir alt düğümde, üst düğüm bölündükten sonra izin verilen kayıt sayısı alt sınırını belirler. Bir alt düğüm, burada belirtilenden daha az sayıda kayıt içerecekse, üst düğüm bölünmez. |
use_costs |
işaret | |
costs |
yapılandırılmış | Yapılandırılmış özellik. Biçim, 3 değerin bir listesidir: gerçek değer, öngörülen değer ve bu öngörü yanlışsa maliyeti. Örneğin:
tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY", 4.0]]) |
default_cost_increase |
none linear square custom |
Bunun yalnızca sıra hedefleri için etkinleştirildiğini unutmayın. Maliyetler matrisinde varsayılan değerleri ayarlayın. |
max_pct_missing |
tamsayı | Herhangi bir girişteki eksik değerlerin yüzdesi, burada belirtilen değerden büyükse, giriş dışlanır. En az 0, en fazla 100. |
exclude_single_cat_pct |
tamsayı | Bir kategori değeri, kayıtların daha yüksek bir yüzdesini burada belirtilenden daha yüksek temsil ediyorsa, tüm alan model binasından çıkarılır. En az 1, en fazla 99. |
max_category_number |
tamsayı | Bir alandaki kategori sayısı bu değeri aşarsa, alan model binasından çıkarılır. En az 2. |
min_field_variation |
rakam | Sürekli bir alanın çeşitlemesi katsayısı bu değerden küçükse, alan model binasından çıkarılır. |
num_bins |
tamsayı | Yalnızca, veriler sürekli girişlerden oluşan bir veri varsa kullanılır. Girişler için kullanılacak eşit sıklık bölmeleri sayısını ayarlayın; seçenekler şunlardır: 2, 4, 5, 10, 20, 25, 50 ya da 100. |
topN |
tamsayı | Raporlanacak kural sayısını belirtir. Varsayılan değer 50, en az 1 ve en çok 1000 'dir. |