Pădure aleatoare

în învățarea automată, pădurile aleatorii ale kernelului stabilesc legătura dintre pădurile aleatorii și metodele kernelului. Modificând ușor definiția lor, pădurile aleatorii pot fi rescrise ca metode de kernel, care sunt mai interpretabile și mai ușor de analizat.

HistoryEdit

Leo Breiman a fost prima persoană care a observat legătura dintre pădure aleatoare și metode de kernel. El a subliniat că pădurilor aleatoare care sunt cultivate folosind eu.eu.d. aleatoare vectori în copac construcții sunt echivalente cu un kernel care acționează asupra adevărat marja., Lin și Jeon au stabilit legătura dintre pădurile aleatorii și cel mai apropiat vecin adaptiv, ceea ce implică faptul că pădurile aleatorii pot fi văzute ca estimări adaptive ale nucleului. Davies și Ghahramani au propus kernel-ul forestier aleatoriu și arată că poate depăși empiric metodele kernelului de ultimă generație. Scornet a definit mai întâi estimările KeRF și a dat legătura explicită între estimările KeRF și pădure aleatoare. El a dat, de asemenea, expresii explicite pentru kernel-uri bazate pe pădure aleatoare centrată și pădure aleatoare uniformă, două modele simplificate de pădure aleatoare., El a numit aceste două KeRFs KeRF centrat și KeRF uniformă, și s-au dovedit limitele superioare privind ratele lor de coerență.

Notații și definitionsEdit

Preliminarii: Centrat forestsEdit

Centrat pădure este un model simplificat pentru Breiman original pădure aleatoare, uniform care selectează un atribut printre toate atributele și efectuează desparte, la centrul mobil de-a lungul pre-ales atribut. Algoritmul se oprește atunci când un arbore binar complet de nivel k {\displaystyle k} este construit, unde k ∈ N {\displaystyle k\in \mathbb {N} } este un parametru al algoritmului.,Uniform forest este un alt model simplificat pentru Pădurea aleatoare originală a lui Breiman, care selectează uniform o caracteristică dintre toate caracteristicile și efectuează împărțiri într-un punct desenat uniform pe partea laterală a celulei, de-a lungul caracteristicii preselectate.,

din pădure aleatoare la KeRFEdit

m ~ M , n (x, Θ 1,… , Θ M ) = 1 apă j = 1 M N N ( x , Θ j ) apă j = 1 M de apă i = 1 n Y i 1 X i ∈ n ( x , Θ j ) , {\displaystyle {\tilde {m}}_{M,n}(\mathbf {x} ,\Theta _{1},\ldots ,\Theta _{M})={\frac {1}{\sum _{j=1}^{M}N_{n}(\mathbf {x} ,\Theta _{j})}}\sum _{j=1}^{M}\sum _{i=1}^{n}Y_{i}\mathbf {1} _{\mathbf {X} _{i}\în A_{n}(\mathbf {x} ,\Theta _{j})},}

Centrat KeRFEdit

K k c c ( x , z ) = apă k 1 , … , K d , apă j = 1 d k j = k k ! k 1 ! ⋯ k d ! ( 1 d ) k ∏ j = 1 d 1 ⌈ 2 k j x j ⌉ = ⌈ 2, k, j, z j ⌉ , pentru orice x , z ∈ d ., {\displaystyle {\begin{aligned}K_{k}^{cc}(\mathbf {x} ,\mathbf {z} )=\sum _{k_{1},\ldots ,k_{d},\sum _{j=1}^{d}k_{j}=k}&{\frac {k!}{k_{1}!\cdots k_{d}!}}\left({\frac {1}{d}}\right)^{k}\prod _{j=1}^{d}\mathbf {1} _{\lceil 2^{k_{j}}x_{j}\rceil =\lceil 2^{k_{j}}z_{j}\rceil },\\&{\text{ for all }}\mathbf {x} ,\mathbf {z} \in ^{d}.\end{aligned}}}

Uniform KeRFEdit

K k u f ( 0 , x ) = ∑ k 1 , … , k d , ∑ j = 1 d k j = k k ! k 1 ! … k d ! ( 1 d ) k ∏ m = 1 d ( 1 − | x m | ∑ j = 0 k m − 1 ( − ln ⁡ | x m | ) j j ! ) for all x ∈ d ., {\displaystyle K_{k}^{uf}(\mathbf {0} ,\mathbf {x} )=\sum _{k_{1},\ldots ,k_{d},\sum _{j=1}^{d}k_{j}=k}{\frac {k!{k_{1}!\ ldots k_{d}!}}\left({\frac {1}{d}}\right)^{k}\prod _{m=1}^{d}\left(1-|x_{m}|\sum _{j=0}^{k_{m}-1}{\frac {(-\ln |x_{m}|)^{j}}{j!}}\right){\text{ pentru }}\mathbf {x} \in ^{d}.,}

PropertiesEdit

Relația dintre Fantă și aleatoare forestEdit

Previziuni dat de Tăietură și pădurilor aleatoare sunt aproape, dacă numărul de puncte în fiecare celulă este controlat:

Relația dintre infinit Tăietură și infinit aleatoare forestEdit

atunci Când numărul de copaci M {\displaystyle M} se duce la infinit, atunci avem infinit aleatoare pădure și infinit de Tăietură. Estimările lor sunt aproape, dacă numărul de observații din fiecare celula este delimitată:

Consistență resultsEdit

Consistența centrat KeRFEdit

Consistență uniformă KeRFEdit

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *