Floresta aleatória

na aprendizagem de máquinas, florestas aleatórias do núcleo estabelecem a ligação entre florestas aleatórias e métodos do núcleo. Modificando ligeiramente sua definição, florestas aleatórias podem ser reescritas como métodos de núcleo, que são mais interpretáveis e mais fáceis de analisar.Leo Breiman foi a primeira pessoa a notar a ligação entre os métodos da floresta aleatória e do núcleo. He pointed out that random forests which are grown using I. I. d. random vectors in the tree construction are equivalent to a kernel acting on the true margin., Lin e Jeon estabeleceram a conexão entre florestas aleatórias e vizinhos mais próximos adaptativos, implicando que florestas aleatórias podem ser vistas como estimativas do núcleo adaptativo. Davies e Ghahramani propuseram um núcleo de floresta aleatória e mostram que ele pode empiricamente superar os métodos de kernel de Estado-de-arte. Scornet primeiro definiu estimativas de KeRF e deu a ligação explícita entre estimativas de KeRF e floresta aleatória. He also gave explicit expressions for kernels based on centered random forest and uniform random forest, two simplified models of random forest., Ele nomeou estes dois “KeRFs” centrados em KeRF e Kerfs uniformes, e provou limites superiores em suas taxas de consistência.

Notações e definitionsEdit

Preliminares: Centrada forestsEdit

Centrada floresta é um modelo simplificado para Breiman original aleatório floresta, que uniformemente seleciona um atributo entre todos os atributos e executa divisões no centro da célula ao longo da pré-escolhido atributo. O algoritmo pára quando uma árvore totalmente binária do nível k {\displaystyle k} é construída, onde o k ∈ N {\displaystyle k\in \mathbb {N} } é um parâmetro do algoritmo.,

Uniforme forestEdit

Uniforme floresta é outro modelo simplificado para Breiman original aleatório floresta, que uniformemente seleciona um recurso entre todos os recursos e executa divide em um ponto uniforme desenhado no lado da célula, ao longo do pré recurso.,

from random forest to KeRFEdit

M ~ M, n (x , Θ 1 , … , Θ M ) = 1 água j = 1 M N N ( x , Θ j ) de água j = 1 M água i = 1 n Y i 1 X i ∈ n ( x , Θ j ) , {\displaystyle {\til {m}}_{M,n}(\mathbf {x} ,\Theta _{1},\ldots ,\Theta _{M})={\frac {1}{\sum _{j=1}^{M}N_{n}(\mathbf {x} ,\Theta _{j})}}\sum _{j=1}^{M}\sum _{i=1}^{n}Y_{i}\mathbf {1} _{\mathbf {X} _{i}\in A_{n}(\mathbf {x} ,\Theta _{j})},}

Centrada KeRFEdit

K k c c ( x , z ) = água k 1 , … , k d, água j = 1 d k j = k k! k 1 ! K d ! ( 1 d ) k ∏ j = 1 d 1 ⌈ 2 k j x j ⌉ = ⌈ 2 k j z j ⌉ , para todo x , z ∈ d ., {\displaystyle {\begin{aligned}K_{k}^{cc}(\mathbf {x} ,\mathbf {z} )=\sum _{k_{1},\ldots ,k_{d},\sum _{j=1}^{d}k_{j}=k}&{\frac {k!}{k_{1}!\cdots k_{d}!}}\left({\frac {1}{d}}\right)^{k}\prod _{j=1}^{d}\mathbf {1} _{\lceil 2^{k_{j}}x_{j}\rceil =\lceil 2^{k_{j}}z_{j}\rceil },\\&{\text{ for all }}\mathbf {x} ,\mathbf {z} \in ^{d}.\end{aligned}}}

Uniform KeRFEdit

K k u f ( 0 , x ) = ∑ k 1 , … , k d , ∑ j = 1 d k j = k k ! k 1 ! … k d ! ( 1 d ) k ∏ m = 1 d ( 1 − | x m | ∑ j = 0 k m − 1 ( − ln ⁡ | x m | ) j j ! ) for all x ∈ d ., {\displaystyle K_{k}^{f}(\mathbf {0} ,\mathbf {x} )=\sum _{k_{1},\ldots ,k_{d},\sum _{j=1}^{d}k_{j}=k}{\frac {k!{k_{1}!\ldots k_{d}!}}\left({\frac {1}{d}}\right)^{k}\prod _{i=1}^{d}\left(1-|x_{m}|\sum _{j=0}^{k_{m}-1}{\frac {(-\ln |x_{m}|)^{j}}{j!}}\right){\text{ for all }} \mathbf {x} \in ^{d}.,}

PropertiesEdit

Relação entre a Sangria e aleatório forestEdit

as Previsões dadas por Sangria e aleatório florestas estão perto de se o número de pontos em cada célula é controlada:

Relação entre o infinito Sangria e infinita aleatória forestEdit

Quando o número de árvores M {\displaystyle M} vai para o infinito, então nós temos uma infinita aleatória floresta e infinita a Sangria. As suas estimativas são próximas se o número de observações em cada célula for limitado:

resultado de consistência

consistência do KeRFEdit centrado

consistência do KeRFEdit uniforme

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *