Complexidade de Rademacher

Fonte: testwiki
Saltar para a navegação Saltar para a pesquisa

Na teoria da aprendizagem computacional (aprendizado de máquina e teoria da computação), Complexidade de Rademacher, em homenagem a Hans Rademacher, mede a riqueza de uma classe com funções de valores reais, com respeito a uma distribuição de probabilidade.

Dada uma amostra de treinamento S=(z1,z2,,zm)Zm, e uma classe de valores reais das funções definidas em um espaço de domínio Z, a complexidade empírica de Rademacher  de é definida como:

^S()=2m𝔼[suph|i=1mσih(zi)| | S]

onde σ1,σ2,,σm são variáveis aleatórias independentes extraídas a partir da distribuição de Rademacher i.e. Pr(σi=+1)=Pr(σi=1)=1/2 para i=1,2,,m.

Seja P uma distribuição de probabilidade sobre Z. A complexidade de Rademacher da classe de funções  com respeito a P para o tamanho da amostra m é:

m()=𝔼[^S()]

onde a expectância acima é tomada de mais de uma amostra idêntica e independentemente distribuída (i.i.d.) S=(z1,z2,,zm) gerada de acordo com P.

Pode-se mostrar, por exemplo, que existe uma constante C, tal que qualquer classe de funções {0,1}-indicadoras com a dimensão de Vapnik-Chervonenkis d tem a complexidade de Radamacher superiormente delimitada por Cdm.

Complexidade Gaussiana

Complexidade Gaussiana é uma complexidade semelhante com significados físicos parecidos, e pode ser obtido a partir da complexidade anterior utilizando as variáveis aleatórias gi em vez de σi, onde gi são variáveis aleatórias Gaussianas i.i.d. com média zero e variância 1, i.e. gi𝒩(0,1).

Referências

  • Peter L. Bartlett, Shahar Mendelson (2002) Rademacher and Gaussian Complexities: Risk Bounds and Structural Results. Journal of Machine Learning Research 3 463-482
  • Giorgio Gnecco, Marcello Sanguineti (2008) Approximation Error Bounds via Rademacher's Complexity. Applied Mathematical Sciences, Vol. 2, 2008, no. 4, 153 - 176