Problema do colecionador de cupons

Fonte: testwiki
Saltar para a navegação Saltar para a pesquisa
Gráfico do número de cupons, n versus o número esperado de tentativas (ou seja, tempo) necessárias para coletar todos eles, E (T)

Na teoria das probabilidades, o problema do coletor de cupons descreve os concursos "colete todos os cupons e ganhe". Ele faz a seguinte pergunta: "Se cada caixa de uma marca de cereais contém um cupom e existem n tipos diferentes de cupons, qual é a probabilidade de que mais de t caixas precisem ser compradas para coletar todos os n cupons?" Uma declaração alternativa é: Dados os n cupons, quantos cupons você espera que precise remover com substituição antes de remover cada um dos cupons pelo menos uma vez?" A análise matemática do problema revela que o número esperado de tentativas necessárias cresce na ordem de Θ(nlog(n)).Predefinição:Efn Por exemplo, quando n = 50 são necessários, em média, cerca de 225 testes.Predefinição:Efn para coletar todos os 50 cupons.

Solução

Calculando o valor esperado

Seja T o tempo para recolher todos n cupons, e deixe ti ser o tempo adicional para de recolher o i-ésimo cupom depois de i - 1 cupons terem sido coletados. Trate T e Ti como variáveis aleatórias . Observe que a probabilidade de coletar um cupom inédito é pi=ni+1n . Portanto, ti tem distribuição geométrica com valor esperado 1pi . Pela linearidade do valor esperado, temos:

E(T)=E(t1)+E(t2)++E(tn)=1p1+1p2++1pn=nn+nn1++n1=n(11+12++1n)=nHn.

Aqui Hn é o n-ésimo número harmônico. Usando a assintótica dos números harmônicos, obtemos:

E(T)=nHn=nlogn+γn+12+O(1/n),

Onde γ0.5772156649 é a constante de Euler-Mascheroni .

Agora, pode-se usar a desigualdade de Markov para limitar a probabilidade desejada:

P(TcnHn)1c.

Cálculo da variância

Usando a independência das variáveis aleatórias ti, obtemos:

Var(T)=Var(t1)+Var(t2)++Var(tn)=1p1p12+1p2p22++1pnpn2<(n2n2+n2(n1)2++n212)=n2(112+122++1n2)<π26n2

Como π26=112+122++1n2+ (veja o problema da Basiléia).

Agora, pode-se usar a desigualdade de Chebyshev para limitar a probabilidade desejada:

P(|TnHn|cn)π26c2.

Estimativas de cauda

Um limite superior diferente pode ser derivado da seguinte observação. Seja Zir um evento em que o i-ésimo cupom não foi escolhido nos primeiros r ensaios. Então:

P[Zir]=(11n)rer/n

Assim, para r=βnlogn, temos P[Zir]e(βnlogn)/n=nβ .

P[T>βnlogn]=P[iZiβnlogn]nP[Z1βnlogn]nβ+1

Extensões e generalizações

P(T<nlogn+cn)eec, as n.
  • Donald J. Newman e Lawrence Shepp fizeram uma generalização do problema do colecionador de cupons quando é necessário coletar m cópias de cada cupom. Seja T m ser a primeira vez m cópias de cada cupom são recolhidos. Eles mostraram que o valor esperado neste caso satisfaz:
E(Tm)=nlogn+(m1)nloglogn+O(n), as n.
Aqui m é fixo. Quando m = 1, obtemos a fórmula anterior para a expectativa.
  • Generalização comum, também devido a Erdős e Rényi:
P(Tm<nlogn+(m1)nloglogn+cn)eec/(m1)!, as n.
E(T)=0(1i=1n(1epit))dt.

Ver também

Notas

Predefinição:Notelist

Predefinição:Referências  Predefinição:Refbegin

Predefinição:Refend

Ligações externas