Processo de Pitman–Yor
Em teoria das probabilidades, um processo de Pitman–Yor, denotado , é um processo estocástico cujo caminho amostral é uma distribuição de probabilidade. Uma amostra aleatória a partir deste processo é uma distribuição de probabilidade discreta infinita, que consiste em um conjunto infinito de átomos retirados de , com pesos retirados de uma distribuição de Poisson–Dirichlet de dois parâmetros. O processo recebe este nome em homenagem aos matemáticos Jim Pitman e Marc Yor.[1][2]
Os parâmetros que governam o processo de Pitman–Yor são: um parâmetro de desconto , um parâmetro de força e uma distribuição de base sobre o espaço de probabilidade . Quando , torna-se o processo de Dirichlet. O parâmetro de desconto dá ao processo de Pitman–Yor mais flexibilidade sobre o comportamento de cauda quando comparado ao processo de Dirichlet, que tem caudas exponenciais. Isto torna o processo de Pitman–Yor útil para a modelagem de dados com caudas de lei de potência (por exemplo, frequências de palavras em linguagem natural).[3]
A partição aleatória intercambiável induzida pelo processo de Pitman–Yor é um exemplo de uma partição de Poisson–Kingman e de uma partição aleatória de Gibbs.[4]
Convenções nominais
O nome "processo de Pitman–Yor" foi cunhado por Hemant Ishwaran e Lancelot James depois da revisão de Pitman e Yor sobre o assunto.[5][2] Entretanto, o processo foi originalmente estudado por Mihael Perman et al.[6][7]
Também é algumas vezes referido como o processo de Poisson–Dirichlet de dois parâmetros, depois da generalização de dois parâmetros da distribuição de Poisson–Dirichlet que descreve a distribuição conjunta dos tamanhos dos átomos na medida aleatória, separados por ordem estritamente decrescente.