banner
Centro de notícias
Uma colaboração produtiva criará um resultado desejável.

4 Tipos de Técnicas de Amostragem Aleatória Explicadas

Aug 23, 2023

"Por que devo me preocupar com amostragem aleatória?"

Eis o porquê: se você é um cientista de dados e deseja desenvolver modelos, precisa de dados. E se você precisar de dados, alguém precisa coletar esses dados. E se alguém estiver coletando dados, eles precisam ter certeza de que não são tendenciosos ou serão extremamente caros.a longo prazo.

Portanto, se você deseja coletar informações imparciaisdados, então você precisa saber sobre amostragem aleatória.

Mais de Terence Shin10 conceitos avançados de SQL que você deve saber para entrevistas de ciência de dados

A amostragem aleatória simplesmente descreve um estado em que cada elemento de uma população tem uma chance igual de ser escolhido para a amostra. Parece simples, certo? Bem, é muito mais fácil dizer do que fazer porque você deve considerar muita logística para minimizar o viés. Esses quatro tipos de técnicas de amostragem aleatória permitirão que você faça exatamente isso.

A amostragem aleatória simples requer o uso de números gerados aleatoriamente para escolher uma amostra. Mais especificamente, requer inicialmente um quadro de amostragem, que é uma lista ou banco de dados de todos os membros de uma população. Você pode gerar aleatoriamente um número para cada elemento, usando o Excel, por exemplo, e obter o primeiro n número de amostras necessárias.

Para dar um exemplo, imagine que a tabela à direita é o seu quadro de amostragem. Usando um software como o Excel, você pode gerar números aleatórios para cada elemento no quadro de amostragem. Se você precisa de um tamanho de amostra de três, você deve pegar as amostras com os números aleatórios de um a três.

A amostragem aleatória estratificada envolve a divisão de uma população em grupos com atributos semelhantes e a amostragem aleatória de cada grupo.

Este método garante que diferentes segmentos de uma população sejam igualmente representados. Para dar um exemplo, imagine que uma pesquisa seja realizada em uma escola para determinar a satisfação geral. Aqui, a amostragem aleatória estratificada pode representar igualmente as opiniões dos alunos em cada departamento.

A amostragem por conglomerados começa dividindo uma população em grupos ou conglomerados. O que torna isso diferente da amostragem estratificada é que cada conglomerado deve ser representativo da população maior. Em seguida, você seleciona aleatoriamente clusters inteiros para amostrar.

Por exemplo, se uma escola tiver cinco turmas diferentes da oitava série, a amostragem aleatória por conglomerados significa que qualquer turma serviria como amostra.

Amostragem aleatória sistemática é uma técnica comum na qual você amostra cada k-ésimo elemento. Por exemplo, se você estiver realizando pesquisas em um shopping, poderá pesquisar cada centésima pessoa que entrar.

Se você tiver um quadro de amostragem, divida o tamanho do quadro, N, pelo tamanho de amostra desejado, n, para obter o número do índice, k. Você então escolheria cada k-ésimo elemento no quadro para criar sua amostra.

Usando os mesmos gráficos do primeiro exemplo, se quiséssemos um tamanho de amostra de dois desta vez, pegaríamos cada terceira linha no quadro de amostragem.

Mais em ciência de dadosComo criar um mecanismo de pesquisa com Python e Laravel

Agora você deve ter uma compreensão do que é amostragem aleatória e várias técnicas comuns para conduzi-la. Dominar esse conceito é extremamente importante para minimizar o viés e criar melhores modelos.