Wikipedia: A análise quantitativa Felipe Ortega (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.) GSyC / 

LibreSoft, Universidad Rey Juan Carlos, de Madrid (Espanha) 29 de julho de 

2009 resumo Nesta tese de doutorado, que proceder a uma análise quantitativa 

das edições de idioma top-ten da Wikipedia, a partir de diferentes 

perspectivas. Nosso principal objetivo foi o de traçar a evolução no tempo de 

parâmetros descritivos e organizacionais fundamentais da Wikipedia e sua 

comunidade de autores. o A análise centrou-se em autores registrados (aqueles 

editores que criaram uma conta pessoal para participar no projeto). Entre as 

métricas distintas incluídos, podemos encontrar a evolução mensal da geral 

métricas (número de revisões, editores ativos, páginas ativas); a distribuição 

de páginas e o seu comprimento, a evolução da participação em páginas de 

discussão. 

Apresentamos também uma análise detalhada do estrutura social 

interna e estratificação da comunidade Wikipedia de autores registrados, 

cabendo distribuições apropriados para as métricas mais relevantes. Nós também 

examinar o nível de desigualdade contribuições de autores registrados, 

mostrando que existe um núcleo de autores muito ativos que comprometem-se a 

maior parte do trabalho editorial. No que diz respeito artigos, a análise 

mostra também que a desigualdade existe um reduzido grupo de artigos populares,

embora a distribuição de revisões não é tão enviesada como no caso anterior. 

 

A análise continua com um estudo demográfico em profundidade da comunidade de 

autores, enfocando a evolução do núcleo de contribuidores muito ativos 

(aplicando uma técnica estatística conhecida como análise de sobrevivência). 

Também exploramos algumas métricas básicas para analisar a qualidade dos 

artigos da Wikipedia e do nível de confiabilidade autores individuais. Este 

trabalho termina com uma extensa análise da evolução dos parâmetros mais 

influentes e métricas anteriormente apresentada. Com base nesses indicadores, 

inferimos conclusões importantes sobre a sustentabilidade futura Wikipedia. De 

acordo com estes resultados, a comunidade de Wikipedia autores cessou de 

crescer, mantendo-se estável desde o verão de 2006 até o final de 2007. Como 

resultado, o número mensal de revisões manteve-se estável em relação ao mesmo 

período, restringindo o número de artigos que podem ser revisado pela 

comunidade. Por outro lado, enquanto o número de revisões em páginas de 

discussão tem estabilizou durante o mesmo período, assim, o número de páginas 

de discussão ativos segue um crescimento constante taxa, para todas as 

versões. Isto sugere que a comunidade de autores está mudando seu foco para 

ampliar a cobertura das páginas de discussão, o que tem um impacto directo na 

qualidade final do conteúdo, trabalhos de pesquisa anteriores mostrou. Em 

relação à estrutura social interna da comunidade de Wikipedia autores 

registados, encontramos Distribuições Pareto-like que se encaixam todas as 

métricas relevantes relativos autores (número de revisões por autor, número de 

diferentes artigos editados por autor), enquanto medições em artigos (número 

de revisões por artigo, número de diferentes autores por artigo) seguem formas 

lognormais. o análise do nível de desigualdade de revisões efectuadas pelos 

autores e as revisões recebidas por artigos mostra distribuições altamente 

desiguais. Os resultados de nossa análise de sobrevivência onWikipedia autores 

apresenta percentagens muito elevadas de mortalidade em jovens autores, 

revelando um problema endêmico de Wikipedias para manter jovens editores em 

colaborar com o projeto por um longo período de tempo. Dentro Da mesma forma, 

a partir de nossa análise de sobrevivência obtemos que o tempo de vida médio 

de autores Wikipédia no núcleo (até que eles abandonam o grupo de topo 

editores) situa-se entre 200 e 400 dias, durante 1 todas as versões, enquanto 

que o valor médio é inferior a 120 dias em todos os casos. Além disso, a 

análise do número mensal de nascimentos e mortes na comunidade de autores 

registradas revela que o causa da mudança na tendência mensal de autores 

activas é produzido por um número mais elevado de mortes de Verão 2006 em 

todas as versões, superando o número mensal de nascimentos a partir de então. 

A análise do nível de desigualdade das contribuições ao longo do tempo, ea 

evolução do adicional principais características identificadas nesta tese, 

revela uma tendência preocupante para aumento progressivo da o esforço 

despendido por autores fundamentais, como o tempo passa. Esta tendência pode, 

eventualmente, causar que estes autores atingirá seu limite superior no número 

de revisões que podem executar cada mês, assim começando uma tendência 

decrescente no número de revisões mensais, e uma recessão global do criação de 

conteúdo e processo de revisão na Wikipédia. Para evitar este cenário provável 

futuro, o número de novos editores mensais deve ser melhorada novamente, 

talvez através da adopção de políticas específicas e campanhas para atrair 

novos editores para a Wikipedia, e topcontributors recuperar mais velhos mais 

uma vez. Finalmente, uma outra contribuição importante para a comunidade de 

pesquisa é WikiXRay, o software ferramenta que temos desenvolvido para 

executar as análises estatísticas incluídas nesta tese. Esta ferramenta 

automatiza completamente o processo de recuperar os dumps de bancos de dados 

por parte do público Wikimedia repositórios, processá-los para obter as 

principais métricas e parâmetros descritivos, e carregá-los em um base de 

dados local, prontos para serem usados ​​nas análises empíricas. Tanto quanto 

sabemos, este é o primeiro trabalho de investigação implementação de uma 

análise comparativa, a partir de um ponto de vista quantitativo, das edições 

top-ten linguísticas da Wikipedia, apresentando resultados de muitas 

perspectivas científicas diferentes. Portanto, esperamos que esta contribuição 

vai ajudar a comunidade científica para melhorar a sua compreensão do 

funcionamento rico, complexo e fascinante mecanismos e padrões de 

comportamento do projeto Wikipedia e sua comunidade de autores. Da mesma forma,

 esperamos que WikiXRay facilitará a difícil tarefa de desenvolver análises 

empíricas em qualquer versão de idioma da enciclopédia, aumentando desta forma 

o número de comparativa Estudos como este em muitas outras disciplinas 

científicas.