Wikipedia: A análise quantitativa Felipe Ortega (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.) GSyC /
LibreSoft, Universidad Rey Juan Carlos, de Madrid (Espanha) 29 de julho de
2009 resumo Nesta tese de doutorado, que proceder a uma análise quantitativa
das edições de idioma top-ten da Wikipedia, a partir de diferentes
perspectivas. Nosso principal objetivo foi o de traçar a evolução no tempo de
parâmetros descritivos e organizacionais fundamentais da Wikipedia e sua
comunidade de autores. o A análise centrou-se em autores registrados (aqueles
editores que criaram uma conta pessoal para participar no projeto). Entre as
métricas distintas incluídos, podemos encontrar a evolução mensal da geral
métricas (número de revisões, editores ativos, páginas ativas); a distribuição
de páginas e o seu comprimento, a evolução da participação em páginas de
discussão.
Apresentamos também uma análise detalhada do estrutura social
interna e estratificação da comunidade Wikipedia de autores registrados,
cabendo distribuições apropriados para as métricas mais relevantes. Nós também
examinar o nível de desigualdade contribuições de autores registrados,
mostrando que existe um núcleo de autores muito ativos que comprometem-se a
maior parte do trabalho editorial. No que diz respeito artigos, a análise
mostra também que a desigualdade existe um reduzido grupo de artigos populares,
embora a distribuição de revisões não é tão enviesada como no caso anterior.
A análise continua com um estudo demográfico em profundidade da comunidade de
autores, enfocando a evolução do núcleo de contribuidores muito ativos
(aplicando uma técnica estatística conhecida como análise de sobrevivência).
Também exploramos algumas métricas básicas para analisar a qualidade dos
artigos da Wikipedia e do nível de confiabilidade autores individuais. Este
trabalho termina com uma extensa análise da evolução dos parâmetros mais
influentes e métricas anteriormente apresentada. Com base nesses indicadores,
inferimos conclusões importantes sobre a sustentabilidade futura Wikipedia. De
acordo com estes resultados, a comunidade de Wikipedia autores cessou de
crescer, mantendo-se estável desde o verão de 2006 até o final de 2007. Como
resultado, o número mensal de revisões manteve-se estável em relação ao mesmo
período, restringindo o número de artigos que podem ser revisado pela
comunidade. Por outro lado, enquanto o número de revisões em páginas de
discussão tem estabilizou durante o mesmo período, assim, o número de páginas
de discussão ativos segue um crescimento constante taxa, para todas as
versões. Isto sugere que a comunidade de autores está mudando seu foco para
ampliar a cobertura das páginas de discussão, o que tem um impacto directo na
qualidade final do conteúdo, trabalhos de pesquisa anteriores mostrou. Em
relação à estrutura social interna da comunidade de Wikipedia autores
registados, encontramos Distribuições Pareto-like que se encaixam todas as
métricas relevantes relativos autores (número de revisões por autor, número de
diferentes artigos editados por autor), enquanto medições em artigos (número
de revisões por artigo, número de diferentes autores por artigo) seguem formas
lognormais. o análise do nível de desigualdade de revisões efectuadas pelos
autores e as revisões recebidas por artigos mostra distribuições altamente
desiguais. Os resultados de nossa análise de sobrevivência onWikipedia autores
apresenta percentagens muito elevadas de mortalidade em jovens autores,
revelando um problema endêmico de Wikipedias para manter jovens editores em
colaborar com o projeto por um longo período de tempo. Dentro Da mesma forma,
a partir de nossa análise de sobrevivência obtemos que o tempo de vida médio
de autores Wikipédia no núcleo (até que eles abandonam o grupo de topo
editores) situa-se entre 200 e 400 dias, durante 1 todas as versões, enquanto
que o valor médio é inferior a 120 dias em todos os casos. Além disso, a
análise do número mensal de nascimentos e mortes na comunidade de autores
registradas revela que o causa da mudança na tendência mensal de autores
activas é produzido por um número mais elevado de mortes de Verão 2006 em
todas as versões, superando o número mensal de nascimentos a partir de então.
A análise do nível de desigualdade das contribuições ao longo do tempo, ea
evolução do adicional principais características identificadas nesta tese,
revela uma tendência preocupante para aumento progressivo da o esforço
despendido por autores fundamentais, como o tempo passa. Esta tendência pode,
eventualmente, causar que estes autores atingirá seu limite superior no número
de revisões que podem executar cada mês, assim começando uma tendência
decrescente no número de revisões mensais, e uma recessão global do criação de
conteúdo e processo de revisão na Wikipédia. Para evitar este cenário provável
futuro, o número de novos editores mensais deve ser melhorada novamente,
talvez através da adopção de políticas específicas e campanhas para atrair
novos editores para a Wikipedia, e topcontributors recuperar mais velhos mais
uma vez. Finalmente, uma outra contribuição importante para a comunidade de
pesquisa é WikiXRay, o software ferramenta que temos desenvolvido para
executar as análises estatísticas incluídas nesta tese. Esta ferramenta
automatiza completamente o processo de recuperar os dumps de bancos de dados
por parte do público Wikimedia repositórios, processá-los para obter as
principais métricas e parâmetros descritivos, e carregá-los em um base de
dados local, prontos para serem usados nas análises empíricas. Tanto quanto
sabemos, este é o primeiro trabalho de investigação implementação de uma
análise comparativa, a partir de um ponto de vista quantitativo, das edições
top-ten linguísticas da Wikipedia, apresentando resultados de muitas
perspectivas científicas diferentes. Portanto, esperamos que esta contribuição
vai ajudar a comunidade científica para melhorar a sua compreensão do
funcionamento rico, complexo e fascinante mecanismos e padrões de
comportamento do projeto Wikipedia e sua comunidade de autores. Da mesma forma,
esperamos que WikiXRay facilitará a difícil tarefa de desenvolver análises
empíricas em qualquer versão de idioma da enciclopédia, aumentando desta forma
o número de comparativa Estudos como este em muitas outras disciplinas
científicas.