2007 September 20 15:17:39 BRT

Mais vandalismo, mais wikipédia

Continuando na série de estudar o vandalismo na wikipédia, fiz esses dois gráficos comparativos entre as wikipédias que eu conheço a língua (até tentei fazer da sueca e da holandesa, mas os dados ficaram esquisitíssimos e eu acho que é porque eu não consigo identificar direito os vandalismos devido à língua! Mas sei-la).

Porcentagem de edições revertidas por mês nas diversas wikipédias.

Porcentagem de edições revertidas por mês nas diversas wikipédias.

Porcentagem de páginas revertidas por mês nas diversas wikipédias.

Porcentagem de páginas revertidas por mês nas diversas wikipédias.

Palpites e coisa e tal

Claro que cada um pode tirar suas próprias conclusões e tals, eu vou arriscar alguns palpites:

  • As wikis em inglês e espanhol são mais vandalizadas (duh)
  • As wikis restritas ao velho mundo (it e fr) são menos. Será que o vandalismo é fenômeno cultural do novo mundo?
  • Exceto na wiki espanhola, o vandalismo está em queda.
  • O vandalismo tem picos negativos (vales) nos períodos de férias (dezembro/janeiro no hemisfério sul e julho/agosto no hemisfério norte).
  • A aparente queda pode ser devida a algum período de férias (afinal os dados terminam em agosto).
  • A queda acentuada na wiki en parece ser devida a um aumento absurdo, abmudo e abcego do número de artigos. Será que os vândalos não conseguem acompanhar o crescimento agora que a wiki alcançou um tamanho crítico?
  • Ou meu italiano está muito ruim, ou o vandalismo na wiki it é incrivelmente baixo! Achei até estranho porque sempre vi os italianos como culturalmente parecidos com os brasileiros! Será que nem tanto?

Acho que chega né? Já falei muito no assunto!

girino 15:38, 20 Setembro 2007 (BRT)

P.S.

Crianças, não façam isso em casa. A wiki en é monstruosamente grande! Ela travava meu micro por horas quando eu tentava importar ela normalmente. Depois de mais de uma semana tentando, fiz assim:

  1. Desabilitei as chaves primárias e índices das tabelas
  2. importei os dados
  3. recriei os índices que eu precisava, sem recriar as chaves primárias.

Na wiki em inglês eu exclusivemente nem criei índice nenhum na tabela revision porque ela era muito, mas muito grande mesmo! Preferi rodar as consultas sem índices (levou mais de 2 dias).

Nas outras eu recriei os índices e as consultas demoraram um pouco menos (a mais demorada foi a wiki fr que demorou umas 2h).

Só pra deixar documentado aqui que o processo é longo e demorado, e não digam que não avisei!

girino 16:01, 20 Setembro 2007 (BRT)


Posted

in

by

Tags:

Comments

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.