Novo sistema de Taxocaixa

A Wikipédia Lusófona, está em processo de renovação dos sistema da caixa taxonómica. O antigo sistema já estava obsoleto, para cada artigos eram necessárias várias predefinições e principalmente gastava imenso recursos nos servidores da Wikimedia. O novo sistema é igual ao utilizado nas principais wikis (inglesa, espanhola, italiana e outras), utiliza apenas uma predefinição e é muito mais completo cientificamente. um exemplo.

A mudança já tinha sido pensado à mais tempo, mas ficou em águas de bacalhau, neste momento já existem mais de 17 mil artigos com caixa taxonómica, este é o momento certo para fazer essa alteração. Dia a dia o numero de artigos com taxo aumenta, quanto mais cedo for feito as alterações, melhor.

Para ajudar na transição, está a ser desenvolvido o código para o AutoWikiBrowser, é a coisa mais complexa que eu fiz até agora, está a dar umas grandes dores de cabeça, já esgotei o meu stock de aspirinas…

…mas o código cada vez está melhor, o único problema que ainda não foi totalmente corrigido, é um pequeno problema que por vezes acontece nas legendas das imagens. Mas mesmo com o código muito desenvolvido, este processo, não poderá ser totalmente automático, terá de ser feito artigo a artigo, não podemos esquecer que são mais de 17 mil artigos, toda a ajudam é bem-vinda… O AWB dá uma imensa ajuda, nós só temos em alguns casos, fazer pequenos ajuste e depois salvar.

Fantasmas

Foto de Eric Pouhier

Aquele era o tempo
Em que as mãos se fechavam
E nas noites brilhantes as palavras voavam,
E eu via que o céu me nascia dos dedos
Ea Ursa Maior eram ferros acessos.

Marinheiros perdidos em portos distantes
Em bares escondidos, em sonhos gigantes.
E a cidade vazia, da cor do asfalto,
E alguém me pedia que cantasse mais alto

Quem me leva os meus fantasmas
Quem me salva desta espada,
Quem me diz onde é a estrada?

Quem me leva os meus fantasmas
Quem me leva os meus fantasmas
Quem me salva desta espada,
Quem me diz onde é a estrada?

Aquele era o tempo
Em que as sombras se abriam, em que os homens negavam
O que outros erguiam.
E eu bebia da vida em goles pequenos,
Tropeçava no riso, abraçava venenos.

De costas voltadas não se vê o futuro
Nem o rumo da bala, nem a falha no muro.
E alguém me gritava, com voz de profeta.
Que o caminho se faz, entre o alvo e a seta.

Quem me leva os meus fantasmas
Quem me salva desta espada,
Quem me diz onde é a estrada?

Quem me leva os meus fantasmas
Quem me leva os meus fantasmas
Quem me salva desta espada,
Quem me diz onde é a estrada?

De que serve ter o mapa
Se o fim está traçado,
De que serve a terra à vista
Se o barco está parado,
De que serve ter a chave
Se a porta está aberta,
De que servem as palavras
Se a casa está deserta?

Quem me leva os meus fantasmas
Quem me salva desta espada,
Quem me diz onde é a estrada?

Quem me leva os meus fantasmas
Quem me leva os meus fantasmas
Quem me salva desta espada,
Quem me diz onde é a estrada?

Música de Pedro Abrunhosa.

Dá que pensar…

Andei a fazer umas consultas aos DUMP de Wikipédia e dá que pensar…

Percentagem dos artigos pelo numero de bytes


* 15% artigos tem menos de 500 bytes
* 36% artigos tem menos de 1000 bytes
* O intervalo com maior percentagem é o 1000 a 2000 bytes com cerca de 40% dos artigos totais
* Apesar de 3% com mais 10.000 bytes parece um bom resultados, mas não, porque a maior partes destes artigos são simples e enormes listas, são muito poucos os verdadeiros artigos


Segundo as estatísticas da wikimedia a nossa média por artigo é de 2216 bytes . 76,5% dos artigo da wikipedia tem bytes inferiores à média, menos de 2216 bytes.

Neste tablela da estatísticas da wikimedia , das 10 maior wikipedia, apenas a suéca e a polaca tem uma média de bytes inferior ànossa. Nós estamos actualmente estamos ao mesmo nível de 2004 das wiki:en de wiki:de, estamos com um atraso de 3 anos.

Apesar de tudo, do mês de Fevereiro para o de Março houve uma pequeníssima melhora, temos que pensar num processo que acelere o crescimento da qualidade dos artigos. Um das medidas será reduzir o máximo a criação de micro-artigos e desenvolver os existentes.

No último dias eu tenho estado a trabalhar nas [[Special:shortpages]], esta lista está cheia de artigos com VDA, suspeita, Pseudos-redirect, Movedic, prevenir-recriação e entre eles alguns artigos minúsculos.

Entretanto eu já resolvi o problema dos artigos com o {{prevenir-recriação}}, implementei o sistema utilizado na wiki:en do bloqueio em cascata. Assim só se deve utilizar a {{prevenir-recriação}} em imagens, para todos os outros domínios, basta colocar o artigo aqui, com este processo, mesmo com o artigo eliminado, ninguém consegue editar/criar esse artigo.

Em relação ao Pseudos-redirect, eu coloquei uma proposta para alteração do sistema, pode ser consultada aqui.

E uma coisa que ainda não consegui perceber qual a razão porque os artigo que são provado que existia VDA ficam 30 dias em quarentena, porque não eliminar logo (eliminação rápida). Outro processo complicado de resolver são as movedic e movidodic, o que fazer com estes artigos, muito deles permanecem anos, o artigo com apenas uma predef.

Ficam aqui algum pontos para reflexão…