Caros,
Aqui vai a lista do cruzamento dos artigos da HMS (hm_*) com os artigos da Wikipédia (w_*). A coluna w_page_len indica o tamanho do artigo que já existe na Wikipédia, quando foi possível detectá-lo.
No total, são cerca de 250 artigos a importar.....
PS: É possível que existam alguns problemas de codificação, mas os resultados não devem variar muito.
O que acham?
Numa vista rápida, verifiquei que muitos que estão como page_len = -1 existem na wiki. Eu posso fazer um rastreio completo até amanhã. Dá para centralizar a info numa spreadsheet no google docs?
Abs
Lije
Imagine um mundo onde é dada a qualquer pessoa a possibilidade de ter livre acesso ao somatório de todo o conhecimento humano. É isso o que estamos a fazer.
Participe também: http://wikimedia.org http://wikimedia.pt
No dia 12 de Abril de 2011 05:16, Nuno Tavares nuno.tavares@dri.ptescreveu:
Caros,
Aqui vai a lista do cruzamento dos artigos da HMS (hm_*) com os artigos da Wikipédia (w_*). A coluna w_page_len indica o tamanho do artigo que já existe na Wikipédia, quando foi possível detectá-lo.
No total, são cerca de 250 artigos a importar.....
PS: É possível que existam alguns problemas de codificação, mas os resultados não devem variar muito.
O que acham?
-- Nuno Tavares DRI, Consultoria Informática Telef: +351 936 184 086
Wikimedia Portugal http://www.wikimedia.pt ______________________________________________ WikimediaPT mailing list WikimediaPT@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimediapt
Lije, é normal, tem a ver com a codificação. E às vezes basta um acento numa letra para o título não coincidir. Esta lista foi feita muito rapidamente.
Podes passar para uma spreedsheet? Incluir pfv todas as colunas, mais uma: o título do artigo na WP que reparaste existir.
Se não conseguires fazer diz, que eu faço.
Lije et Al,
Colei num google doc: https://spreadsheets.google.com/ccc?key=0AnPdbOK0J9nKdDB1TzJjdFAzX21kS1RsLVl...
Vamos criar um procedimento, para nos entendermos: * O objectivo é colocar na coluna 'w_page_title' o artigo a que 'h_titulo' se refere. * Apaguem o valor da coluna w_page_len para sinalizar que já alguém perdeu tempo a analisar essa linha.
Já encontrei alguns.
Abrçao,
Amigos,
Isto está feito.
Os artigos a * AMARELO - são os que não existem (ou não encontrei). Os que tiverem uma X à direita são os que me proponho fazer, por interesse particular (e porque já localizei onde vão ficar :P)
* VERDE - sem valor na coluna w_page_len são os que (ainda) não foram cruzados - para determinar o tamanho - ou seja, são os que cruzei manualmente;
* VERMELHO - peço a vossa ajuda para verem se percebem qual é o artigo equivalente, se é que existe.
Deiam todos uma olhada, para verem do que se está a falar. A pergunta final é: isto interesa-nos? Em que moldes (ver meu e-mail de 23-03-2011 12:19:32)?
Tenho que dar uma resposta até ao final desta semana.
Um abraço,
Sim interessa. Como ja dizeram em resposta ao teu mail o que nao podemos e ter deadline para colocar tudo isso na wiki, mas que iteressa interessa _____ *Béria Lima* http://wikimedia.pt/ (351) 925 171 484
*Imagine um mundo onde é dada a qualquer pessoa a possibilidade de ter livre acesso ao somatório de todo o conhecimento humano. É isso o que estamos a fazer.***
No dia 13 de Abril de 2011 03:31, Nuno Tavares nuno.tavares@wikimedia.ptescreveu:
Amigos,
Isto está feito.
Os artigos a
- AMARELO - são os que não existem (ou não encontrei). Os que tiverem
uma X à direita são os que me proponho fazer, por interesse particular (e porque já localizei onde vão ficar :P)
- VERDE - sem valor na coluna w_page_len são os que (ainda) não foram
cruzados - para determinar o tamanho - ou seja, são os que cruzei manualmente;
- VERMELHO - peço a vossa ajuda para verem se percebem qual é o artigo
equivalente, se é que existe.
Deiam todos uma olhada, para verem do que se está a falar. A pergunta final é: isto interesa-nos? Em que moldes (ver meu e-mail de 23-03-2011 12:19:32)?
Tenho que dar uma resposta até ao final desta semana.
Um abraço,
Nuno Tavares Wikimedia Portugal http://www.wikimedia.pt
Imagine um mundo onde é dada a qualquer pessoa a possibilidade de ter livre acesso ao somatório de todo o conhecimento humano. É isso o que estamos a fazer.
Participe também: http://www.wikimedia.pt
Ter, 2011-04-12 às 21:59 +0100, Nuno Tavares escreveu:
Lije et Al,
Colei num google doc:
https://spreadsheets.google.com/ccc?key=0AnPdbOK0J9nKdDB1TzJjdFAzX21kS1RsLVl...
Vamos criar um procedimento, para nos entendermos:
- O objectivo é colocar na coluna 'w_page_title' o artigo a que
'h_titulo' se refere.
- Apaguem o valor da coluna w_page_len para sinalizar que já alguém
perdeu tempo a analisar essa linha.
Já encontrei alguns.
Abrçao,
Wikimedia Portugal http://www.wikimedia.pt ______________________________________________ WikimediaPT mailing list WikimediaPT@lists.wikimedia.org https://lists.wikimedia.org/mailman/listinfo/wikimediapt
wikimediapt@lists.wikimedia.org