[Wikimedia Brasil] Lista

Nevio nevinhoalarcao em gmail.com
Segunda Outubro 17 17:12:20 UTC 2011


Se for para ser wikicentrada, esse método do Hélder é o suprasumo. Caríssimo Hélder, rogo que não entenda mal, apenas tenho dito desde o começo que os artigos deveriam ser escolhidos por um terceiro, mais próximo ao publico-alvo. Att

Enviado do meu iPad

No dia 17/10/2011, às 13:34, Helder <helder.wiki em gmail.com> escreveu:

> Se alguém estiver a fim de programar, talvez isso funcione para alguns casos:
> * Para cada par de títulos da lista, calcule a distância Levenshtein entre as duas strings (Há algoritmos prontos para isso no Wikibooks
> http://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance)
> ** Se a distância for pequena, os títulos são "parecidos" (como "Resident Evil 4" e "Resident Evil", cuja distância é 2), então coloque o par em uma lista, para ser avaliado por alguém posteriormente
> ** Se não for, ignore o par e passe para o próximo
> * Avalie manualmente os pares de títulos parecidos que foram incluídos na lista.
> Não sei se o algoritmo levaria muito tempo para ser executado, mas talvez ajude.
> 
> 
> 2011/10/17 Fabio Azevedo <fazedo em gmail.com>
> Pessoal,
> 
> Acho que ainda precisamos refinar um pouco essa lista. Encontrei
> algumas escolhas que me me parecem estranhas:
> 
> 1) Existem apenas 3 artigos sobre datas: 29 de agosto, 30 de agosto e
> 7 de setembro. O último eu até entendo, mas os outros, não.
> 
> 2) O artigo [[A Fazenda 4]] figura na lista, mas não [[A Fazenda]]. Se
> é que algum deles deveria figurar.
> 
> 3) Existem diversos artigos sobre Piratas do Caribe
> (Piratas_do_Caribe, Piratas_do_Caribe:_No_Fim_do_Mundo,
> Pirates_of_the_Caribbean, Pirates_of_the_Caribbean:_At_World's_End,,
> Pirates_of_the_Caribbean:_Dead_Man's_Chest,
> Pirates_of_the_Caribbean:_On_Stranger_Tides,
> Pirates_of_the_Caribbean:_The_Curse_of_the_Black_Pearl,
> Pérola_Negra_(Piratas_do_Caribe), se não tiver outros).
> 
> 4) Real_Madrid e Real_Madrid_Club_de_Fútbol (uma repetição)
> 
> 5) Resident Evil 4 e Resident_Evil: Não é o caso de manter apenas 1?
> 
> 6) Roma Antiga duas vezes
> 
> 7) Rússia e Russia
> 
> 
> É claro que as repetições são fáceis de resolver, mas temo que haja
> vários casos assim. Será que tem uma maneira automática de eliminar
> esses casos mais óbvios?
> 
> 
> Fabio
> 
> _______________________________________________
> WikimediaBR-l mailing list
> WikimediaBR-l em lists.wikimedia.org
> https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l
> 
> _______________________________________________
> WikimediaBR-l mailing list
> WikimediaBR-l em lists.wikimedia.org
> https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: http://lists.wikimedia.org/pipermail/wikimediabr-l/attachments/20111017/9870ec28/attachment.htm 


Mais detalhes sobre a lista de discussão WikimediaBR-l