Confira também esta versão:<div><a href="https://pt.wikipedia.org/w/index.php?oldid=27309674">https://pt.wikipedia.org/w/index.php?oldid=27309674</a></div><div>Para cada item da lista, a distância de Levenshtein entre os dois títulos foi dividida pelo tamanho do maior título (e indicada como porcentagem entre parêntesis), para tentar manter os itens mais parecidos no topo.<br>

<br><div class="gmail_quote">2011/10/18 Fabio Azevedo <span dir="ltr">&lt;<a href="mailto:fazedo@gmail.com">fazedo@gmail.com</a>&gt;</span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

Encontrei lá o para radição térmica/irradiação térmica<br>
Fabio<br>
<br>
Em 18 de outubro de 2011 17:55, Helder &lt;<a href="mailto:helder.wiki@gmail.com">helder.wiki@gmail.com</a>&gt; escreveu:<br>
<div><div></div><div class="h5">&gt; Divirta-se:<br>
&gt; <a href="https://pt.wikipedia.org/w/index.php?oldid=27308816#toc" target="_blank">https://pt.wikipedia.org/w/index.php?oldid=27308816#toc</a><br>
&gt; PS: Incluí também a lista dos pares de títulos cuja distância é 3 (que<br>
&gt; apesar de gigante, com seus 5978 itens(!), não parece muito útil...).<br>
&gt;<br>
&gt; 2011/10/18 Fabio Azevedo &lt;<a href="mailto:fazedo@gmail.com">fazedo@gmail.com</a>&gt;<br>
&gt;&gt;<br>
&gt;&gt; Helder,<br>
&gt;&gt;<br>
&gt;&gt; Tem como passar o algoritmo de novo para ver se esquecemos de algo?<br>
&gt;&gt;<br>
&gt;&gt; Fabio<br>
&gt;&gt;<br>
&gt;&gt; Em 17 de outubro de 2011 16:15, Helder &lt;<a href="mailto:helder.wiki@gmail.com">helder.wiki@gmail.com</a>&gt; escreveu:<br>
&gt;&gt; &gt; Aqui está a lista dos pares de títulos mais parecidos (distância igual a<br>
&gt;&gt; &gt; 0,<br>
&gt;&gt; &gt; 1 ou 2) presentes na lista atual:<br>
&gt;&gt; &gt; <a href="https://pt.wikipedia.org/w/index.php?oldid=27296547#toc" target="_blank">https://pt.wikipedia.org/w/index.php?oldid=27296547#toc</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 2011/10/17 Helder &lt;<a href="mailto:helder.wiki@gmail.com">helder.wiki@gmail.com</a>&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; Se alguém estiver a fim de programar, talvez isso funcione para alguns<br>
&gt;&gt; &gt;&gt; casos:<br>
&gt;&gt; &gt;&gt; * Para cada par de títulos da lista, calcule a distância<br>
&gt;&gt; &gt;&gt; Levenshtein entre<br>
&gt;&gt; &gt;&gt; as duas strings (Há algoritmos prontos para isso no Wikibooks<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; <a href="http://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance" target="_blank">http://en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance</a>)<br>
&gt;&gt; &gt;&gt; ** Se a distância for pequena, os títulos são &quot;parecidos&quot; (como<br>
&gt;&gt; &gt;&gt; &quot;Resident<br>
&gt;&gt; &gt;&gt; Evil 4&quot; e &quot;Resident Evil&quot;, cuja distância é 2), então coloque o par em<br>
&gt;&gt; &gt;&gt; uma<br>
&gt;&gt; &gt;&gt; lista, para ser avaliado por alguém posteriormente<br>
&gt;&gt; &gt;&gt; ** Se não for, ignore o par e passe para o próximo<br>
&gt;&gt; &gt;&gt; * Avalie manualmente os pares de títulos parecidos que foram incluídos<br>
&gt;&gt; &gt;&gt; na<br>
&gt;&gt; &gt;&gt; lista.<br>
&gt;&gt; &gt;&gt; Não sei se o algoritmo levaria muito tempo para ser executado, mas<br>
&gt;&gt; &gt;&gt; talvez<br>
&gt;&gt; &gt;&gt; ajude.<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; 2011/10/17 Fabio Azevedo &lt;<a href="mailto:fazedo@gmail.com">fazedo@gmail.com</a>&gt;<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Pessoal,<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Acho que ainda precisamos refinar um pouco essa lista. Encontrei<br>
&gt;&gt; &gt;&gt;&gt; algumas escolhas que me me parecem estranhas:<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 1) Existem apenas 3 artigos sobre datas: 29 de agosto, 30 de agosto e<br>
&gt;&gt; &gt;&gt;&gt; 7 de setembro. O último eu até entendo, mas os outros, não.<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 2) O artigo [[A Fazenda 4]] figura na lista, mas não [[A Fazenda]]. Se<br>
&gt;&gt; &gt;&gt;&gt; é que algum deles deveria figurar.<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 3) Existem diversos artigos sobre Piratas do Caribe<br>
&gt;&gt; &gt;&gt;&gt; (Piratas_do_Caribe, Piratas_do_Caribe:_No_Fim_do_Mundo,<br>
&gt;&gt; &gt;&gt;&gt; Pirates_of_the_Caribbean, Pirates_of_the_Caribbean:_At_World&#39;s_End,,<br>
&gt;&gt; &gt;&gt;&gt; Pirates_of_the_Caribbean:_Dead_Man&#39;s_Chest,<br>
&gt;&gt; &gt;&gt;&gt; Pirates_of_the_Caribbean:_On_Stranger_Tides,<br>
&gt;&gt; &gt;&gt;&gt; Pirates_of_the_Caribbean:_The_Curse_of_the_Black_Pearl,<br>
&gt;&gt; &gt;&gt;&gt; Pérola_Negra_(Piratas_do_Caribe), se não tiver outros).<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 4) Real_Madrid e Real_Madrid_Club_de_Fútbol (uma repetição)<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 5) Resident Evil 4 e Resident_Evil: Não é o caso de manter apenas 1?<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 6) Roma Antiga duas vezes<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; 7) Rússia e Russia<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; É claro que as repetições são fáceis de resolver, mas temo que haja<br>
&gt;&gt; &gt;&gt;&gt; vários casos assim. Será que tem uma maneira automática de eliminar<br>
&gt;&gt; &gt;&gt;&gt; esses casos mais óbvios?<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; Fabio<br>
&gt;&gt; &gt;&gt;&gt;<br>
&gt;&gt; &gt;&gt;&gt; _______________________________________________<br>
&gt;&gt; &gt;&gt;&gt; WikimediaBR-l mailing list<br>
&gt;&gt; &gt;&gt;&gt; <a href="mailto:WikimediaBR-l@lists.wikimedia.org">WikimediaBR-l@lists.wikimedia.org</a><br>
&gt;&gt; &gt;&gt;&gt; <a href="https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l</a><br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; WikimediaBR-l mailing list<br>
&gt;&gt; &gt; <a href="mailto:WikimediaBR-l@lists.wikimedia.org">WikimediaBR-l@lists.wikimedia.org</a><br>
&gt;&gt; &gt; <a href="https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; WikimediaBR-l mailing list<br>
&gt;&gt; <a href="mailto:WikimediaBR-l@lists.wikimedia.org">WikimediaBR-l@lists.wikimedia.org</a><br>
&gt;&gt; <a href="https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l</a><br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; WikimediaBR-l mailing list<br>
&gt; <a href="mailto:WikimediaBR-l@lists.wikimedia.org">WikimediaBR-l@lists.wikimedia.org</a><br>
&gt; <a href="https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l</a><br>
&gt;<br>
&gt;<br>
<br>
_______________________________________________<br>
WikimediaBR-l mailing list<br>
<a href="mailto:WikimediaBR-l@lists.wikimedia.org">WikimediaBR-l@lists.wikimedia.org</a><br>
<a href="https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l" target="_blank">https://lists.wikimedia.org/mailman/listinfo/wikimediabr-l</a><br>
</div></div></blockquote></div><br></div>