Estimado Gonçalo,
Muito obrigado pelo interesse mostrado e pela dica.
Vou colocar uma ligação ao site principal, de forma a que seja mais
fácil a avaliação.
https://languagetool.org/pt/
Neste momento, o programa pode já correr nos computadores dos
contribuidores da Wikipédia, através do complemento para o navegador que
utilizem para editar as páginas, mas o projeto que pretendo é para
voltar a proporcionar o serviço WikiCheck (um verificador de páginas que
faz o parsing destas) e fazer a adaptação de um bot que me permita fazer
as edições de forma automática, assim que o subconjunto de regras seja
selecionado e os mecanismos de desambiguação aperfeiçoados.
Julgo que isso foi explicado na página, mas irei rever de forma a que
seja mais explícito.
O conversor de idiomas é interessante, mas só se aplica à ortografia. Se
este projeto for bem sucedido, poderei pensar na fusão de ambos os
projetos, ou em projetos de conversão/tradução mais ambiciosos, e já
alinhavados. No entanto, cada coisa a seu tempo.
Obrigado pelo encorajamento.
Os melhores cumprimentos,
Tiago Santos
Às 12:00 de 16-03-2017, Wikipédia-request(a)lists.wikimedia.org escreveu:
> Enviar mensagens de WikiPT para
> wikipt(a)lists.wikimedia.org
>
> Para se inscrever ou para anular a sua inscrição via web, visite o
> endereço
> https://lists.wikimedia.org/mailman/listinfo/wikipt
> ou envie uma mensagem de email com a palavra 'help' no assunto ou no
> corpo da mensagem para
> wikipt-request(a)lists.wikimedia.org
>
> Pode entrar em contacto com a pessoa que gere a lista através do
> endereço
> wikipt-owner(a)lists.wikimedia.org
>
> Quando responder, por favor edite sua linha de assunto de forma a ela
> ser mais específica do que "Re: Contents of WikiPT digest..."
>
>
> Tópicos de Hoje:
>
> 1. Re: Pedido de apoio para bolsa para a Wikipedia (GoEthe.wiki)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Thu, 16 Mar 2017 10:12:49 +0100
> From: "GoEthe.wiki" <goethe.wiki(a)gmail.com>
> To: Portuguese Wikipedia <wikipt(a)lists.wikimedia.org>,
> tiagofsantos81(a)sapo.pt
> Subject: Re: [WikiPT] Pedido de apoio para bolsa para a Wikipedia
> Message-ID:
> <CAA6Ezu6CNTuRf0ML2DDc4benxjW++Y7WKYc=wSCxFqKt+XXtGg(a)mail.gmail.com>
> Content-Type: text/plain; charset="utf-8"
>
> Caro Tiago,
> A ideia parece interessante, mas para quem não conhece a LanguageTool de
> que fala (como eu) fica difícil avaliar o que ela faz: por exemplo: é um
> editor automático (bot) ou tem que ser activado por editores quando estão a
> editar?.
> Talvez lhe seja útil também conhecer o Conversor de idiomas (
> https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Conversor_de_idiomas) e
> incorporá-lo de alguma forma na ferramenta que está a desenvolver.
> Muito boa sorte com o projecto.
> Cumprimentos,
> Gonçalo
>
> No dia 14 de março de 2017 às 01:07, Tiago Santos <tiagofsantos81(a)sapo.pt>
> escreveu:
>
>> Estimados senhores,
>>
>>
>> Juntei-me recentemente à Wikipédia com uma proposta que deve ser do agrado
>> de todos aqueles que valorizam a Wikipédia ao ponto de voluntariarem o seu
>> tempo com ela.
>>
>> Sou um dos developers mais recentes do LanguageTool. Tenho-me dedicado
>> nestes últimos 6 meses a tentar tornar o LanguageTool uma ferramenta de
>> verificação gramatical viável para o idioma Português. Neste momento sei
>> que já possui muitas características que superam qualquer um dos produtos
>> concorrentes, sejam comerciais ou não.
>> Acredito no espírito de entre-ajuda global, e acho que é possível criar
>> ferramentas de topo de uma forma colaborativa, tal como é, um excelente
>> exemplo, a Wikipédia. Com a vossa ajuda, talvez seja possível fazer do
>> LanguageTool uma ferramenta de qualidade editorial ao nível das
>> alternativas existentes para o inglês, ao nível do Grammarly, Editor ou o
>> WhiteSmoke, mas para isso são necessários vários meses de desenvolvimento a
>> tempo inteiro.
>>
>> Há muito anos que sou um utilizador regular da Wikipédia Portuguesa.
>> O prestígio da Wikipédia tem sido frequentemente afetado por alterações
>> destrutivas, distrações inerentes às múltiplas edições, mas muitas outras
>> vezes devidas às inconsistências associadas à utilização de diversas
>> variantes do Português no mesmo texto.
>> Sei que este é um tópico que já gerou discussão e que acabou por ficar
>> resolvido com um "concordar em discordar". Isto faz com que muitos artigos
>> não obedeçam sequer às regras gramaticais que são comuns a todas as
>> variantes do Português.
>>
>> Durante o desenvolvimento do conjunto de regras do LanguageTool, tenho
>> tido o cuidado de separar as regras de acordo com a sua nacionalidade e
>> variante ortográfica (pré ou pós Acordo de 90). As regras que se aplicam a
>> todos os idiomas são mantidas num ramo comum.
>> Esse é o sub-conjunto mais amplo de regras e o que julgo ser aplicável à
>> Wikipédia. Com a vossa ajuda, poderei continuar a desenvolver essa
>> ferramenta gratuita, e durante o período de bolsa, dedicar-me-ei
>> exclusivamente ao desenvolvimento das ferramentas de integração com a
>> Wikipédia (reativando o LanguageTool WikiCheck), refinamento as regras a
>> aplicar, e desenvolvendo um mecanismo que permita verificar periodicamente
>> grandes conjuntos de textos.
>> Além disso, muitas das regras são tipográficas ou de formatação geral. São
>> o tipo de regras que um editor normal desconhece ou considera secundárias.
>> Ter uma ferramenta que corrige automaticamente este tipo de problemas
>> secundários de tipografia e estilo, aumenta a qualidade dos artigos, sem
>> perdas de tempo para qualquer dos voluntários que dedicam o seu tempo a
>> este projeto.
>> Isto libertará os editores de funções básicas de revisão, o que lhes
>> permitirá despender mais tempo a melhorar o estilo dos artigos, ou a
>> acrescentar novos conteúdos, ou qualquer outra tarefa mais valorosa.
>> Note-se que o LanguageTool também pode ser utilizado noutros contextos,
>> tais como um revisor gramatical para o Firefox, Google Chrome e
>> LibreOffice, entre muitos outros programas. Isto faz esta bolsa tenha um
>> âmbito mais amplo que o apresentado na candidatura.
>>
>> Uma versão preliminar da proposta encontra-se disponível em:
>> https://meta.wikimedia.org/wiki/Grants:Project/Automated_Por
>> tuguese_grammar_checking_edits_via_LanguageTool
>>
>> Se acharem o projeto interessante, e quiserem fazer esta ideia tornar-se
>> uma realidade, mostrem o vosso apoio na página da candidatura (na secção
>> Endorsements), deem-me a vossa opinião e ideias construtivas, e/ou espalhem
>> a informação por todos os quem beneficiem deste projeto.
>>
>>
>> Grato pela atenção prestada.
>> Os melhores cumprimentos,
>>
>>
>> Tiago Santos
>> https://github.com/TiagoSantos81
>>
>>
>>
>>
>> _______________________________________________
>> WikiPT mailing list
>> WikiPT(a)lists.wikimedia.org
>> https://lists.wikimedia.org/mailman/listinfo/wikipt
>>
> -------------- próxima parte ----------
> Um anexo em HTML foi limpo...
> URL: <https://lists.wikimedia.org/pipermail/wikipt/attachments/20170316/9d7b6213/…>
>
> ------------------------------
>
> Subject: Rodapé do Digest
>
> _______________________________________________
> WikiPT mailing list
> WikiPT(a)lists.wikimedia.org
> https://lists.wikimedia.org/mailman/listinfo/wikipt
>
>
> ------------------------------
>
> Fim da Digest WikiPT, volume 53, assunto 3
> ******************************************
Olá para todos,
como costumo fazer muitas vezes, acessei uma página na Wikipédia, na
ocasião, na de língua portuguesa mesmo, para aprender um pouco mais
sobre algo que passou por mim numa conversa qualquer. Isto faz uns 2 ou
3 dias.
O que aconteceu foi completamente incomum, inesperado e praticamente
inexplicável. Quando eu acessei a página do "artigo X", meu computador
começou, poucos instantes depois, a aumentar seu uso de memória, bem
rapidamente. Em poucos segundos a memória RAM se esgotou (eu mantenho um
monitor do sistema na minha barra de tarefas mostrando o uso de
memória). Após a RAM se esgotar, claro, começou a aumentar o uso da
memória virtual, que é em disco. Fiquei olhando aquilo, esperando algo
acontecer pra talvez explicar o negócio. Seria a página da Wikipédia que
causou o uso gigantesco de memória? Eu costumo ter muitos programas
abertos simultaneamente, e vários deles ficam fazendo coisas diversas o
tempo todo, embora não continuamente. Com quase tudo do sistema sendo
transferido pra memória virtual, decidi fechar o navegador, que foi o
último passo que fiz, provável culpado. Demorei vários minutos pra
conseguir matar ele pelo sistema. Tudo estava muito lento, respondendo
vários segundos depois da sua ação causal. Quando o navegador foi
obrigado a parar de rodar, sem escolha, houve um aumento instantâneo da
memória disponível, tanto na RAM quando na memória virtual que também
foi gasta (e também é mostrada no meu monitor de sistema). Conclusão: o
navegador foi quem gastou toda esta quantidade de memória. "Será por
que?", eu me perguntei. A Wikipédia é uma página tão leve, e funciona
até sem o javascript habilidado! (coisa que costumo usar desligado
também porque ela fica mais lenta com as bobagens dinâmicas que vieram
sendo acrescentadas nos últimos anos, e eu não gosto de nenhuma; prefiro
as páginas leves, rápido carregamento, leitura, tudo rápido, sempre!)
Enfim. Tentei abrir o mesmo artigo de novo, com o javascript
desabilitado. Mesmo resultado... e mais tempo perdido pela "bagunça
memorial" feita no sistema.
Deixei pra lá um tempo. Talvez fosse alguma mudança na Wikipédia que
deveria ser consertada rapidamente. Mas passando 1 dia, tentei de novo,
não mudou nada.
Passado mais um dia, tentei outros artigos na Wikipédia, desta vez.
Todos normais, abriram super rápido, como costuma acontecer. "E aí?
Vamos tentar o artigo X de novo?" - pensei. E, como podem imaginar pelo
assunto desta mensagem, o problema se repetiu. O problema pareceu ser,
neste momento, algo que só tem neste artigo ou algo que pode ter em
outros também, e que por "sorte" não tinha nos artigos que testei, eles
estavam normais.
Mais tempo perdido recuperando o sistema que ficou bem lento... chato
pra caramba!
Hoje, no final da tarde, me sentindo meio inspirado (ou à toa), quis
achar o ponto exato da causa do problema. Porém, tinha várias limitações
para eu contornar. Por exemplo, eu não consigo abrir o código fonte
(wikipediano) da página em questão, pra ver se tem algum vandalismo
nele. Isto vocês poderão fazer por mim - espero! - depois que eu
terminar de cronicar isto tudo.
Salvei a página pela linha de comando. Eliminei no código fonte dela
toda ocorrência de scripts. Abri a página no navegador, ansioso...
PEEEEEEEEEEM! Mesmo problema, mais perda de tempo. Já me sentindo meio
bobo por perder tanto tempo sem necessidade, eu consigo fazer melhor, já
fui pensando em como evitar as lentidões na próxima tentativa. Fiz isto
enquanto consertava a atual.
Ideia: buscar no código fonte da página, que já confirmei ter o
problema. E o problema não é dos scripts, direta ou indiretamente -
importante separação! Agora eu tenho "apenas" que achar qual linha ou
característica da página (já salva no meu disco) faz a memória do
navegador estourar. Acho que tem um máximo pro efeito, mas não tenho
certeza... eu sempre consegui parar o navegador antes da memória total
do sistema, que é muito grande, chegar ao fim.
"Como fazer a busca?" - pensei. Fácil! Quantas linhas tem o código?
Divido ao meio, apago a primeira ou a segunda metade, abro a página
resultante com algo perto de metade do tamanho original. Isto dará um
código HTML ruim, claro. E eu não quis consertar ele pra ficar "menos
errado", cheio de coisas não terminadas, etiquetas não fechadas, etc.
Mas eu consigo arrumar o básico mais visível e os navegadores são
projetados para lidar com vários tipos de erros nas páginas que abrem. E
contando com isto, e fazendo esta busca binária, eu poderia,
possivelmente, chegar a uma única linha culpada em poucas tentativas!
Certo?? Meio idealista, mas é uma possibilidade a se tentar, já que
estava bem no escuro com a causa do negócio.
A minha sorte está boa, consegui chegar rapidamente a uma única linha
culpada! Nela tinha algo absurdo pra existir num artigo qualquer da
Wikipédia. E pra confirmar que a culpa era do trem que eu achei, apaguei
TUDO da página, exceto os cabeçalhos; tirei da etiqueta "<body" todos os
elementos, exceto aqueles mais profundos que continham a tal linha -
neste momento - suspeita. Abri a página só com esta linha, num código
mínimo, de poucas linhas, e... O problema existiu! Exatamente igual!!
Detalhe exótico mudado pra algo razoável, abri a página sem efeito algum
(e quase sem conteúdo também). Pra terminar, baixei de novo, pela linha
de comando, toda a página do artigo X. Fazendo uma busca simples,
descobri que existiam duas ocorrências do possível erro. "Que tal
testar??" - pensei. Fiz apenas duas mudanças no código baixado,
alterando o exótico pra algo razoável. Abri o arquivo no navegador...
ótimo! Não ocorreu problema algum! Problema confirmado, solução
encontrada... e agora??
O artigo desta história está no endereço
http://pt.wikipedia.org/wiki/Tender.
http://pt.wikipedia.org/wiki/Tender
É um artigo bem curto, e nem era sobre o que eu queria ler (que é o
"tender" que as pessoas comem, alternativamente a um peru de Natal, até
onde já vi).
O problema, que faz o navegador estourar a memória, são 2 palavras no
artigo que estão com tamanho explícito, no código fonte HTML, de 4000
pixels! Exatamente 4000! E este tamanho absurdo de fonte, por um motivo
técnico que nem me interessa saber com exatidão, causa um gasto
horroroso de memória. As palavras, ambas ocorrêndo apenas uma vez no
artigo, como confirmei, são "Último" e "Próximo".
As linhas de código fonte HTML com os 2 problemas estão abaixo,
envolvidas por "--", pra ajudar:
--
<div class="nodeco" style="position:absolute; font-size:4000px;
font-weight:lighter; font-style:italic; line-height:1em;
vertical-align:top;">Último</div>
--
<div class="nodeco" style="position:absolute; font-size:4000px;
font-weight:lighter; font-style:italic; line-height:1em;
vertical-align:top;">Próximo</div>
--
Se estas palavras são consequência direta do código fonte wikipediano do
artigo, e portanto deverão ser efeito de algum vandalismo facilmente
localizado e de algum usuário, ou não, vocês poderão me dizer.
Se forem algum erro de configuração ou sei lá o que do sistema, afetando
possívelmente vários outros artigos com características semelhantes a
este, acho que nesta lista vocês saberão pra onde deve ser comunicado o
problema.
Fico aguardando. Espero ter colaborado, e agradeço antecipadamente ao
que vier.
Atenciosamente,
André
Hey,
My friends just have been talking about that stuff all day long, you may like it too. More info here <http://crizeryzu.njwave.com/xyhohsl>
See you soon, jdartora(a)uol.com.br
Caros.
Recentemente o OTRS recebeu uma notificação sobre um processo da cantora
Rosana Fiengo contra a Wikipédia. Ela alega que a Wikipédia e o Google
estão divulgando "dados ofensivos à sua honra em falsa biografia (...) que
não condizem com a realidade e com os fatos da vida e da trajetória
artística da autora/agravante". Em especial, parece que ela questiona que
a idade dela está incorreta.
Caso alguém queira acompanhar, algumas informações do processo estão
disponíveis publicamente no site no Tribunal de Justiça do Estado do Rio de
Janeiro:
http://www4.tjrj.jus.br/ejud/ConsultaProcesso.aspx?N=2014.002.15684
Embora nenhuma decisão judicial tenha sido expedida, isso provocou a
eliminação do artigo e gerou longas discussões na Wikipédia e no Chat sobre
como a comunidade deve proceder face a essas situações. Parte da discussão
pode ser vista em:
https://pt.wikipedia.org/wiki/Wikip%C3%A9dia:Pedidos/Outros#Elimina.C3.A7.C…
Atualmente, o conteúdo encontra-se eliminado da Wikipédia, porém, ainda é
possível acessar a versão arquivada pelo Internet Archive em:
http://web.archive.org/web/20140810101943/http://pt.wikipedia.org/wiki/Rosa…
Ao meu ver, o caso configura um exagero, pois as informações supostamente
questionadas pela cantora (que é uma pessoa pública) e listadas no artigo
estão todas referenciadas e foram previamente divulgadas por outras fontes
(não temos acesso completo aos documentos do processo para saber o que
exatamente ela questiona). No caso da idade em particular, há discrepância
nas fontes (algumas dizem uma data, outras dizem outra data) e, por isso,
foi adotada a data divulgada pelo site do TSE que divulgou tal informação
publicamente como parte da candidatura da cantora para vereadora. Não vejo
nada aí que possa afetar a honra da cantora.
O que acham disso? Acham correto que a comunidade se pronuncie e faça a
eliminação compulsória do artigo, ou deveriamos aguardar uma pronunciação
da WMF?
---
Diego Queiroz
Olá, Editores,
Fiz algumas alterações no verberte Ulisses (livro de James Joyce).
Conheço a obra e acho que dá pra incluir mais informações.
Há farto conteúdo sobre ele em outras linguas na Wiki. Dá pra melhorar
muito a versão em português.
Alguém planeja trabalhar no verbete?
Abs,
Luiz
---------- Mensagem encaminhada ----------
De: <wikipt-request(a)lists.wikimedia.org>
Data: 15 de março de 2013 14:52
Assunto: Bem vindo à lista de discussão "WikiPT" (Modo digest)
Para: luizdamotta(a)gmail.com
Bem vindo à lista de discussão WikiPT(a)lists.wikimedia.org!
Para enviar mensagens para esta lista, utilize:
wikipt(a)lists.wikimedia.org
Informações gerais sobre esta lista de discussão podem ser encontradas
em:
https://lists.wikimedia.org/mailman/listinfo/wikipt
Se desejar anular a inscrição ou modificar as suas opções (por
exemplo, mudar de/para modo digest, modificar a password, etc.),
visite sua página de inscrição em:
https://lists.wikimedia.org/mailman/options/wikipt/luizdamotta%40gmail.com
Pode também fazer tais ajustes via e-mail enviando uma mensagem para:
WikiPT-request(a)lists.wikimedia.org
com a palavra 'help' no assunto ou no corpo da mensagem (não inclua as
aspas). Receberá uma mensagem com instruções. Tem de saber a sua
password para modificar as suas opções (incluindo a própria password)
ou para anular a inscrição. Ela é:
chave8
Normalmente, o Mailman lembra-o das suas passwords em
lists.wikimedia.org uma vez por mês. Pode desactivar esta opção se
preferir. Este lembrete também inclui instruções sobre como anular a
inscrição ou modificar as suas opções de conta. Também existe um botão
na sua página de opções que pode utilizar para pedir para lhe
enviarmos a sua password por email.
--
Bons ventos
~~_/) ~~~_/) ~~~(\_~~