Caro Alquimista,
Não tento presumir que sei mais sobre a Wikipédia, que qualquer um dos aqui presentes.
Aliás, tanto o Alquimista como o Sr. Diego estão a ser humildes, dado que além de pertencerem ao grupo de aprovação de bots pertencem ao grupo restrito de 8 burocratas que regem atualmente a Wikipédia Portuguesa.
A questão é que, assim que aqui entrei, foi-me recordado que isto é uma instituição politizada. Como tal, devo reger-me pelos seus termos públicos objetivos, tal como os que mencionei, utilizando referências das próprias ligações que me ofereceu.
Em termos wikipédicos, a Política de Bots é o "texto legal" pelos
quais os bots devem reger-se, de uma forma muito suscita.
A referência a legal, foi com intuito de aligeirar a conversa. Mas eu explico. As palavras em texto jurídicos são sempre mais do que a sua interpretação superficial (p.ex. memorando de entendimento).
O mesmo não se costuma passar com regulamentos.
Foi exatamente por considerar a página apresenta como "a lei da terra" que me regi por ela. Exatamente por querer fazer as coisas de forma aprovada é que me interessei pelo regulamento. Se existir algo relevante mais objetivo e concreto, por favor, indique-me de forma a que eu o analise e possa continuar com uma conversa informada, assim como a procurar soluções que se enquadrem nos parâmetros já estabelecidos.
Se são regras, devo sabe-las em pormenor.
Sobre a parte específica dos corretores ortográficos, o texto não
proíbe taxativamente qualquer correção de ortografia automática para permitir que casos específicos possam ser corrigidos, coisas simples, com uma taxa de erro residual e com o apoio da comunidade.
Esta foi a parte que eu li. Taxativamente não existe nada de objetivo. Para mim, regras objetivas e números são importantes.
Quais são os parâmetros de análise?
Percentagem de falsos positivos e corpus de amostragem necessário (n)?
O que é considerado uma utilização de recursos computacionais razoável por cada ciclo?
Foi isso que referi que iria ajustar com o começo do projeto, apesar de o ter feito com termos de merceeiro de forma a que seja fácil para qualquer um entender a lógica subjacente.
Dependendo dos critérios definidos, os meus critérios de seleção e aperfeiçoamento de regras será ajustados.
Aliás, eu não quero envolver-me em ortografia, ou em questões de gramática dúbias e polémicas que tendem a entreter académicos.
A secção portuguesa do LanguageTool separa as várias variantes, mas tem uma componente que é comum a todas variantes.
É exatamente esse sub-conjunto de regras que é comum que será trabalhado. O meu objetivo não é tornar a Wikipédia mais próxima do MEU Português, mas torná-la mais próxima de um Português correto. Para isso só serão utilizadas as regras comuns a todas as variantes.
No caso inglês, o caso é idêntico ao Lusófono, para um bot poder
operar tem de cumprir a política e ser aprovado por um processo similar, aliás, foi a baseado no anglófono que se instituiu a política e a aprovação de bots lusófona. Não vi o vídeo todo, mas pelo que percebi, o que mostram não é um bot, mas sim uma ferramenta, pode dar-me indicação do minuto para poder verificar a solução apresentada?
Esse é o LanguageTool geral. Outras sub-ferramentas dão um extrato das correções.
Para um excelente exemplo de ação de um bot semelhante:
https://ca.wikipedia.org/wiki/Especial:Contribucions/Langtoolbot
mas reafirmo o conselho de consultar as documentações, envolver-se
com a comunidade e tentar perceber o seu funcionamento.
Já deve ter percebido, que eu até vejo documentação e de uma forma séria. Mas reafirmo que não comecei a desenvolver.
Repare que o próprio Diego lhe indicou o Wikimedia labs [0], ou
seja, não é preciso investir no alojamento / servidor,
Eu já tinha sido previamente informado desse recurso (que eu já conhecia). Até analisar toda a informação necessária sobre ele, não me posso comprometer a utilizá-lo. Dependendo de muitas questões distintas, pode ser mais viável pagar pelo alojamento, apesar de qualquer poupança ser bem-vinda. Muitas questão podem tornar essa alojamento inviável ou indesejável. Nem tudo o que não rebato, indica que concordo. De todos os modos, os custos máximos de alojamento que estimei são menos de 8% do valor pedido para a proposta base, sem compromisso de manutenção. Os custos máximos de alojamento seriam, também, para a proposta máxima.
penso que em vez de bot, o mais apropriado seria uma ferramenta lá.
Existem imensos projetos possíveis, incluso para outros idiomas distintos. Mas a proposta é a que coloquei. Só são moldáveis os critérios finais de aprovação e a forma como serão realizados.
envolver-se com a comunidade e tentar perceber o seu funcionamento.
Quem é a comunidade? Não é o que estou a fazer?
Estou a falar consigo, e já falei com mais algumas pessoas, algumas de forma pública como pode constatar. Mas...
A comunidade são: os administradores; os burocratas; os utilizadores com contribuições; ou é o total de utilizadores?
Qual o modo mais fácil de contactar diretamente os 2 milhões de utilizadores registados e fazer uma votação? Seria interessante aferir a opinião da comunidade no seu todo desta forma. É possível?
Espero que seja possível contar com o apoio dos membros mais experientes para resolver estas questões, dado que não consegui encontrar Wikipédia com este tipo de respostas.
Os melhores cumprimentos,
Tiago Santos
Às 18:04 de 08-04-2017, wikipt-request@lists.wikimedia.org escreveu:
Caro Tiago, grande parte do tempo que despendo para a wikipédia anda em redor de bots. Tenho vários a realizar inúmeras tarefas, maioritariamente na wikipédia Lusófona mas por vezes sou solicitado noutros projetos, tal como o Diego sou membro do Grupo de Aprovação de Bots, e a própria política de bots fui eu que a elaborei e propus à comunidade. Não digo isto com o intuito de o menosprezar, mas simplesmente que entenda que é a àrea onde provavelmente estou mais à vontade, portanto o que pretendo é passar-lhe algumas informações de que precisa para começar a compreender o funcionamento da comunidade e dos procedimentos nesta área.
<< Isto não é um texto legal, portanto: "Corretores automáticos são fortemente desencorajados" deve querer significar: "Corretores automáticos são fortemente desencorajados", algo diferente de "correção de ortografia não é permitida recorrendo a bots." >>
A política de bots é o conjunto das regras fundamentais pelas quais os bots se devem reger, cada projeto tem as suas regras específicas, embora todas andem em redor dos mesmos parâmetros. Este é um ponto essencial que precisa perceber e ter em conta. Salvo casos especiais em tarefas específicas e em projetos específicos, os bots precisam de aprovação por parte da comunidade local, caso contrário são bloqueados, e em casos de insistência tratados como vandalismo. Em termos wikipédicos, a Política de Bots é o "texto legal" pelos quais os bots devem reger-se, de uma forma muito suscita.
Sobre a parte específica dos corretores ortográficos, o texto não proíbe taxativamente qualquer correção de ortografia automática para permitir que casos específicos possam ser corrigidos, coisas simples, com uma taxa de erro residual e com o apoio da comunidade.
No caso inglês, o caso é idêntico ao Lusófono, para um bot poder operar tem de cumprir a política e ser aprovado por um processo similar, aliás, foi a baseado no anglófono que se instituiu a política e a aprovação de bots lusófona. Não vi o vídeo todo, mas pelo que percebi, o que mostram não é um bot, mas sim uma ferramenta, pode dar-me indicação do minuto para poder verificar a solução apresentada?
< Quanto à atribuição de estatutos, existe já um protocolo, que caso o projeto se concretize, se irá realizar como parte do tempo de desenvolvimento. > Aqui parece haver confusão, a que protocolo se refere?
Estes são os pontos mais importantes que penso que convém analisar para já, mas reafirmo o conselho de consultar as documentações, envolver-se com a comunidade e tentar perceber o seu funcionamento. Repare que o próprio Diego lhe indicou o Wikimedia labs [0], ou seja, não é preciso investir no alojamento / servidor, e sinceramente, penso que em vez de bot, o mais apropriado seria uma ferramenta lá.
Cordialmente, Alchimista