Programa detecta com 90% de precisão se a autoria de um texto é falsa
Inteligência artifical desenvolvida na Dinamarca ajudará a identificar documentos falsificados, tweets pagos e redações escolares escritas por ghostwriters.
Pense bem antes de considerar colar no seu próximo trabalho escrito. Pesquisadores da Universidade de Copenhague, na Dinamarca, combinaram uma grande base de dados com inteligência artificial para criar um sistema que determina se um texto é original ou foi copiado da internet.
A pesquisa coletou 130 mil redações de estudantes de 10 mil escolas dinamarquesas, e o sistema adivinhou, com 90% de acerto, quais eram falsos.
Já existem programas capazes de identificar se um texto foi plagiado de um artigo previamente publicado. Um exemplo é o Lectio, usado nas escolas da Dinamarca. As coisas complicaram quando os alunos começaram a contratar outras pessoas para fazer seus textos, os ghostwriters. A situação é muito expressiva principalmente no último ano do colegial, quando os alunos precisam entregar um trabalho final — como se fosse um TCC do Ensino Médio.
No caso de a redação ter sido escrita por um ghostwriter, os programas utilizados atualmente não são tão eficientes. A técnica criada pelos cientistas identifica diferenças no estilo de escrita do aluno comparando seus textos anteriores. Alguns aspectos que o programa procura são tamanho das palavras, estrutura das frases e como as palavras são usadas. Um exemplo é a própria palavra “exemplo” — ela pode ser escrita inteira ou usando uma abreviação, como ex.
Por enquanto, o novo programa, chamado Ghostwriter, ainda está em fase de pesquisa. Os autores do estudo acreditam que em breve ele poderá ser levado para dentro das escolas, mas antes disso é preciso existir um debate ético. O programa não deve ser o único recurso utilizado para identificar a falsidade do texto. Ele pode indicar ou suspeitar da legitimidade do autor, mas quem deve dar a palavra final são seres humanos.
O Ghostwriter também pode ser útil em outras áreas. Ele pode analisar grandes quantidades de documentos e ajudar a polícia a identificar quais deles são falsificados. Ele também contribui para separar os tweets de usuários verdadeiros daqueles que foram pagos ou feitos por robôs. No Brasil – em que até receita de miojo recebe nota boa no Enem – a tecnologia será muito bem-vinda.