Você sabia? | Corretor ortográfico do Word foi inventado por brasileiros
Sabe quando você escreve alguma coisa errada no Word e o programa informa o erro com aquele sublinhado na palavra? Pois então, foram brasileiros que inventaram a ferramenta de correção ortográfica, você sabia?. Mais precisamente, ela vem do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP), localizado em São Carlos.
Isso aconteceu em 1993, quando a fabricante brasileira de computadores Itautec foi até ICMC em busca de pesquisadores com ligação em linguagem neural. Na época, o curso de computação era reconhecido pelo conhecimento na área. Tais alunos seriam os responsáveis por criar um método que colaborasse com correção ortográfica. Em um primeiro momento, a proposta era apenas apontar typos, ou erros de digitação comuns. Ou seja, ao escrever “palarva”, o aparelho indicaria a troca das letras sugerindo uma correção para “palavra". Somente depois que a ferramenta passaria a reconhecer também outros desvios da norma culta, como de concordância nominal e verbal.
A proposta na época era vender a ferramenta como uma funcionalidade em CDs para que pessoas pudessem comprar em ambientes corporativos, nos quais se exigia maior cuidado com a gramática. Quem conta esta história é Maria das Graças Volpe Nunes, coordenadora do projeto no ICMC, em entrevista à BBC.
Em um ano, o time desenvolveu um projeto chamado ReGra, mas a ferramenta ainda demoraria ainda muito para se aperfeiçoar. Com um time de estudantes e pesquisadores tanto nas áreas de computação quanto de linguística, o grupo contou com investimento do Itautec. Além disso, o projeto recebeu apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp).
Só em 2000, 7 anos após o início das pesquisas, é que a Microsoft comprou os direitos de usar a ferramenta desenvolvida em São Carlos e a adicionou ao pacote Office. Então, em 2008, a Itautec vendeu definitivamente os direitos à detentora do Word.
A Microsoft, contudo, diz que atualmente não utiliza mais o mesmo sistema. "Inicialmente, a Microsoft realizou acordos para a utilização de licenças de corretores ortográficos de terceiros para muitos idiomas ao redor do mundo, mas gradativamente todos eles foram migrados para a plataforma da empresa. A ferramenta brasileira fez essa migração na versão do Office 2010, o que significa que a tecnologia presente no produto já é 100% Microsoft.", informou em nota para a BBC.
De acordo com o também pesquisador e participante do projeto, Osvaldo Novais de Oliveira Junior, a Itautec chegou a investir mais de US$ 2 milhões nos primeiro anos do projeto. A proposta inicial era apenas fazer um estudo para que a própria empresa criasse seu produto.
Atualmente, o time trabalha com o Núcleo Interinstitucional de Linguística Computacional (NILC), que desenvolve outros projetos voltados a utilização da língua portuguesa em computadores, inteligência artificial, machine learning e internet. "Ressalto que o processamento automático de língua natural está presente em muitos produtos, como os assistentes inteligentes que reconhecem voz e obedecem a comandos, os tradutores automáticos e os sistemas de busca na internet", informa Oliveira ao BBC.