Buscar saber o que é OCR, sigla em inglês de Optical Character Recognition – Reconhecimento ótico de caracteres em tradução literal – é compreender como funciona uma tecnologia utilizada por muitas empresas diariamente, e impacta direta e indiretamente na vida das pessoas.
Também conhecido como “reconhecimento de texto em imagens”, o Reconhecimento Óptico de Caracteres é resultado de anos de pesquisa e você pode acompanhar abaixo como a tecnologia funciona.
História do OCR
O início da tecnologia OCR pode ser considerado nos anos 1950, início da automação de dados em um processo que começou com a antiga Agência de Segurança de Forças Armadas (AFSA), atual Agência de Segurança Nacional (NSA), nos Estados Unidos.
A ideia era fazer com que informações de documentos pudessem chegar a outros locais sem ter que passar por mãos humanas, ou seja, um computador poderia analisar o que estaria ali e, automaticamente, entender e passar os dados para outros lugares.
Em 1974, Ray Kurzweil, pioneiro no estudo do setor, inventou um produto que poderia reconhecer qualquer fonte impressa e, ao menos inicialmente, seria usada para auxiliar pessoas com deficiência visual com uma máquina que poderia ler e vocalizar o que estava escrito.
Raymond Kurzweil, um dos pioneiros em OCR (Imagem: Reprodução/Kurzweil)
Nos anos 80, Kurzweil vendeu sua empresa para a Xerox, que tinha interesse na tecnologia para transformar textos em arquivos digitais, começando aí uma revolução que se tornou popular. Fotocopiadoras, digitalizadores e outros objetos mais populares fizeram da tecnologia um grande parceiro.
O que é e como funciona o OCR
OCR é uma tecnologia operada através de um software, cujo propósito é extrair o conteúdo de uma imagem, entendê-lo e, com isso, é possível fazer a transformação em texto escrito. O conteúdo pode ser: uma foto transcrita para texto, auxiliando pessoas com deficiência auditiva.
Além disso, é possível fazer a leitura de um texto e transformá-lo em documento digitalizado, já que reconhece caracteres e pode fazer imagens de texto. É o uso mais comum e mais acessível ao grande público, através de máquinas digitalizadoras.
Utilização de OCR para reconhecer o print e transformá-lo em texto (Imagem: Captura de Tela/Canaltech)
Para reconhecer imagens e textos e transformá-los em arquivos digitais, como PDF, o OCR utiliza bancos de dados, com grandes volumes de imagens e caracteres, e, com o auxílio de uma inteligência artificial, ajuda o programa a entender e transcrever o que é capturado em texto.
No frigir dos ovos, software de OCR são leitores de tela em que um texto é criado cada vez que uma imagem e isso permite que as pessoas agilizem o trabalho para alterar e enviar conteúdo para outros locais.
Fonte: Canaltech