Skip to main content

¿Qué es el OCR (Reconocimiento óptico de caracteres?

El software del escáner no tiene la herramienta que posibilita reconvertir las imágenes capturadas a OCR (reconocimiento óptico de caracteres) y para ello debemos utilizar Adobe Acrobat....A continuación explicaremos qué es el OCR y cómo conseguir hacerlo.

¿Qué es el OCR?

El OCR (Optical Character Recognition) es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto.

Cuando tenemos una imagen (ya sea una fotografía o un documento que hayamos escaneado), el texto que contiene forma parte de esa imagen, al igual que cualquier elemento de la misma (un dibujo o un esquema, por ejemplo). Pues bien, si necesitamos extraer ese texto para poder editarlo, necesitamos un programa de OCR que reconozca dicho texto y lo transforme en una cadena de caracteres (ya sea ASCII o Unicode) y posteriormente copiar esta cadena a un programa de edición para ya poder trabajar con ella, con el consiguiente ahorro de tiempo al no tener que teclear este texto.

En el siguiente putno vermos como hacer "reconocible" un pdf a texto usando un conversor OCR... ¡Adelante!