26 septiembre 2010 Software

pdftotxt
Mi primer escáner traía un software que me permitía pasar lo que había escaneado a texto plano, esto para mi era una maravilla, pues me facilitaba mucho la transcripción de textos. Si se preguntan por qué les comento esto, es por que ese software hacia uso de la tecnología llamada OCR. Así pues, acabo de descubrír PDF OCR X, una aplicación que me permite hacer algo muy similar.

PDF OCR X es una excelente herramienta con la cual podremos convertir o mejor dicho extraer el texto que acompaña a un documento PDF (debe de ser legible). Algo que me ha gustado bastante es lo fácil que puede llegar a ser pasar un PDF a texto ya que la función básica de PDF OCR X la podemos utilizar mediante un sencillo arrastrar y soltar, así al agregar un archivo obtendremos nuestro resultado.

Para la realización de este procedimiento se utiliza una avanzada tecnología de OCR (reconocimiento óptico de caracteres), esto permite que la extracción del texto sea bastante acertada, incluso si el texto está contenido dentro de una imagen.

Desde mi punto de vista esta herramienta es fundamental para los que estamos en la universidad o bien si manejamos muchos archivos PDF pues nos facilita extraer prácticamente cualquier texto ya que es capaz de soportar más de 20 idiomas y puede “leer” el texto de imágenes en formato GIF, JPEG, TIF, BMP, PSD, PNG, y más. Además permite elegir la entrada que se desee y modificar la salida para obtener los mejores resultados.

Creo que el único problema de esta aplicación es que en su versión gratuita sólo podréis pasar el texto de una sola página del PDF. En cambio la versión completa o Enterprise que tiene un costo de $29.99 dólares (22.35 euros) no tiene ningún tipo de limitante sobre el tamaño del archivo PDF.

Descarga | PDF OCR X 1.9.2
Vía | Mac OS X Freeware

Comentarios

2 comentarios

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *