pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word Tema Solucionado

Todo lo referente a la informatica, hardware, software... no necesariamente relacionado con Windows
Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 72
Registrado: 02 Feb 2022, 14:41

pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por Atenea »

Buenas a todos,

Anteriormente había traducido online, de manera automática, pdf en inglés y alemán al español y la traducción había sido más que aceptable por ser tan rápida y gratuita

Hoy fui a traducir un pdf del portugués al español que pesa menos de 1 MB y el resultado es que manteniéndose el formato original, la traducción muestra caracteres extraños. Lo hice en 2 plataformas y el resultado fue el mismo. Entonces lo convertí en Word y también sale con caracteres extraños.

¿Podrían decirme a que puede deberse tal cosa? ¿Qué hace que un pdf se traduzca bien y otro resulte con caracteres extraños?

Se me ocurrió copiar un trozo del texto en portugués y lo pegué en traductor online y al pegarlo ya sale en otros caracteres extraños!!, lo mismo pero otros caracteres que el google no lo identifica.

¿Cómo es posible que si copio un texto al pegarlo salga algo completamente distinto.

Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 1834
Registrado: 08 Jun 2018, 19:40

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por pako »

Hola,

Puedes poner un párrafo pequeño que no tenga datos personales con el que te de esos caracteres extraños?

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!

Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 72
Registrado: 02 Feb 2022, 14:41

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por Atenea »

Sí. Aquí pego lo que aparece cuándo copio un trozo del texto en portugués del pdf que quiero traducir en el traductor online, al que señalé por las dudas que el idioma a traducir es portugués al español.

stn kbtnrgbi lïm pm`n snr km`gegob`m, ompgb`m mu trb`uzg`m snk b pnrkgssïm nxprnssb, pmr
Hnnr. Nstn kbtnrgbi lïm pm`n snr km`gegob`m, ompgb`m mu trb`uzg`m snk b pnrkgssïm nxprnssb, pmr
nsorgtm, `m n`gtmr, nxontm omlemrkn pnrkgtg`m pnib infgsibæïm vgfnltn. M usm `n kbrobs rnfgstb`bs,
nsorgtm, `m n`gtmr, nxontm omlemrkn pnrkgtg`m pnib infgsibæïm vgfnltn. M usm `n kbrobs rnfgstb`bs,
lmkns omknrogbgs mu kbrobs `n snrvgæm, rnfgstb`bs mu lïm, `b prmprgn`b`n `n Boonss
lmkns omknrogbgs mu kbrobs `n snrvgæm, rnfgstb`bs mu lïm, `b prmprgn`b`n `n Boonss
Omlsogmuslnss, `bs subs nkprnsbs begigb`bs mu `ms snus rnspnotgvms prmprgntârgms, ç nxprnssbknltn
Omlsogmuslnss, `bs subs nkprnsbs begigb`bs mu `ms snus rnspnotgvms prmprgntârgms, ç nxprnssbknltn
prmgjg`b, nxontm omlemrkn pnrkgtg`m lm omltrbtm vgfnltn. Pm`ms ms `grngtms rnsnrvb`ms.

Esto es un trozo de lo que sale cuándo convierto el pdf al Word, sin hacer traducción:

Ompyrifht :127. Boonss Omlsoimuslnss, IIO. _tbeemr`, Pnxbs. :128 pmr Fbry K. @mufIbs n @r. @bil Hnnr. Nstn kbtnribI lãm pm`n snr km`ieiob`m, ompib`m mu trb`uzi`m snk b pnrkissãm nxprnssb, pmr lmkns omknroibis mu kbrobs `n snrviçm, rnfistb`bs mu lãm, `b prmprin`b`n `n Boonss Omlsoimuslnss, `bs subs nkprnsbs beiIib`bs mu `ms snus rnspnotivms prmprintârims, é nxprnssbknltn prmiji`b, nxontm omlemrkn pnrkiti`m lm omltrbtm vifnltn. Pm`ms ms `irnitms rnsnrvb`ms.

Cuándo pego esto último en el traductor para que detecte el idioma, sale que es inglés y la traducción al español es exactamente lo mismo.

Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 1834
Registrado: 08 Jun 2018, 19:40

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por pako »

Hola,

Eso supongo que es lo ya traducido.
Me refiero a un párrafo pequeño original en portugués con el que te de los caracteres extraños, para probarlo a ver si también me da el mismo problema que a ti o me sale bien.

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!

Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 72
Registrado: 02 Feb 2022, 14:41

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por Atenea »

Hola,

No, no es lo traducido. Eso es lo que señalé y copié del pdf en portugués y al pegarlo en este hilo, o en un Word, o en el traductor online, es lo que aparece. ¿Extraño verdad? Aparece algo totalmente distinto de lo que estoy señalando.

Primeramente quiero aclarar que la expresión de “caracteres extraños” es como percibí lo que coloque en el mensaje anterior. Casi todos son caracteres de nuestro idioma pero lo califiqué como “caracteres extraños” aunque no sea la manera adecuada.

Cuándo pegué eso en el traductor, salió que el idioma detectado era inglés y la traducción al español era exactamente lo mismo.

No logro entender cómo es posible que señalo y copio un texto y se pega algo totalmente distinto. Llegue a pensar que era una protección contra copias pero en la pestaña Seguridad aparece que esta todo permitido. Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 1834
Registrado: 08 Jun 2018, 19:40

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por pako »

Hola,

Hay programas editores de texto que tienen distintas opciones a la hora de copiar y pegar textos, tienes instalado alguno como Microsoft Word ?

Imagen

Deberías de hacer un arranque en limpio en Windows, para que no cargue ningún programa tuyo en el arranque, asi pruebas a hacer el copy/paste a ver si así lo hace bien, esto indicaría que el culpable es algún programa que instalaste.

Arranque limpio en Windows 10

Windows añadió en Windows 10 el historia del portapapeles, ahí también te salen los textos mal?

Portapapeles Windows 10

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!

Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 72
Registrado: 02 Feb 2022, 14:41

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por Atenea »

Hola,

Sí. Si lo pego en el block de notas, en Word de Microsoft o en el Writer de LibreOffice o donde sea, se pega lo mismo y es como lo que publiqué.

Tú dices de hacer arranque limpio para que no cargue ningún programa mío pero es que esto solo sucede en ese pdf. En otros pdf se pega lo que copio. Si fuera algún problema de mi sistema, ya sea del Windows o de algún programa que yo haya instalado sucedería con todos.

Lo que me acabo de dar cuenta ahora es que luego de señalar el texto en portugués en ese pdf y click en botón derecho para darme opción de copiar la selección, también sale la opción Copiar la imagen, cosa que no sale en los otros pdf.

De acá deduzco que ese pdf esta creado con imágenes y que el texto que señalo y copio es una imagen y no un texto. De ahí que lo que aparece pegado sea algo distinto al texto que estoy viendo. ¿Puede ser eso, no? ¿Qué opinas?

Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 1834
Registrado: 08 Jun 2018, 19:40

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por pako »

Hola,

Creo que ahora ya te entendí, solo te pasa con ese archivo pdf concreto y no con el resto.

Lo del arranque en limpio, es porque algunos editores de texto modifican las opciones del copy/paste como la imagen que te mostré, entonces si se arranca junto a Windows en segundo plano pues también te pasaría, por eso te comente esa prueba.
Pero ahora al saber que es solo con ese archivo pdf, no tiene que ver con eso.

Una imagen si se puede copiar como texto, pero viendo el texto que pegaste aquí eso no pertenece a una imagen.
Si fuera solo de imágenes el archivo pdf, pero te deja seleccionar la parte de texto dentro de esa imagen, debería de dejarte de pegarlo porque lo selecciona como texto, si fallara el reconocimiento de imagen a texto, alguna palabra te saldría mal, pero no todo el texto completo.

A mi me parece que ese archivo pdf lo que tiene es protección para que no se copie, mírate si tiene vista protegida, entorno limitado, modo protegido, seguridad anticopia o algo así. No uso mucho los pdf, supongo que el abrirlo te dirá que esta en modo protegido, o si vas a sus propiedades, algo debería de ponerte ahí si tiene copyright.

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!

Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 72
Registrado: 02 Feb 2022, 14:41

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por Atenea »

Hola,

Todo lo que dices en el último párrafo también lo pensé pero en Propiedades, pestaña Seguridad aparece todo permitido.

Recién le di a imprimir en pdf y obtuve una copia del mismo que se realizó sin inconveniente asique no tiene ninguna seguridad que lo impida pero en esta copia no me permite señalar texto ya que con Click derecho solo tengo la opción de Copiar la Imagen. Si lo hago me aparece un rectángulo negro sin texto.

Este pdf me lo pasó una amiga y creo que es escaneo del libro en papel como imagen.

En esta copia está claro que es solo imagen y no texto. Pero si en la anterior también es imagen ¿Por qué me permite señalar texto? Debería comportarse como esta última, no? Esto no lo entiendo.

Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 1834
Registrado: 08 Jun 2018, 19:40

Re: pdf se traduce en caracteres extraños. Lo mismo si lo convierto a Word

Mensaje por pako »

Hola,

Sin tener el archivo en pdf en cuestión no puedo decirte mucho más sin hacer pruebas.

Lo de la imagen, si la seleccionas es normal que se ponga negra como que esta seleccionada, al igual que cuando seleccionas un texto.

Lo del otro archivo que te seleccione el texto dentro de la propia imagen, supongo que seria porque activaste el OCR, que es para reconocer el texto y pasarlo a un formato editable.

Acabo de mirar y en el de Adobe seria en la herramienta "Editar PDF", al usarla directamente usa el reconocimiento óptico de caracteres, así que puede que el otro día dieras a editar el pdf y por eso ya te dejaba seleccionar el texto.

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!