No puedo descargar una pág web ni como html ni imprimirla como pdf

Foro referente al sistema operativo Windows 10
Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 93
Registrado: 02 Feb 2022, 14:41

No puedo descargar una pág web ni como html ni imprimirla como pdf

Mensaje por Atenea »

Hola,

Normalmente cuándo quiero guardar una información que veo en una página web la guardo en pdf fácilmente pero en este momento estoy tratando de guardar la página [Enlace externo eliminado para invitados] y no he podido.

La impresión es del inicio de la página por lo que no me vale y si la descargo como html después no se me abre. Por eso pido algún consejo para poder guardarla y entender el por qué no se puede. Es información pública asique descarto que haya alguna traba para impedirlo.

Gracias. Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 2270
Registrado: 08 Jun 2018, 19:40

Re: No puedo descargar una pág web ni como html ni imprimirla como pdf

Mensaje por pako »

Hola,

No se puede guardar como página html, te dará el error:

Application error: a client-side exception has occurred (see the browser console for more information).

Pasa porque esa web usa muchos scripts javascript, alguno de ellos se conecta contra un servidor externo y comprueba el origen de donde se encuentra el original, ve que no está en el dominio permitido y da error. Son políticas de seguridad.

En este caso este es uno de los errores que te da:

Solicitud desde otro origen bloqueada: la política de mismo origen impide leer el recurso remoto en file:///LM%20Studio%20-%20Discover,%20download,%20and%20run%20local%20LLMs_files/vcd15cbe7772f49c399c6a5bab22c1241717689176015 (razón: la solicitud CORS no es http).

En Firefox, abre el archivo que descargaste, das a la tecla F12 para sacar las opciones de desarrollador.
Verás una barra de menú abajo con Inspector, Consola, Depurador, Red, etc. justo a la derecha del todo te sale un circulo rojo con el número de errores. Si pulsas en él, te salen abajo todos los errores que tiene explicados.

Lo de guardarla en PDF no se porque no te funciona, usas un plugin externo para el navegador para guardar páginas webs?

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!

Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 93
Registrado: 02 Feb 2022, 14:41

Re: No puedo descargar una pág web ni como html ni imprimirla como pdf

Mensaje por Atenea »

Hola,

No entiendo lo de medida de seguridad aplicable a guardar una web que es pública ya que eso debería pasar en todas y lo he hecho muchísimas veces y sin problema. Uso esa manera de guardar una página cuándo tiene un área de peguntas donde al ver una se oculta la otra. Como guardándola en html se ejecuta JavaScript las puedo revisar a todas estando guardada.

En pdf se guarda pero solo la parte superior de la página, la visible al momento de guardarla y no toda. He probado con extensiones para descargar pdf y guardar imprimiendo desde el mismo navegador y sucede lo mismo.

En las opciones de desarrollador, ¿puedo cambiar algo que me sirva para esto?

Gracias. Un saludo

Avatar de Usuario
pako
Usuario Bill Gates
Usuario Bill Gates
Mensajes: 2270
Registrado: 08 Jun 2018, 19:40

Re: No puedo descargar una pág web ni como html ni imprimirla como pdf

Mensaje por pako »

Hola,

Primeramente, que una web sea publica no significa que se pueda copiar, la mayoría de veces no hay problemas, otras veces meten scripts para que no se pueda dar al botón derecho del ratón para que no salga la opción de copiar al seleccionar un texto, otras deja copiar el texto pero al pegarlo te pone además del texto que copiaste otro texto seguido extra con la url de donde copiaste el texto, otras encriptan directamente todo el código fuente, etc.
Los que lo hacen es porque están hartos que se aprovechen de su trabajo.

Intento explicarte la medida de seguridad de otra manera:

Imagina que ForosWindows.Com se conecta a una segunda página web externa donde hay una API para obtener información y mostrarla directamente en ForosWindows.Com

En esa segunda página hay que contratar el servicio y pagar una mensualidad, ellos comprueban que la licencia esta asociada al dominio ForosWindows.Com con un script que te hacen poner dentro de ForosWindows.Com

El script comprueba con el código que se ejecuta desde ForosWindows.Com y funciona, deja acceso a los datos externos.
Si se guarda la web en local, el script no detecta el dominio porque se ejecuta desde un ordenador en local, con lo cual no deja el acceso a los datos.

Entendido eso, lo que hay que comprender que no es ForosWindows.Com quien tiene esa política de seguridad, la tiene la otra web externa.

En las opciones de desarrollador no hay que hacer nada, era solo por si querías ver que esa web usa muchos scripts y además por si querías ver los errores que muestra de seguridad al ejecutarse desde local.

Saludos
Si has encontrado aquí la ayuda que esperabas (o incluso si no ha sido así ;) ), ayúdanos a mantener el foro con un pequeño donativo.
¡Muchas gracias!

Atenea
Usuario topedesquiciao
Usuario topedesquiciao
Mensajes: 93
Registrado: 02 Feb 2022, 14:41

Re: No puedo descargar una pág web ni como html ni imprimirla como pdf

Mensaje por Atenea »

Hola,

Me doy cuenta a donde apuntas y a que seguridad te referías. Alguna vez he tenido que desactivar el JavaScript del navegador para ver la pág guardada. Ha de ser por eso que al no detectar el dominio no se me mostraba el contenido. No sabía porque pasaba eso.

Vale, pero entonces ¿quiere decir que no hay forma de guardar una página web que sea como la del ejemplo?

Si te fijas en esa página, está en 2 partes: una superior que es una franja y que siempre permanece visible y debajo la página propiamente dicha. Se me ocurre que ese podría ser el motivo de por qué esta página no se guarda apropiadamente. Si así fuera ¿Cómo podría descargar la parte de debajo de esa franja? Todas las herramientas para guardarla toman todo y acá necesitaría una parte.

Un saludo