Aquí podría ser tu PUBLICIDAD


lista para un mal funcionamiento de aplicaciones web Python

votos
0

Soy nuevo en el sitio, no estoy seguro de si este es el lugar correcto para hacer preguntas pitón, si no por favor me avise y voy a volver a publicar esto a la ubicación correcta. Necesito ayuda con un código que estoy trabajando en mi clase de Coursera, el objetivo es el siguiente: encontrar el enlace en la posición 18 (el primer nombre es 1). Seguir ese enlace. Repita este proceso 7 veces. La respuesta es el último nombre que se recupera. Pista: El primer carácter del nombre de la última página que se carga es: J de enlace :( http://py4e-data.dr-chuck.net/known_by_Shannon.html )

He escrito un código para esta tarea, pero parece que sólo funcionaba para el primer artículo, y cada sitio, ya que la primera de ellas, la lista de fallos de funcionamiento del código. Mi idea es conseguir el código HTML y añadir la URL en una lista, a continuación, encontrar el artículo 18a de la lista, a continuación, redirigir todo el circuito con la nueva URL y eliminar la lista de edad. Repitiendo el proceso durante 7 veces. Estoy seriamente confundido con el hecho de dónde exactamente el código que salió mal. Gracias por adelantado.

    import urllib.request, urllib.parse, urllib.error
from bs4 import BeautifulSoup
import ssl
import re
term_counter = (0)
file = list()
regex = list()
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE

url = input('Enter - ')
for I in range(7) :
    html = urllib.request.urlopen(url, context=ctx).read()
    soup = BeautifulSoup(html, 'html.parser')
    tags = soup('a')
    del file[:]
    file = list()
    for tag in tags :
        file.append(tag)
        print(tag.contents[0])
        url = tag.get('href')
        print (url)
    for items in range(17,18) :
        print(file[items])
Publicado el 02/09/2018 a las 05:22
fuente por usuario pythonnoob
En otros idiomas...        العربية       


Aquí podría ser tu PUBLICIDAD