Forum
>>
Principianti
>>
[RISOLTO] Libreria bs4 - problema sull'output spazi e newline (.strip(), .text)
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
|
Scritto da f3b995 |
2020-03-19 12:43:53 - [RISOLTO] Libreria bs4 - problema sull'output spazi e newline (.strip(), .text)
|
|
Buongiorno Forum
Python3 Ho un problema che in realtà prima non avevo, ho creato uno script che estraeva dei dati da: https://www.worldometers.info/coronavirus/country/italy/ con la libreria beutifulsoup, non avevo mai avuto problemi con l'output, avevo risolto rimuovendo l'html con .text alla fine della ricerca con soup.findAll, e usando anche .strip() dopo print(variabile.strip()). Adesso, forse per un aggiornamento del sito, mi stampa spazi e newlines che prima non c'erano, ho testato sul pc del lavoro, sul mio personale e su TERMUX app di android. Non capisco dove sta lo sbaglio.. Ho dovuto censurare il proxy.
import requests
from bs4 import BeautifulSoup
import os
import time
import urllib
import sys
class bcolors:
HEADER = '\033[95m'
OKBLUE = '\033[94m'
OKGREEN = '\033[92m'
WARNING = '\033[93m'
FAIL = '\033[91m'
ENDC = '\033[0m'
BOLD = '\033[1m'
UNDERLINE = '\033[4m'
while True:
try:
if os.name == "nt":
os.system("cls")
else:
os.system("clear")
URL = 'https://www.worldometers.info/coronavirus/country/italy/'
headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:74.0) Gecko/20100101 Firefox/74.0'} # User Agent
proxy = "https://nomeutente:passutente@proxybalblabla:8080"
os.environ['https_proxy'] = proxy
#requests = requests.Session() # imposta sessione
page = requests.get(URL, headers=headers, verify=True) # normale richiesta al sito
soup = BeautifulSoup(page.content, 'html.parser') # Elaborazione del Contenuto della pagina
casi_italia = soup.findAll(id="maincounter-wrap") # Casi totali
casiAttiviChiusi = soup.findAll('div', {'class': 'panel_front'})
#casi = soup.findAll('div', {'class': 'maincounter-number'})
lastUpdate = (time.strftime("%H:%M:%S")) # Data e orario
print("\nRiepilogo CORONAVIRUS in Italia \nPer chiudere il programma premi CTRL+C")
print("Ultimo Controllo: " + bcolors.WARNING + lastUpdate + bcolors.ENDC) # titolo
print("Link: " + URL + "\n")
"""
for a in casi:
casitot = "Casi Totali: "
print(casitot + a.text.strip())
"""
if casi_italia: # Dati urgenti
for a in casi_italia:
print("
|
Pagina: 1
Esegui il login per scrivere una risposta.
