Forum
>>
Principianti
>>
Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
|
Scritto da Noreply Noreply |
2019-01-17 11:29:22 - Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?
|
|
All'interno di un oggetto zuppa ho preso tutto il testo della divisione `inner_left2` dove ci sono articoli e date e voglio ottenere tutti gli articoli e le date in un dataframe. Sembra che gli articoli e le date siano nel tag `span`. Allora ho fatto:
page = requests.get('https://www.abcbourse.com/marches/news_valeur.aspx?p=1&s=DJIAx')
# Create a BeautifulSoup object
soup = BeautifulSoup(page.text, 'html.parser')
actualites_ws = soup.find(class_='inner_left2')
articles_list = actualites_ws.find_all('span')
Questo dà il seguente:
[<span class="n12">DJIA - <a href="/marches/aaz.aspx?M=usau"><img alt="" class="tipt" height="12" src="/game/flag/US.gif" title="USA" width="18"/></a></span>,
<span class="quote_upb"><img alt="" height="20" src="/5/quote_up_fl.png" width="30"/>0,57%</span>,
<span class="lh24">
<span class="mr5">16/01/19 22:30</span>
<a href="wall-street-finit-en-hausse-goldman-sachs-et-bank-of-america-a-l-honneur_459575_DJIAx.aspx">Wall Street finit en hausse, Goldman Sachs et Bank of America à l'honneur</a> (AFP)<br/>
</span>,
<span class="mr5">16/01/19 22:30</span>,
<span class="lh24">
<span class="mr5">16/01/19 16:14</span>
<a href="wall-street-soutenue-par-les-resultats-de-banques-ouvre-en-hausse_459537_DJIAx.aspx">Wall Street, soutenue par les résultats de banques, ouvre en hausse</a> (AFP)<br/>
</span>,
...
Ma quando provo a trasformarlo in un dataframe, non funziona:
>>>df = pd.read_html(articles_list)
TypeError: Cannot read object of type 'ResultSet'
--- Ultima modifica di MikeI in data 2019-01-17 11:29:46 --- |
Pagina: 1
Esegui il login per scrivere una risposta.
