Forum
>>
Principianti
>>
Qualcuno Pratico di Scrapy
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
|
Scritto da Stew |
2017-02-03 12:27:40 - Qualcuno Pratico di Scrapy
|
|
Ciao a tutti sono nuovo mi chiamo Stefano
In questi giorni sto provando ad utilizzare lo script Python Scrapy, tutto funziona per bene ma ho seri problemi ad indentificare i selettori CSS, mi chiedevo se qualcuno potesse darmi una mano. Grazie |
|
|
Scritto da Daniele aka Palmux ![]() |
2017-02-03 19:59:14 - Re: Qualcuno Pratico di Scrapy
|
|
Ciao caro, non uso Scrapy da un sacco di tempo, ma non mi ricordo particolari problemi con i selettori CSS.
Prova a postare il codice (ricordando il tasto per una corretta visualizzazione), specificando che problemi hai riscontrato.
Ti consiglio anche un giro su Google, ho visto che è un argomento dove c'è un bel po' di documentazione. Cya |
|
|
Scritto da Stew |
2017-02-03 22:34:20 - Re: Qualcuno Pratico di Scrapy
|
|
Ciao Daniele il mio spider è il seguente:
import scrapy
class ItemSpider(scrapy.Spider):
name = "idealista"
start_urls = [
'https://www.idealista.it/affitto-case/roma/appio-latino/con-prezzo_800,pubblicato_ultimo-mese/',
]
def parse(self, response):
for item in response.css('div.items-container'):
yield {
'title': item.css("a.item-link::text").extract(),
'price': item.css("span.item-price::text").extract_first()
'img' : item.css
}
next_page = response.css('li.next a::attr(href)').extract_first()
if next_page is not None:
next_page = response.urljoin(next_page)
yield scrapy.Request(next_page, callback=self.parse)
da come vedi esegue lo scrape sul sito idealista, riesco ad avere indietro il titolo e il prezzo, il link immagini e il permalink del titolo degli annunci assolutamente no, le ho provate tutte. Inoltre quando ci sono più di 2 risultati nella pagina, i "title" li mette tutti nella seconda riga del file csv che genero, di seguito il marckup html che teoricamente dovrebbe essere quello dove lo spider pesca i dati: http://pastebin.com/YppMMYvj --- Ultima modifica di Stew in data 2017-02-03 22:37:08 --- |
|
|
Scritto da Daniele aka Palmux ![]() |
2017-02-03 23:00:30 - Re: Qualcuno Pratico di Scrapy
|
|
Hai letto questa sezione della guida? Te lo chiedo perché potrebbe aiutarti un bel po'...
|
|
|
Scritto da Stew |
2017-02-04 06:52:37 - Re: Qualcuno Pratico di Scrapy
|
|
Si l'ho letta, ma probabilmente c'è qualcosa che mi sfugge
|
Pagina: 1
Esegui il login per scrivere una risposta.

per una corretta visualizzazione), specificando che problemi hai riscontrato.
