georgekasa Δημοσ. 18 Ιουνίου 2022 Share Δημοσ. 18 Ιουνίου 2022 Καλησπερα σας, εχω ενα πρόβλημα στο scrapy κάνω scrape ένα ελληνικό site και τους ελληνικούς χαρακτήρες μου τους βγάζει ως εξής: u03bf \u039d\u03 κλπ, διάβασα στο stackoverflow να ενεργοποιήσω FEED_EXPORT_ENCODING = 'utf-8' στα settings.py παρολο αυτά μου τα έβγαλε ως εξής : xa0\xce\. Μήπως έχει αντιμετωπίσει αυτό το πρόβλημα; ευχαριστώ 'Name':response.css('h2.title::text').extract_first().encode('utf-8'), Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
n3a Δημοσ. 21 Ιουνίου 2022 Share Δημοσ. 21 Ιουνίου 2022 Μήπως το terminal που χρησιμοποιείς δεν καταλαβαίνει unicode? Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
georgekasa Δημοσ. 22 Ιουνίου 2022 Μέλος Share Δημοσ. 22 Ιουνίου 2022 δοκιμασα να γραψω και σε excel, τιποτα το ιδιο με Selenium γραφω excel κανονικα στα Ελληνικα. Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
virxen75 Δημοσ. 30 Ιουνίου 2022 Share Δημοσ. 30 Ιουνίου 2022 ποιο είναι το site? Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
georgekasa Δημοσ. 30 Ιουνίου 2022 Μέλος Share Δημοσ. 30 Ιουνίου 2022 kritikos supermarket Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
virxen75 Δημοσ. 1 Ιουλίου 2022 Share Δημοσ. 1 Ιουλίου 2022 εμένα το δείχνει πάντως στα ελληνικά Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
georgekasa Δημοσ. 1 Ιουλίου 2022 Μέλος Share Δημοσ. 1 Ιουλίου 2022 Καλημερα, επισης στο settings, FEED_EXPORT_ENCODING = 'UTF-8'. Με windows # -*- coding: utf-8 -*- import scrapy from scrapy_splash import SplashRequest class LaptopSpider(scrapy.Spider): name = 'testme' def start_requests(self): url ='https://kritikos-sm.gr/products/turokomika/kremwdh/katiki-domokou-pop-oreines-plagies-200gr-864775/' headers = {"User-Agent":"Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36"} yield scrapy.Request(url, headers=headers, callback=self.parse) def parse(self, response): yield{ 'test':response.css('div.ProductDetails_middleContainer__oM5vA::text'),#.decode('utf-8') } Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
virxen75 Δημοσ. 1 Ιουλίου 2022 Share Δημοσ. 1 Ιουλίου 2022 yield{ 'test':response.css('h1.ProductDetails_productName__M3CcG::text').get(), } Δοκίμασε το έτσι 1 Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
georgekasa Δημοσ. 1 Ιουλίου 2022 Μέλος Share Δημοσ. 1 Ιουλίου 2022 {'test': 'ΟΡΕΙΝΕΣ ΠΛΑΓΙΕΣ Κατίκι Δομοκού !!!!!!!!!!!!!!!!!!!!! euxaristo poli, kai ta ekana ola se Selenium!!! Συνδέστε για να σχολιάσετε Κοινοποίηση σε άλλες σελίδες άλλες επιλογές
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα