Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Αυριο βγαινει το 1ο τευχος του αρκα με το εθνος της κυριακης η εχουν βγει και αλλα;

Μην ξεκινησω να τα αγοραζω και εχω χασει τευχη ;)

Αύριο

μπηκε ιος στο φλασακι και διαγραφηκαν καποιοι φακελοι απο μονοι τους, παιζει να τους επαναφερω με καποιο προγραμμα,κι αν ναι ποιο προτεινετε?

Recuva, εκτός αν τα έχει κάνει μπάχαλο, έχασες
  • Like 1
  • Απαντ. 18,3k
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Δημοσ.

Υπάρχει πρόγραμμα στο οποίο να του πετάς ελληνικά PDFs & Word files και να σου μετράει πόσες φορές υπάρχει η κάθε λέξη?

πχ διαλέγεις 10 papers και σου αναφέρει ότι η λέξη "Author" υπάρχει 10 φορές, η λέξη "και" υπάρχει 1000 φορές κοκ.

Δεκτές και (αξιοπρεπείς & time efficient) πατέντες και workarounds

  • Moderators
Δημοσ.

Υπάρχει πρόγραμμα στο οποίο να του πετάς ελληνικά PDFs & Word files και να σου μετράει πόσες φορές υπάρχει η κάθε λέξη?

 

πχ διαλέγεις 10 papers και σου αναφέρει ότι η λέξη "Author" υπάρχει 10 φορές, η λέξη "και" υπάρχει 1000 φορές κοκ.

 

Δεκτές και (αξιοπρεπείς & time efficient) πατέντες και workarounds

κανεις export το pdf σε txt το ανοιγεις με το Notepad++ πατας ctrl+f γραφεις τη λεξη ου θες και πατας count

  • Like 1
Δημοσ.

κανεις export το pdf σε txt το ανοιγεις με το Notepad++ πατας ctrl+f γραφεις τη λεξη ου θες και πατας count

Thanks αλλά:

(1) Δεν ψάχνω συγκεκριμένες λέξεις. Με νοιάζει να βρω όλες (ή έστω τις top 50) πιο αναφερόμενες λέξεις στα PDF

(2) Δεν κάνω αναζήτηση σε 1-2 PDFs, θέλω ιδανικά να ψάχνω δεκάδες ταυτόχρονα, ή έστω ανα 5αδα, σίγουρα όμως όχι ένα ένα.

Δημοσ.

Χρησιμοποιείς Linux; Αν ναι grep!

 

Σημείωση υπάρχουν κάτι win grep ή κάπως έτσι που ίσως μπορούν να σε βοηθήσουν.

 

Τέλος, η Google εχει εργαλεία να σου δίνει στατιστικά των λέξεων σε κάθε κείμενο, δεν ξέρω αν ειναι δωρεάν.

Δημοσ.

Thanks αλλά:

(1) Δεν ψάχνω συγκεκριμένες λέξεις. Με νοιάζει να βρω όλες (ή έστω τις top 50) πιο αναφερόμενες λέξεις στα PDF

(2) Δεν κάνω αναζήτηση σε 1-2 PDFs, θέλω ιδανικά να ψάχνω δεκάδες ταυτόχρονα, ή έστω ανα 5αδα, σίγουρα όμως όχι ένα ένα.

 

Σε περίπτωση που όλα αποτύχουν, αναφορικά με τον αριθμό των pdf:

 

1) Online

2) Excel macro

 

edit, αυτό φαίνεται γλυκούλι.

  • Like 1
Δημοσ.

Θέλω την θύρα hdmi του raspberry να την συνδέσω με θύρα vga οθόνης. Καλώδιο vga έχω. Αυτός ο αντάπτορας θα κάνει δουλειά;

 

Ναι. 

 

μπηκε ιος στο φλασακι και διαγραφηκαν καποιοι φακελοι απο μονοι τους, παιζει να τους επαναφερω με καποιο προγραμμα,κι αν ναι ποιο προτεινετε?

 

Σίγουρα διαγράφηκαν; Μήπως έχουν γίνει κρυφοί; Έλεγξε το free space στο memory stick. 

Thanks αλλά:

(1) Δεν ψάχνω συγκεκριμένες λέξεις. Με νοιάζει να βρω όλες (ή έστω τις top 50) πιο αναφερόμενες λέξεις στα PDF

(2) Δεν κάνω αναζήτηση σε 1-2 PDFs, θέλω ιδανικά να ψάχνω δεκάδες ταυτόχρονα, ή έστω ανα 5αδα, σίγουρα όμως όχι ένα ένα.

 

Και ένα example σε python:

 

http://www.yasyf.com/coding/simple-python-word-frequency-count/

 

 

Γενικά, σε python είναι αρκετά εύκολο να το κάνεις. 

  • Like 1
Δημοσ.

[Κολωνακιώτισσα γκόμενα mode on]
 

Σε περίπτωση που όλα αποτύχουν, αναφορικά με τον αριθμό των pdf:
 
1) Online
2) Excel macro
 
edit, αυτό φαίνεται γλυκούλι.

1) Ντέν καταλαβαίνει ελλήνικως, και ενδέχεται να υπάρχουν και τέτοια στα PDF.

Επίσης το copy paste (για να πάρω text) από τα PDFs δεν είναι εφικτό. Ακόμα κι αν ξεπεράσουμε το θέμα του να ανοίγω 1-1 τα PDF, θα πρέπει να τα περνάω και από OCR και έχει και σχήματα μέσα και θα βρίσκω το ένα γράμμα εδώ το άλλο γράμμα στο πουλί της Χάιδως και γενικά σαν την ελληνική οικονομία θα γίνει το αποτέλεσμα.

2) Ζητάει text, ξαναγυρίζουμε στο πρόβλημα (1)

3) Το 3 φαίνεται να κάνει ακριβώς αυτό που ζητάω, thanks for that, διαβάζει και PDFs παρόλο που δεν το γράφει, αλλά  ούτε αυτό τα speakαρει τα greek characters. Ξενέρα QQ
 

Και ένα example σε python:
 
http://www.yasyf.com/coding/simple-python-word-frequency-count/
 
Γενικά, σε python είναι αρκετά εύκολο να το κάνεις.


Κοίτα, R & VBA πάει κι έρχεται, Python ούτε καν. Τι κάνω με αυτό "chmod a+x Wordcount.py"? Βρήκα αυτό που λέει ότι κάνει τα Python scripts, executables αλλά ας μην κάνω πειράματα βραδιάτικα. Πως χρησιμοποιώ τον κώδικα που μου έδωσες?

Επίσης, θα έχει πρόβλημα με ελληνικούς χαρακτήρες ή .pdf αρχεία?

Πάντως κι εμένα μου κάνει θεωρητικά εύκολο, γι' αυτό μπερδεύομαι που δεν υπάρχει out of the box λύση. Ωραίο προβληματάκι για προγραμματιστές, χρήσιμο για θεωρητικούς και pattern lovers, τα text analytics & data mining στα ντουζένια τους. Ίσως προτζεκτάκι για το μέλλον αν δε βρω.

Δημοσ.

το chmod a+x δίνει δικαιώματα για να μπορεί να τρέχει το wordcount.py το οποίο είναι αυτό που φτιάχνεις.
για να το τρέξεις, απο terminal, αν είσαι σε λίνουξ, πας στο φάκελο που βρίσκεται και πατάς ./wordcount.py και εισοδο (εδώ βάζεις τα pdf που θέλεις να διαβασει με κενό χωρισμένα και καλό είναι να βρίσκονται στο ίδιο σημείο με το .py σου αλλιώς θα πρέπει να βαλεις ολόκληρο το directory).
σε windows λογικά κάπως αντίστοιχα, δεν το έχω ψάξει ποτέ.
Επίσης η python είναι sensitive στη στοίχιση, οπότε αν κάτι το κάνεις copy paste πρόσεξε πως θα το τοποθετήσεις να μη χαλάσεις τη στοίχιση.

Υ.Γ. δεν έχω γνώσεις πάνω στη python πέρα 1-2 πολύ βασικά

  • Like 1
Δημοσ.

pdf και ελληνικά είναι αρκετά πονεμένη ιστορία. Για να μπορέσεις να "διαβάσεις" ελληνικά από pdf πρέπει να συντρέχουν κάποιες προϋποθέσεις. 

 

για το chmod (=change mode) κτλ, όπως τα είπε ο αποπάνως. 

 

 

Προσωπικά θα έκανα τα εξής:

 

- How to readlines from pdf python

- how to search for a word in lines python

- how to use dictionaries for frequency counting python

 

αυτό που ζητάς δεν είναι τίποτα... αλλά είναι κάπως βαρετό και θέλει και την ώρα του για να το κάνεις error safe (όσο πιο πολύ γίνεται at least). 

 

 

Εάν δεν είναι ευαίσθητη πληροφορία, δεν ρίχνεις το original goal μήπως υπάρχει καλύτερος τρόπος να το επιτύχεις; 

  • Like 1
Δημοσ.

έχω μια λίστα από πόλεις σε αρχείο text γραμμένες σε ξεχωριστή γραμμή την κάθε μία, μία κάτω από την άλλη δηλαδή. Μπορώ με κάποιο τρόπο χρησιμοποιώντας το Google Maps να μου βγάλει τα χιλιόμετρα και την ώρα που χρειάζεται να πάω στην κάθε μία ξεχωριστά από ένα συγκεκριμένο σημείο (ας πούμε το χωριό μου), χωρίς να χρειάζεται να τις πατάω μία μία; Η λίστα προφανώς είναι αρκετά μεγάλη και είναι αρκετά χρονοβόρο να δοκιμάζω χειροκίνητα μία μία τις πόλεις για να μετράω την απόσταση και τον χρόνο.

Επισκέπτης
Αυτό το θέμα είναι πλέον κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...