Προς το περιεχόμενο

Το reCAPTCHA σας χρησιμοποιεί για την ψηφιοποίηση εγγράφων


gsarig

Προτεινόμενες αναρτήσεις

  • Members

Το CAPTCHA, το σύστημα που τοποθετείται σε δικτυακές φόρμες και καλεί τον χρήστη να αναγνωρίσει δυσανάγνωστες λέξεις για να αποδείξει ότι δεν είναι spambot, πιθανότατα το γνωρίζετε όλοι. Αυτό που ίσως δεν γνωρίζατε όμως είναι πως χρησιμοποιώντας μια από τις δημοφιλέστερες εφαρμογές του είδους, το reCAPTHA, είναι πολύ πιθανό να συμμετέχετε στην ψηφιοποίηση χιλιάδων παλιών εγγράφων.

 

Πιο συγκεκριμένα, το 2009 κάποιες εταιρείες, μεταξύ των οποίων και η Google, αποφάσισαν να ψηφιοποιήσουν παλιές εφημερίδες και περιοδικά χρησιμοποιώντας ειδικό λογισμικό που διαβάζει τις εικόνες των σκαναρισμένων σελίδων για να τις μετατρέψει σε κείμενο. Παρόλα αυτά, εξαιτίας της κακής ποιότητας κάποιων σελίδων ή της ασυνήθιστης γραμματοσειράς που χρησιμοποιούνταν, υπήρχαν κείμενα που ο υπολογιστής

αδυνατούσε να διαβάσει.

 

recaptcha.png

 

Για την αντιμετώπιση του προβλήματος η Google εξαγόρασε το reCAPTCHA, που αρχικά είχε αναπτυχθεί στο Πανεπιστήμιο Carnegie Mellon και το τροφοδότησε με τα κείμενα εκείνα που ήταν υπερβολικά δυσανάγνωστα για να διαβαστούν από τους ηλεκτρονικούς υπολογιστές της.

 

Η ιδέα ήταν έξυπνη, απλή και συμφέρουσα για όλες τις πλευρές: τα spambots δεν μπορούσαν να διαβάσουν τις λέξεις, αφού επιλέγονταν μόνο αυτές που το λογισμικό ψηφιοποίησης αδυνατούσε να διαβάσει. Το φαινόμενο του spamming περιοριζόταν και οι χρήστες χωρίς να το γνωρίζουν συνέβαλλαν στην ψηφιοποίηση χιλιάδων κειμένων, αποκρυπτογραφώντας τα πιο δύσκολα κομμάτια τους.

 

Η επιτυχία του reCAPTCHA είναι τέτοια που μέχρι το 2010 είχαν ήδη ψηφιοποιηθεί τα τεύχη 20 ετών από τους Times της Νέας Υόρκης, ενώ υπολογίζεται πως το ποσοστό ακρίβειάς του ξεπερνά το 99,5%. Για του λόγου το αληθές, στις εικόνες που ακολουθούν μπορείτε να δείτε ένα τέτοιο κείμενο (πρώτη εικόνα) και να συγκρίνετε την ψηφιοποίηση που έχει γίνει σε αυτό μέσω του λογισμικού OCR (δεύτερη εικόνα) σε σχέση με αυτή που πραγματοποιήθηκε με το reCAPTCHA (τρίτη εικόνα).

 

post-59623-0-27469100-1316957496_thumb.jpg post-59623-0-25439400-1316957493_thumb.jpg post-59623-0-97073000-1316957500_thumb.jpg

 

Link.png Site: Cracked.com

Link.png Site: Wikipedia

Link.png Site: reCAPTCHA

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Απαντ. 42
  • Δημ.
  • Τελ. απάντηση

Συχνή συμμετοχή στο θέμα

Συχνή συμμετοχή στο θέμα

Δημοσιευμένες Εικόνες

Αισθάνομαι... χρησιμοποιημένος. :-(

 

Παρ' όλ' αυτά πολύ καλή η ιδέα και η υλοποίηση.

 

Απορία: Συνήθως η γραμματοειρά στα CAPTCHA είναι ενιαία. Γιατί λέει ότι χρησιμοποιείται για να αναγνωρίστούν δυσανάγνωστες γραμματοσειρές; Οεο; ^_^

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Απορία, πώς καταλαβαίνει το πρόγραμμα αν έγραψες τη σωστή απάντηση αν δε μπορούσε να το διαβάσει.

 

Υ.Γ.

Να ένας αβλαβής τρόπος με τον οποίο μας εκμεταλλεύεται η google. Δυστυχώς όχι ο μόνος :devil:

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Members

Αισθάνομαι... χρησιμοποιημένος. :-(

 

Παρ' όλ' αυτά πολύ καλή η ιδέα και η υλοποίηση.

 

Απορία: Συνήθως η γραμματοειρά στα CAPTCHA είναι ενιαία. Γιατί λέει ότι χρησιμοποιείται για να αναγνωρίστούν δυσανάγνωστες γραμματοσειρές; Οεο; ^_^

 

Το captcha είναι η γενικότερη τεχνολογία. Το reCAPTCHA είναι η συγκεκριμένη εφαρμογή και οι γραμματοσειρές της ποικίλλουν. Δοκίμασε π.χ. να κάνεις μερικά refresh σε αυτήν εδώ τη σελίδα για να δεις μερικά παραδείγματα: http://www.google.com/recaptcha/learnmore

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

AAAAAAAAAAAAAAAAAA γιαυτο σε μενα το Captcha login παντα δουλευε,παρολο που την δευτερη λεξη παντα την εγραφα προσεγγιστικα και στην τυχη, αφου συνηθως δεν αναγνωριζα ποια ηταν.

 

Στο wiki λεει οτι το reCaptcha χρησιμοποιει δυο λεξεις στην προταση που σου δειχνει για αναγνωριση.η πρωτη λεξη ειναι γνωστη και αποτελει την λεξη-κλειδι που χρησιμοποιεο το συστημα για να σε αφησει να κανεις login.

αυτη την λεξη πρεπει να την γραψεις σωστα.η δευτερη λεξη ειναι η αγνωστη λεξη που δεν μπορει να αναγνωριστει απο τα OCR προγραμματα της Google.εσυ την γραφεις προσεγγιστικα, κοιτωντας να βγαζει νοημα η προταση με τις δυο λεξεις.

δεν εχει σημασια αν την δευτερη λεξη την γραψεις λαθος,ουτως η αλλως το συστημα δεν την χρησιμοποιει ως λεξη-κλειδι για το Login.αλλα το πως θα την γραψεις ,βοηθαει στην τελικη αναγωριση της απο το OCR της Google.

 

ειπα και γω,μα τοσο κωλοφαρδος ημουν και πετυχαινα παντα την δευτερη λεξη και εκανα Login?

μαλιστα,πολυ εξυπνο κολπο.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Members

Απορία, πώς καταλαβαίνει το πρόγραμμα αν έγραψες τη σωστή απάντηση αν δε μπορούσε να το διαβάσει.

 

Υ.Γ.

Να ένας αβλαβής τρόπος με τον οποίο μας εκμεταλλεύεται η google. Δυστυχώς όχι ο μόνος :devil:

 

Λειτουργεί ως εξής: σε κάθε εικόνα εμφανίζονται 2 λέξεις - μία άγνωστη για το σύστημα και μια που ήδη γνωρίζει ποια είναι. Εάν συμπληρώσεις σωστά την γνωστή λέξη, θεωρεί ότι έχεις συμπληρώσει σωστά και την άγνωστη. Η άγνωστη λέξη, φυσικά, εμφανίζεται στη συνέχεια και σε άλλους χρήστες ώστε να διασταυρωθεί η σωστή απόδοσή της.

 

edit: με πρόλαβε ο KilliK

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Και τι εμποδίζει τα spambots τότε εφόσον αρκεί η λέξη που μπορεί το σύστημα ούτως ή άλλως να διαβάσει;

 

Ή στη πρώτη πρόκειται για διασταυρωμένα σωστά ψηφιοποιημένη δυσανάγνωστη προς το σύστημα;

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

  • Members

Και τι εμποδίζει τα spambots τότε εφόσον αρκεί η λέξη που μπορεί το σύστημα ούτως ή άλλως να διαβάσει;

 

Ή στη πρώτη πρόκειται για διασταυρωμένα σωστά ψηφιοποιημένη δυσανάγνωστη προς το σύστημα;

 

Προσωπική εκτίμηση σε αυτό (χωρίς όμως να έχω κάποια πηγή να το στηρίξω) είναι πως μπορεί να ισχύει το δεύτερο που αναφέρεις - ότι δηλαδή η γνωστή λέξη είναι μία από αυτές που προηγουμένως είχαν αποτελέσει άγνωστες

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Προσωπική εκτίμηση σε αυτό (χωρίς όμως να έχω κάποια πηγή να το στηρίξω) είναι πως μπορεί να ισχύει το δεύτερο που αναφέρεις - ότι δηλαδή η γνωστή λέξη είναι μία από αυτές που προηγουμένως είχαν αποτελέσει άγνωστες

 

Και πιθανό να μην ήταν γνωστό οπότε τα bot να προσπαθούσαν να βρουν και τη 2η λέξη.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Απορία, πώς καταλαβαίνει το πρόγραμμα αν έγραψες τη σωστή απάντηση αν δε μπορούσε να το διαβάσει.

 

Υ.Γ.

Να ένας αβλαβής τρόπος με τον οποίο μας εκμεταλλεύεται η google. Δυστυχώς όχι ο μόνος :devil:

Δεν το καταλαβαίνει. Δοκίμασε σε μια πολύ δυσανάγνωστη λέξη να βάλεις ό,τι να 'ναι. Θα το δεχτεί σαν σωστό. Ακολουθώ αυτή την τακτική εδώ και πολύ καιρό, προκειμένου να βγάλω τα μάτια μου προσπαθώντας να καταλάβω τι λέει.

 

 

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

πολύ καλή ιδέα και σαν σύλληψη και σαν υλοποίηση , δεν είναι κακό να βοηθάμε και επίσης πιστεύω ότι αν είχε έναν ιστότοπο που να ανέβαζε ο υπολογιστής μόνος του δυσανάγνωστα κείμενα και λέξεις πιστεύω ότι πολλοί χρήστες θα βοηθούσαν και θα γινότανε και διασταύρωση κανονικά.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Βασικά είχε τύχει παλιότερα να δω πως λειτουργεί και είναι πολύ καλή ιδέα.

 

Επίσης νομίζω πως δεν είναι σίγουρο αν η πρώτη ή η δεύτερη είναι η γνωστή και την γνωστή την πειράζουν λίγο ώστε να μην μπορεί να αναγνωριστεί εύκολα από bot.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

  • Δημιουργία νέου...