Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

  • Members
Δημοσ.

Η Βρετανική Βιβλιοθήκη είναι μία από τις μεγαλύτερες παγκοσμίως, φιλοξενώντας κοντά στα 150 εκατομμύρια έργα από όλες τις χώρες και γλώσσες του κόσμου. Σε αυτά περιλαμβάνονται 14 εκατομμύρια βιβλία και 920.000 εφημερίδες και περιοδικά μέρος των οποίων αναμένεται να γίνουν διαθέσιμα οnline, μετά από συμφωνία της βιβλιοθήκης με τη Google για την ψηφιοποίηση όσων έχουν πάψει να υπόκεινται υπό καθεστώς πνευματικών δικαιωμάτων.

 

Μάλιστα, δεδομένου ότι τα έργα που θα ψηφιοποιηθούν αποτελούν «κοινό κτήμα», οι χρήστες θα έχουν τη δυνατότητα να τα διαβάσουν, να τα αναζητήσουν και να τα αντιγράψουν δωρεάν. Επίσης τα βιβλία, μερικά από τα οποία χρονολογούνται από τον 18ο αιώνα, θα είναι διαθέσιμα και μέσω της ίδιας της Google.

 

Αξίζει να σημειωθεί πως η Google έχει ήδη πραγματοποιήσει αντίστοιχες συμφωνίες με βιβλιοθήκες από όλο τον κόσμο, ωστόσο είχε συναντήσει αρκετά νομικά προβλήματα στην προσπάθειά της να ψηφιοποιήσει περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα. Βέβαια, στην περίπτωση της Βρετανικής Βιβλιοθήκης η συμφωνία καλύπτει μόνο τα μη προστατευμένα κείμενα, που σημαίνει πως εδώ δεν αναμένεται να υπάρξουν τέτοιου είδους κωλύματα.

 

Link.png Site: The Next Web

Δημοσ.

έχουμε καμιά ιδέα πως υλοποιείται αυτό το έργο;

 

Υποθέτω πως μεγάλες βιβλιοθήκες θα έχουν αρχίσει από χρόνια την ψηφιοποίηση βιβλίων. Διαφορετικά... Με OCR ή με εργάτες.

 

193BM.jpg

Δημοσ.

όταν μιλάμε όμως για βιβλία του 18ου αιώνα μιλάμε για υψηλής αξίας δεδομένα που δεν θα θέλουν να τα εμπιστευτούν και στην καλύτερη μηχανή που υπάρχει. ++ ότι οι γραμματοσειρές δεν είναι ευανάγνωστες και από τα καλύτερα προγράμματα.

Δημοσ.

Μακροπρόθεσμα όλο και κάτι θα έχει στο νου της... δεν μπορεί...:devil:

 

Πάντως πολύ καλά νέα, άριστη πρωτοβουλία θα έλεγα :mrgreen:

Δημοσ.

Το έχετε ακουστά το CAPTCHA;

 

@firewalker: υπάρχει όντως αυτό το θηρίο;

 

ναι όμως μιλάμε για αναγνώριση κειμένου όχι να φτιάξουμε κείμενο σε μορφή εικόνας.....και ειδικά προσπαθούν να ψηφιοποιήσουν χειρόγραφα που είναι δύσκολο ακόμα και για εμάς να τα αναγνώσουμε...

Δημοσ.

ναι όμως μιλάμε για αναγνώριση κειμένου όχι να φτιάξουμε κείμενο σε μορφή εικόνας.....και ειδικά προσπαθούν να ψηφιοποιήσουν χειρόγραφα που είναι δύσκολο ακόμα και για εμάς να τα αναγνώσουμε...

Γιατί, το captha τι κάνει;Σου δίνει δύο λέξεις, τη μία ο υπολογιστής την ξέρει από πριν την άλλη όχι (δε μπόρεσε να την αναγνωρίσει το OCR). Αν εσύ βρεις τη σωστή λέξη θεωρεί ότι έχεις αναγνωρίσει και την άγνωστη - αν οι απαντήσεις από διάφορους χρήστες συμφωνήσουν, η λέξη θεωρείται μετά γνωστή

Δημοσ.

δηλαδή τα sites που το χρησιμοποιούν δωρεάν στην ουσία εκτός από την δική τους ασφάλεια έναντι των spam βοηθούν μέσω των χρηστών τους για τις αυτές λέξεις οι οποίες δεν αναγνωρίζονται από τους υπολογιστές;

Δημοσ.

Βασικά, έκανα ένα λάθος, εννοούσα το reCaptcha:

reCAPTCHA improves the process of digitizing books by sending words that cannot be read by computers to the Web in the form of CAPTCHAs for humans to decipher. More specifically, each word that cannot be read correctly by OCR is placed on an image and used as a CAPTCHA. This is possible because most OCR programs alert you when a word cannot be read correctly.

 

But if a computer can't read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...