Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Η Anthropic κυκλοφόρησε τη Δευτέρα ένα νέο μοντέλο τεχνητής νοημοσύνης, το Claude Sonnet 4.5, το οποίο σύμφωνα με την εταιρεία προσφέρει κορυφαίες επιδόσεις σε εργασίες προγραμματισμού.

Η εταιρεία υποστηρίζει ότι το Claude Sonnet 4.5 μπορεί να δημιουργήσει εφαρμογές "έτοιμες για παραγωγή" αντί για απλά πρωτότυπα, αντιπροσωπεύοντας ένα σημαντικό άλμα σε αξιοπιστία σε σύγκριση με προηγούμενα μοντέλα τεχνητής νοημοσύνης.

Το Claude Sonnet 4.5 θα είναι διαθέσιμο μέσω του Claude API και στο Claude chatbot. Η τιμολόγηση για τους προγραμματιστές είναι ίδια με αυτή του Claude Sonnet 4: 3 δολάρια ανά εκατομμύριο tokens εισόδου (περίπου 750.000 λέξεις, ή περισσότερες από ολόκληρη τη σειρά "Ο Άρχοντας των Δαχτυλιδιών") και 15 δολάρια ανά εκατομμύριο tokens εξόδου.


image.png.51de810cfe648969f966d074d884d27f.png
Τον τελευταίο χρόνο, τα μοντέλα τεχνητής νοημοσύνης της Anthropic έχουν αναδειχθεί ως αγαπημένα μεταξύ προγραμματιστών και επιχειρήσεων, κυρίως λόγω των ισχυρών επιδόσεών τους σε εργασίες ανάπτυξης λογισμικού. Σύμφωνα με αναφορές, η Apple και η Meta χρησιμοποιούν εσωτερικά μοντέλα Claude AI, ενώ η Anthropic έχει αναπτύξει σημαντική επιχειρηματική δραστηριότητα παρέχοντας API πρόσβαση σε εφαρμογές AI προγραμματισμού όπως το Cursor, το Windsurf και το Replit. Πρόσφατα, το GPT-5 της OpenAI αμφισβήτησε την κυριαρχία της Anthropic στον τομέα αυτό, ξεπερνώντας τα μοντέλα Claude σε διάφορα benchmarks προγραμματισμού.

Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 προσφέρει κορυφαίες επιδόσεις σε διάφορα benchmarks κώδικα, συμπεριλαμβανομένου του SWE-Bench Verified. Ωστόσο, ο ερευνητής της Anthropic AI, David Hershey, δήλωσε στο TechCrunch ότι είναι δύσκολο να αποτυπωθεί η απόδοση του Claude Sonnet 4.5 μόνο μέσω benchmarks.

Ο Hershey ανέφερε ότι έχει δει το Claude Sonnet 4.5 να προγραμματίζει αυτόνομα για έως και 30 ώρες κατά τη διάρκεια πρώιμων δοκιμών με ορισμένους εταιρκούς πελάτες. Σε αυτό το διάστημα, παρακολούθησε το μοντέλο AI όχι μόνο να δημιουργεί μια εφαρμογή, αλλά επίσης να στήνει υπηρεσίες βάσεων δεδομένων, να αγοράζει domains και να πραγματοποιεί έλεγχο SOC 2 για να διασφαλίσει την ασφάλεια του προϊόντος.

image.png.cfadaee09092d19dd1c98e155456bdbb.png

Σε δήλωσή του στο TechCrunch, ο Διευθύνων Σύμβουλος της Cursor, Michael Truell, ανέφερε ότι το Claude Sonnet 4.5 αντιπροσωπεύει κορυφαίες επιδόσεις στον προγραμματισμό, ειδικά σε εργασίες μεγαλύτερης διάρκειας. Ο Διευθύνων Σύμβουλος της Windsurf, Jeff Wang, δήλωσε ότι το Claude Sonnet 4.5 αντιπροσωπεύει μια "νέα γενιά μοντέλων προγραμματισμού".

Η Anthropic υποστηρίζει επίσης ότι το Claude Sonnet 4.5 είναι το πιο ευθυγραμμισμένο μοντέλο τεχνητής νοημοσύνης αιχμής της μέχρι σήμερα, με χαμηλότερα ποσοστά συκοφαντίας και παραπλάνησης σε σύγκριση με προηγούμενα μοντέλα. Η εταιρεία αναφέρει ότι έχει επίσης βελτιώσει την ευπάθεια του Claude σε επιθέσεις εισαγωγής προτροπών.

Παράλληλα με την κυκλοφορία του Claude Sonnet 4.5, η Anthropic λανσάρει επίσης το Claude Agent SDK. Η εταιρεία αναφέρει ότι πρόκειται για την ίδια υποδομή που τροφοδοτεί το Claude Code και μπορεί να χρησιμοποιηθεί για να βοηθήσει τους προγραμματιστές να δημιουργήσουν τους δικούς τους agents.

Η Anthropic κυκλοφορεί επίσης μια προσωρινή ερευνητική προεπισκόπηση με την ονομασία "Imagine with Claude" για συνδρομητές Max, η οποία δείχνει το μοντέλο AI να δημιουργεί λογισμικό σε πραγματικό χρόνο. Η εταιρεία αναφέρει ότι το μοντέλο θα ανταποκρίνεται στα αιτήματα των χρηστών σε πραγματικό χρόνο, χωρίς προκαθορισμένη λειτουργικότητα ή προγεγραμμένο κώδικα.

Ο έντονος ανταγωνισμός στον κόσμο της τεχνητής νοημοσύνης έχει καταστήσει σύνηθες για τις εταιρείες να κυκλοφορούν ναυαρχίδες μοντέλα κάθε λίγους μήνες. Το Claude Sonnet 4.5 κυκλοφορεί λιγότερο από δύο μήνες μετά το τελευταίο μοντέλο τεχνητής νοημοσύνης της Anthropic, το Claude Opus 4.1. Αυτοί οι γρήγοροι κύκλοι παραγωγής καθιστούν δύσκολο για οποιαδήποτε εταιρεία να διατηρήσει ένα ουσιαστικό προβάδισμα για πολύ καιρό.


Διαβάστε ολόκληρο το άρθρο

Δημοσ.

Βρήκα ένα honest review εδώ:

https://every.to/vibe-check/vibe-check-claude-sonnet-4-5

Σε γενικές γραμμές λένε πολύ καλά λόγια.

Ωστόσο σήμερα το πρωί το δοκίμασα σε ενα μικρό snippet κώδικα (Rails controller) και του ζήτησα να μου κάνει refactor ένα απο τα actions προκειμένου να γίνει πιο "καθαρό" και "maintainable". -Μεταξύ άλλων- μου πρότεινε να τρέξω ένα υφιστάμενο private method απευθείας απο το view template χωρίς όμως να είναι marked ως helper method. Μόλις επεσήμανα το λάθος γύρισε στα κλασσικά: "You're absolute right. yada yada yada".

Αντιλαμβάνομαι ότι απο μόνο του δεν σημαίνει κάτι αυτό απλά παραθέτω την προσωπική μου εμπειρία χρήσης 🙏

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...