Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Η Anthropic κυκλοφόρησε τη Δευτέρα ένα νέο μοντέλο τεχνητής νοημοσύνης, το Claude Sonnet 4.5, το οποίο σύμφωνα με την εταιρεία προσφέρει κορυφαίες επιδόσεις σε εργασίες προγραμματισμού.

Η εταιρεία υποστηρίζει ότι το Claude Sonnet 4.5 μπορεί να δημιουργήσει εφαρμογές "έτοιμες για παραγωγή" αντί για απλά πρωτότυπα, αντιπροσωπεύοντας ένα σημαντικό άλμα σε αξιοπιστία σε σύγκριση με προηγούμενα μοντέλα τεχνητής νοημοσύνης.

Το Claude Sonnet 4.5 θα είναι διαθέσιμο μέσω του Claude API και στο Claude chatbot. Η τιμολόγηση για τους προγραμματιστές είναι ίδια με αυτή του Claude Sonnet 4: 3 δολάρια ανά εκατομμύριο tokens εισόδου (περίπου 750.000 λέξεις, ή περισσότερες από ολόκληρη τη σειρά "Ο Άρχοντας των Δαχτυλιδιών") και 15 δολάρια ανά εκατομμύριο tokens εξόδου.


image.png.51de810cfe648969f966d074d884d27f.png
Τον τελευταίο χρόνο, τα μοντέλα τεχνητής νοημοσύνης της Anthropic έχουν αναδειχθεί ως αγαπημένα μεταξύ προγραμματιστών και επιχειρήσεων, κυρίως λόγω των ισχυρών επιδόσεών τους σε εργασίες ανάπτυξης λογισμικού. Σύμφωνα με αναφορές, η Apple και η Meta χρησιμοποιούν εσωτερικά μοντέλα Claude AI, ενώ η Anthropic έχει αναπτύξει σημαντική επιχειρηματική δραστηριότητα παρέχοντας API πρόσβαση σε εφαρμογές AI προγραμματισμού όπως το Cursor, το Windsurf και το Replit. Πρόσφατα, το GPT-5 της OpenAI αμφισβήτησε την κυριαρχία της Anthropic στον τομέα αυτό, ξεπερνώντας τα μοντέλα Claude σε διάφορα benchmarks προγραμματισμού.

Η Anthropic υποστηρίζει ότι το Claude Sonnet 4.5 προσφέρει κορυφαίες επιδόσεις σε διάφορα benchmarks κώδικα, συμπεριλαμβανομένου του SWE-Bench Verified. Ωστόσο, ο ερευνητής της Anthropic AI, David Hershey, δήλωσε στο TechCrunch ότι είναι δύσκολο να αποτυπωθεί η απόδοση του Claude Sonnet 4.5 μόνο μέσω benchmarks.

Ο Hershey ανέφερε ότι έχει δει το Claude Sonnet 4.5 να προγραμματίζει αυτόνομα για έως και 30 ώρες κατά τη διάρκεια πρώιμων δοκιμών με ορισμένους εταιρκούς πελάτες. Σε αυτό το διάστημα, παρακολούθησε το μοντέλο AI όχι μόνο να δημιουργεί μια εφαρμογή, αλλά επίσης να στήνει υπηρεσίες βάσεων δεδομένων, να αγοράζει domains και να πραγματοποιεί έλεγχο SOC 2 για να διασφαλίσει την ασφάλεια του προϊόντος.

image.png.cfadaee09092d19dd1c98e155456bdbb.png

Σε δήλωσή του στο TechCrunch, ο Διευθύνων Σύμβουλος της Cursor, Michael Truell, ανέφερε ότι το Claude Sonnet 4.5 αντιπροσωπεύει κορυφαίες επιδόσεις στον προγραμματισμό, ειδικά σε εργασίες μεγαλύτερης διάρκειας. Ο Διευθύνων Σύμβουλος της Windsurf, Jeff Wang, δήλωσε ότι το Claude Sonnet 4.5 αντιπροσωπεύει μια "νέα γενιά μοντέλων προγραμματισμού".

Η Anthropic υποστηρίζει επίσης ότι το Claude Sonnet 4.5 είναι το πιο ευθυγραμμισμένο μοντέλο τεχνητής νοημοσύνης αιχμής της μέχρι σήμερα, με χαμηλότερα ποσοστά συκοφαντίας και παραπλάνησης σε σύγκριση με προηγούμενα μοντέλα. Η εταιρεία αναφέρει ότι έχει επίσης βελτιώσει την ευπάθεια του Claude σε επιθέσεις εισαγωγής προτροπών.

Παράλληλα με την κυκλοφορία του Claude Sonnet 4.5, η Anthropic λανσάρει επίσης το Claude Agent SDK. Η εταιρεία αναφέρει ότι πρόκειται για την ίδια υποδομή που τροφοδοτεί το Claude Code και μπορεί να χρησιμοποιηθεί για να βοηθήσει τους προγραμματιστές να δημιουργήσουν τους δικούς τους agents.

Η Anthropic κυκλοφορεί επίσης μια προσωρινή ερευνητική προεπισκόπηση με την ονομασία "Imagine with Claude" για συνδρομητές Max, η οποία δείχνει το μοντέλο AI να δημιουργεί λογισμικό σε πραγματικό χρόνο. Η εταιρεία αναφέρει ότι το μοντέλο θα ανταποκρίνεται στα αιτήματα των χρηστών σε πραγματικό χρόνο, χωρίς προκαθορισμένη λειτουργικότητα ή προγεγραμμένο κώδικα.

Ο έντονος ανταγωνισμός στον κόσμο της τεχνητής νοημοσύνης έχει καταστήσει σύνηθες για τις εταιρείες να κυκλοφορούν ναυαρχίδες μοντέλα κάθε λίγους μήνες. Το Claude Sonnet 4.5 κυκλοφορεί λιγότερο από δύο μήνες μετά το τελευταίο μοντέλο τεχνητής νοημοσύνης της Anthropic, το Claude Opus 4.1. Αυτοί οι γρήγοροι κύκλοι παραγωγής καθιστούν δύσκολο για οποιαδήποτε εταιρεία να διατηρήσει ένα ουσιαστικό προβάδισμα για πολύ καιρό.


Διαβάστε ολόκληρο το άρθρο

Δημοσ.

Βρήκα ένα honest review εδώ:

https://every.to/vibe-check/vibe-check-claude-sonnet-4-5

Σε γενικές γραμμές λένε πολύ καλά λόγια.

Ωστόσο σήμερα το πρωί το δοκίμασα σε ενα μικρό snippet κώδικα (Rails controller) και του ζήτησα να μου κάνει refactor ένα απο τα actions προκειμένου να γίνει πιο "καθαρό" και "maintainable". -Μεταξύ άλλων- μου πρότεινε να τρέξω ένα υφιστάμενο private method απευθείας απο το view template χωρίς όμως να είναι marked ως helper method. Μόλις επεσήμανα το λάθος γύρισε στα κλασσικά: "You're absolute right. yada yada yada".

Αντιλαμβάνομαι ότι απο μόνο του δεν σημαίνει κάτι αυτό απλά παραθέτω την προσωπική μου εμπειρία χρήσης 🙏

  • Like 1
Δημοσ.

Άντε να δούμε...! Το 4 πάντως ήταν μια απελπισία (σε αντίθεση με το 3.7 που ήταν εξαιρετικό. 4 στις 5 φορές το 3.7 θα χρησιμοποιήσω, και ας πληρώνω για το 4)

Δημοσ.

Ας το ενσωματώσει τουλάχιστον γρήγορα στο Claude code να μην πληρώνουμε τσάμπα συνδρομή. Ενημερωτικά για όσους σκέφτονται το pro γράφεις 10 μηνύματα και σε πιάνει το όριο των 5ωρων. Άσε που γεμιζει πολύ γρήγορα η συνομιλία. Σαν πρωτοτυπία σε ιδέες πάντως το αναγνωρίζω. Στη συνέχεια codex ότι και αν λέμε τα bechmarks

Δημοσ.
4 λεπτά πριν, giokspy είπε

Ας το ενσωματώσει τουλάχιστον γρήγορα στο Claude code να μην πληρώνουμε τσάμπα συνδρομή. Ενημερωτικά για όσους σκέφτονται το pro γράφεις 10 μηνύματα και σε πιάνει το όριο των 5ωρων. Άσε που γεμιζει πολύ γρήγορα η συνομιλία. Σαν πρωτοτυπία σε ιδέες πάντως το αναγνωρίζω. Στη συνέχεια codex ότι και αν λέμε τα bechmarks

Ενδιαφέρον. Prompts στο Claude Code ή από το web ui? Δεν έχω δοκιμάσει το Claude Code ακόμα και το σκεφτόμουν.

Στην αρχή είχα το aider μετά το γύρισα στο sst/opencode και με καλύπτει αρκετά. Μέχρι πριν ένα μήνα έβαζα € σε APIs από διάφορους providers ή έπαιζα με μεγάλα local μοντέλα για sensitive δουλειές. Έκανα την συνδρομή για να δοκιμάσω το Pro γιατί παιζει και με την συνδρομή στο opencode. 

To έχω με το μαστίγιο σε μεγάλα codebases και μια φορά έπιασα το limit του pro από χαζομάρα μου (κακό config σε mcp). Βέβαια συνήθως αν ξέρω το codebase αποφεύγω να το αφήσω να δουλέψει μόνο του δίνω καθοδήγηση και αρκετό context για να μην κάνει άσκοπα requests (και καλή πρακτική για τα APIs).

Δημοσ.

Πάνω κάτω όλα τα ίδια είναι... από εμάς εξαρτάται ;). Το θέμα είναι να γράφουν γρήγορα κώδικα. Τουλάχιστον 2000 γραμμές ανά λεπτό!

Δημοσ.
2 ώρες πριν, latch είπε

Ενδιαφέρον. Prompts στο Claude Code ή από το web ui? Δεν έχω δοκιμάσει το Claude Code ακόμα και το σκεφτόμουν.

Στην αρχή είχα το aider μετά το γύρισα στο sst/opencode και με καλύπτει αρκετά. Μέχρι πριν ένα μήνα έβαζα € σε APIs από διάφορους providers ή έπαιζα με μεγάλα local μοντέλα για sensitive δουλειές. Έκανα την συνδρομή για να δοκιμάσω το Pro γιατί παιζει και με την συνδρομή στο opencode. 

To έχω με το μαστίγιο σε μεγάλα codebases και μια φορά έπιασα το limit του pro από χαζομάρα μου (κακό config σε mcp). Βέβαια συνήθως αν ξέρω το codebase αποφεύγω να το αφήσω να δουλέψει μόνο του δίνω καθοδήγηση και αρκετό context για να μην κάνει άσκοπα requests (και καλή πρακτική για τα APIs).

Είναι αρκετά καλό αλλά και πάλι έχει αυτό το 5hours limit. Παλιότερα που δεν είχε ήταν άψογο. Χρησιμοποιεί βέβαια sonnet 4.0 αλλά λογικά σύντομα θα βάλει το 4.5. Λειτουργεί και πολύ καλά ως agent. Μου έκανε φοβερή δουλειά σε μια εργασία που έφτιαχνε ετρεχε Matlab ενανε ανάλυση σε R και έβγαζε αποτελέσματα έγραφε .md και .csv και πολλά άλλα. Τα κάνει βέβαια και το codex πλέον αλλά όχι καλύτερα 

Δημοσ.
Στις 30/9/2025 στις 10:49 ΠΜ, Huruduru είπε

spacer.png

Φούσκα ή μη, μπορώ και προγραμματίζω μέσω ιδεών για να κάνω τι ζωή μου ευκολότερη και ποιο αποδοτική. Φτιάχνω προγράμματα για τη μείωση χρήσης RAM, και αποθηκευτικού χώρου κατά κύριο λόγο χωρίς ιδιαίτερες γνώσεις προγραμματισμού. Μέτρον άριστων.

Δημοσ.
6 λεπτά πριν, KostasKoja είπε

Φούσκα ή μη, μπορώ και προγραμματίζω μέσω ιδεών για να κάνω τι ζωή μου ευκολότερη και ποιο αποδοτική. Φτιάχνω προγράμματα για τη μείωση χρήσης RAM, και αποθηκευτικού χώρου κατά κύριο λόγο χωρίς ιδιαίτερες γνώσεις προγραμματισμού. Μέτρον άριστων.

Οπότε δεν γνωρίζεις αν ο κώδικας που σου έδωσε έχει Bug ή κενά ασφαλείας. Καλύτερα να αφιέρωνες χρόνο να μάθεις να προγραμματίζεις.

Δημοσ.
10 ώρες πριν, Huruduru είπε

Οπότε δεν γνωρίζεις αν ο κώδικας που σου έδωσε έχει Bug ή κενά ασφαλείας. Καλύτερα να αφιέρωνες χρόνο να μάθεις να προγραμματίζεις.

Εδώ πέφτουμε σε ένα ελάττωμα μου. Έχεις δίκιο, ωστόσο νιώθω απλά βαρεμάρα όταν στα tutorial αρχίζουν από το πως θα φτιάχνω ανούσιες αριθμομηχανές. Αυτός δεν είναι ο σκοπός μου και κάπως χάνεται η ουσία στο μυαλό μου. Οπότε μπορώ να ζητήσω από την τεχνητή νοημοσύνη να κάνει τον μεταφραστεί. Οπότε κάνω ένα έτοιμα με λεπτομέρεια και έπειτα τεστάρω. Αν βρω λάθει τα σημειώνω και τα επισυνάπτω στην τεχνητή νοημοσύνη αν δουλεύει προσπαθώ να βρω τρόπους για να κάνω το πρόγραμμα ποίο γρήγορο και αποδοτικότερο. 

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...