Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Η OpenAI κυκλοφόρησε ένα νέο μοντέλο ανοιχτού κώδικα με την ονομασία GPT-OSS, το οποίο μπορεί να γίνει download απολύτως δωρεάν, να προσαρμοστεί και να λειτουργήσει ακόμη και σε ένα φορητό υπολογιστή.

Το μοντέλο διατίθεται σε δύο εκδόσεις: μία με 120 δισεκατομμύρια παραμέτρους και μία με 20 δισεκατομμύρια παραμέτρους. Η μεγαλύτερη έκδοση μπορεί να λειτουργήσει σε μία μόνο GPU της Nvidia και έχει παρόμοια απόδοση με το υπάρχον μοντέλο o4-mini της OpenAI, ενώ η μικρότερη έκδοση αποδίδει παρόμοια με το o3-mini και λειτουργεί με μόλις 16GB μνήμης. Και οι δύο εκδόσεις κυκλοφορούν σήμερα μέσω πλατφορμών όπως το Hugging Face, το Databricks, το Azure και το AWS με άδεια Apache 2.0, η οποία επιτρέπει την ευρεία τροποποίησή τους για εμπορικούς σκοπούς.

Αυτό είναι το πρώτο μοντέλο ανοιχτού κώδικα της OpenAI εδώ και περισσότερα από έξι χρόνια, χρόνια πριν από το ντεμπούτο του ChatGPT. Μέχρι τις αρχές αυτού του έτους, ο CEO Sam Altman ανέφερε τις ανησυχίες για την ασφάλεια ως τον κύριο λόγο για τη μη κυκλοφορία ενός επόμενου μοντέλου. Εν τω μεταξύ, οι προγραμματιστές έχουν στραφεί στα ανοιχτά μοντέλα λόγω του χαμηλότερου κόστους και της δυνατότητας προσαρμογής. Τον Ιανουάριο, μετά την άνοδο της DeepSeek, ο Altman δήλωσε ότι η OpenAI "ήταν στη λάθος πλευρά της ιστορίας" επειδή δεν κυκλοφόρησε τα δικά της ανοιχτά μοντέλα.

Τώρα, η OpenAI επανέρχεται με ένα μοντέλο ανοιχτού κώδικα που, σύμφωνα με την εταιρεία, μπορεί να εκτελέσει εργασίες συλλογισμού, να περιηγηθεί στο διαδίκτυο, να γράψει κώδικα και να υ agents μέσω των υπαρχόντων API της εταιρείας. "Νομίζω ότι πολλοί άνθρωποι εκπλήσσονται όταν μαθαίνουν ότι η συντριπτική πλειοψηφία των πελατών μας χρησιμοποιούν ήδη πολλά ανοιχτά μοντέλα", δήλωσε ο Chris Cook, ερευνητής της OpenAI, κατά τη διάρκεια ενημέρωσης των μέσων ενημέρωσης. "Θέλαμε να καλύψουμε αυτό το κενό και να τους επιτρέψουμε να χρησιμοποιούν την τεχνολογία μας σε όλο το φάσμα."

chart.jpeg.2fc5d72b7f7037540b79983e64487fc7.jpeg

Όσον αφορά την ασφάλεια, η OpenAI υποστηρίζει ότι το GPT-OSS είναι το πιο αυστηρά ελεγμένο μοντέλο της μέχρι σήμερα και ότι δοκιμάστηκε με εξωτερικές εταιρείες ασφαλείας για να διασφαλιστεί ότι δεν ενέχει κινδύνους σε τομείς όπως η κυβερνοασφάλεια και τα βιολογικά όπλα. Η αλυσίδα σκέψης του μοντέλου, ή η ορατή διαδικασία που χρησιμοποιείται για να καταλήξει σε μια απάντηση, εμφανίζεται "για την παρακολούθηση της κακής συμπεριφοράς, της εξαπάτησης και της κατάχρησης του μοντέλου", σύμφωνα με δελτίο τύπου της εταιρείας. Η έξοδός του είναι μόνο κείμενο και, όπως όλα τα μοντέλα της OpenAI, τα δεδομένα εκπαίδευσης του GPT-OSS δεν αποκαλύπτονται.

"Η ομάδα πραγματικά έδωσε τον καλύτερο εαυτό της με αυτό", δήλωσε ο συνιδρυτής της OpenAI Greg Brockman. Η OpenAI δεν έχει μοιραστεί συγκριτικά στοιχεία του GPT-OSS με άλλα ανοιχτά μοντέλα όπως το Llama, το DeepSeek ή το Gemma της Google. Και οι δύο εκδόσεις του GPT-OSS αποδίδουν παρόμοια με τα κλειστά μοντέλα συλλογισμού της OpenAI σε εργασίες προγραμματισμο΄θ και δοκιμές όπως το Humanity's Last Exam.

chart(1).png.6634639979a6f0a1f2dbfb62fbbad4ab.png

Η OpenAI δεν δεσμεύεται για ένα χρονοδιάγραμμα κυκλοφορίας μελλοντικών εκδόσεων του GPT-OSS, αλλά ελπίζει ότι το μοντέλο θα χρησιμοποιηθεί από μικρότερους προγραμματιστές και εταιρείες που θέλουν μεγαλύτερο έλεγχο στον τρόπο με τον οποίο χρησιμοποιούνται τα δεδομένα τους. "Πάντα πιστεύαμε ότι αν χαμηλώσεις το εμπόδιο για την πρόσβαση, τότε η καινοτομία απλά αυξάνεται", δήλωσε ο Brockman. "Αφήνεις τους ανθρώπους να πειραματιστούν, και θα κάνουν πράγματα που είναι απίστευτα εκπληκτικά."

Η OpenAI έχει το αμέσως επόμενο διάστημα σημαντικές κυκλοφορίες, με αυτή του GPT-5 την προσεχή Πέμπτη να αναμένεται με αγωνία.


View full article

Δημοσ.

λογικά θα περάσει απαρατήρητο για τους περισσότερους αλλά για εμας που φτιαχνουμε διάφορα πραγματάκια με LLM, σήμερα είναι ωραία ημέρα! 

  • Like 7
Δημοσ.

Η OpenAI μόλις άφησε το GPT-OSS ελεύθερο να τρέξει σε φορητό υπολογιστή, τώρα μόνο το laptop μου μένει να αποκτήσει IQ όσο το δικό τους μοντέλο! 😂

Δημοσ.
18 hours ago, theodoros8 said:

λογικά θα περάσει απαρατήρητο για τους περισσότερους αλλά για εμας που φτιαχνουμε διάφορα πραγματάκια με LLM, σήμερα είναι ωραία ημέρα! 

Χοντρικά τι μπορείς να κάνεις καλύτερα σε σχέση με ένα μοντέλο της anthropic αν το τρέξεις locally? ποιο ειναι το use case σου? Είναι μόνο λόγω κόστους, privacy ή κάτι άλλο. Ρεαλιστικά τι μηχάνημα χρειάζεσαι για να μπορέσεις να τρέξεις κάτι τέτοιο, και χρειάζεται 24/7?

Δημοσ.
1 ώρα πριν, JimGer είπε

Χοντρικά τι μπορείς να κάνεις καλύτερα σε σχέση με ένα μοντέλο της anthropic αν το τρέξεις locally? ποιο ειναι το use case σου? Είναι μόνο λόγω κόστους, privacy ή κάτι άλλο. Ρεαλιστικά τι μηχάνημα χρειάζεσαι για να μπορέσεις να τρέξεις κάτι τέτοιο, και χρειάζεται 24/7?

Κυρίως privacy και customizability.θες Nvidia GPU τουλάχιστον 16 gb vram.ιδανικα παραπάνω για να τρέξεις πιο σοβαρά μοντέλα.το έχεις ανοιχτό όσο το χρειάζεσαι.ειναι σαφώς φτηνότερο από 20 ευρώ το μήνα που κοστίζει σήμερα μια συνδρομή σε cloud llm.καποια μοντέλα έχουν reasoning και vision αλλά η πρόσβαση στο διαδίκτυο είναι πιο tricky.προσωπικα προτιμώ perplexity για cloud και Gemma 3 τοπικά πάνω σε lm studio.

  • Like 1
Δημοσ.
2 minutes ago, s1nestro said:

Κυρίως privacy και customizability.θες Nvidia GPU τουλάχιστον 16 gb vram.ιδανικα παραπάνω για να τρέξεις πιο σοβαρά μοντέλα.το έχεις ανοιχτό όσο το χρειάζεσαι.ειναι σαφώς φτηνότερο από 20 ευρώ το μήνα που κοστίζει σήμερα μια συνδρομή σε cloud llm.καποια μοντέλα έχουν reasoning και vision αλλά η πρόσβαση στο διαδίκτυο είναι πιο tricky.προσωπικα προτιμώ perplexity για cloud και Gemma 3 τοπικά πάνω σε lm studio.

Thanks. Τα μισά δεν τα κατάλαβα. Βγάζοντας το κομμάτι του privacy στην άκρη ας πούμε, με ένα perpelexity pro με το spaces Κλπ δεν βγάζεις συμπαθητική άκρη? Επίσης στο personal llm πως είναι πχ για κώδικα?

Δημοσ.
25 λεπτά πριν, JimGer είπε

Thanks. Τα μισά δεν τα κατάλαβα. Βγάζοντας το κομμάτι του privacy στην άκρη ας πούμε, με ένα perpelexity pro με το spaces Κλπ δεν βγάζεις συμπαθητική άκρη? Επίσης στο personal llm πως είναι πχ για κώδικα?

Για μικρά προγράμματα είναι τίμιο.γενικα είναι ακριβώς όπως τα cloud μοντέλα αλλά με μικρότερο context window και χωρίς δυνατότητα web search.ωστοσο αν στη δουλειά δεν επιτρέπουν cloud llm πχ λόγω copyright τότε είναι μονοδρομος.κατεβασε lm studio και πειραματισου λίγο σου έχει έτοιμα τα μοντέλα για download.χρησιμοποιησε chat perplexity Gemini ή grok για να τα setareis πιο εύκολα.μεχρι να βρεις τι σου κάνει.μεχρι 100gb δίσκο θες εφόσον έχεις κατάλληλη Nvidia GPU.το gpt oss είναι κι αυτό διαθέσιμο κάπου στα 12 gb για download.

Δημοσ.
23 minutes ago, s1nestro said:

Για μικρά προγράμματα είναι τίμιο.γενικα είναι ακριβώς όπως τα cloud μοντέλα αλλά με μικρότερο context window και χωρίς δυνατότητα web search.ωστοσο αν στη δουλειά δεν επιτρέπουν cloud llm πχ λόγω copyright τότε είναι μονοδρομος.κατεβασε lm studio και πειραματισου λίγο σου έχει έτοιμα τα μοντέλα για download.χρησιμοποιησε chat perplexity Gemini ή grok για να τα setareis πιο εύκολα.μεχρι να βρεις τι σου κάνει.μεχρι 100gb δίσκο θες εφόσον έχεις κατάλληλη Nvidia GPU.το gpt oss είναι κι αυτό διαθέσιμο κάπου στα 12 gb για download.

Thanks... Μπα έχω ένα mini pc dell με integrated gpu και ένα macbook air. Απλά ήθελα να δω μια συμβατική χρήση από κάποιον user (ίσως για το μέλλον). Στην δουλειά δεν αφήνουν τίποτα και στο σπίτι δεν έχω περιορισμούς. Οπότε μάλλον θα περιμένω ακόμα αν και εφόσον πάρω μηχάνημα και κυρίως βρω διάθεση να ασχοληθώ. Ίσως σε κάποια φάση θα μπορούσε να δημιουργηθεί κάποιο "μοντέλο" όπου το local training αν ήθελες θα το μοιραζόσουν χωρίς εταιρία από πίσω. Μπας και δηλαδή γλιτώσουμε το ολιγοπώλειο και κυρίως τη δύναμη που αποκτούν σιγά σιγά ιδιωτικές εταιρίες σε αυτον τον τομέα (δαπανώντας πολλά δις)

Δημοσ.

Κοίτα αν μιλάς για fine tuning προς το παρόν το ξεχνάς θέλει πολλή γνώση και κοστίζει σε εξοπλισμό και χρόνο.ψαξε για rag ή prompt tuning να δεις τι παίζει.

Δημοσ.

Επειδή πολλοί τα είπαν, θα σου πω το δικό μου use case: ΑΙ chatbot for medical purposes δλδ να διαχειριζεται ιατρικά δεδομένα. Κάτι τέτοιο στην ΕΕ θέλει DPA,GDPR και European data residency. 

Αν πας μέσω του API της OpenAI τότε τα δεδομένα σου πάνε USA το οποίο απαγορευεται απο την EE. Τότε θα ήθελες να κάνει αίτηση στην OpenAI για zero‑data‑retention αλλά και να χρησιμοποιήσεις ευρωπαικό API endpoint....ολα αυτά ειναι δύσκολα να γίνουν και θέλουν χρήμα.

Με το παραπάνω LLM, το τρέχεις local(local δλδ σε κάλο hardware και οχι στο pc μου) και γλυτώνεις πολύ χαρτούρα.

Οπως και να έχει μια καλή αρχή...

  • 2 εβδομάδες αργότερα...
Δημοσ. (επεξεργασμένο)

Είναι πραγματικά λοβοτομημένο σε πολλά θέματα. Έχει υψηλό ποσοστό άρνησης σε ερωτήσεις όπου η «κλειστού κώδικα» εναλλακτική της εταιρείας απαντάει πρόθυμα.

Χθες.. έδειξαν έναν τρόπο να το κάνουν jailbreak απλώς αφαιρώντας ένα prompt template.

 

https://github.com/RiddleHe/gpt-oss-alignment/blob/main/sample_gpt.ipynb

Επεξ/σία από daemonix
Δημοσ.
On 06/08/2025 at 16:54, JimGer said:

Χοντρικά τι μπορείς να κάνεις καλύτερα σε σχέση με ένα μοντέλο της anthropic αν το τρέξεις locally? ποιο ειναι το use case σου? Είναι μόνο λόγω κόστους, privacy ή κάτι άλλο. Ρεαλιστικά τι μηχάνημα χρειάζεσαι για να μπορέσεις να τρέξεις κάτι τέτοιο, και χρειάζεται 24/7?

Πιθανότατα να υπάρχει δυνατότητα για μη λογοκριμένα custom instructions

  • Like 1

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...