Το Google Gemini προκαλεί το GPT-4: μονομαχία τεχνητής νοημοσύνης για τεχνολογική ηγεμονία

24 Φεβρουαρίου 2024

By aurora

Με την πρόοδο των τεχνολογιών τεχνητής νοημοσύνης, το Google Gemini και η χρήση του μοντέλου GPT-4 της OpenAI αποτελούν δύο από τις πιο προηγμένες λύσεις που είναι διαθέσιμες σήμερα. Και οι δύο αυτές τεχνητές νοημοσύνες είναι σε θέση να κατανοούν και να αλληλεπιδρούν με κείμενο, εικόνες, βίντεο, ήχο και κώδικα, παρέχοντας δεξιότητες που θα ήταν δαπανηρό να αναπαραχθούν με έναν ανθρώπινο εμπειρογνώμονα.

Διαθεσιμότητα και τιμολόγηση

Επί του παρόντος, το Google Gemini είναι διαθέσιμο στις εκδόσεις Pro και Nano, ενώ η έκδοση Ultra δεν έχει κυκλοφορήσει ακόμη. Το Gemini Pro είναι ελεύθερα προσβάσιμο μέσω του Bard, απαιτώντας μόνο έναν λογαριασμό Google. Από την άλλη πλευρά, το GPT-4 είναι διαθέσιμο μέσωσυνδρομής στο GPT-Plus ως μέρος του εργαλείου ChatGPT, με κόστος 20 δολάρια το μήνα.

Είναι σημαντικό ότι, παρόλο που το Gemini Pro είναι μια αποτελεσματική μορφή ΤΝ, δεν είναι η τελική μορφή. Η Google έχει υποσχεθεί να κυκλοφορήσει το Gemini Ultra στο μέλλον, το οποίο θα πρέπει να είναι η πιο προηγμένη λύση AI. Έχει επίσης κυκλοφορήσει το Gemini Nano, το οποίο τρέχει τοπικά σε ορισμένα smartphones και έχει μειωμένο σύνολο λειτουργιών, που χρησιμοποιείται κυρίως για εργαλεία σύνθεσης κειμένου και διόρθωσης.

Λειτουργικότητα

ΤοGemini και το GPT-4 έχουν πολύ παρόμοια σύνολα λειτουργιών. Και τα δύο μπορούν να αλληλεπιδρούν και να ερμηνεύουν κείμενο, εικόνες, βίντεο, ήχο και κώδικα, επιτρέποντας τη χρήση τους για ένα ευρύ φάσμα εργασιών. Μπορείτε να έχετε γενικές συζητήσεις ή να κάνετε ερωτήσεις σε οποιοδήποτε από τα chatbot, να τα βάλετε να αναλύσουν μια εικόνα των συστατικών στο ντουλάπι σας και να σας προτείνουν μια συνταγή με βάση αυτή, να εκτιμήσετε πόσοι άνθρωποι βρίσκονται σε ένα βίντεο πλήθους ή να σας κάνουν προτάσεις για το πώς να βελτιστοποιήσετε τον κώδικά σας ώστε να γίνει πιο αποδοτικός.

Το Gemini μπορεί να αξιοποιήσει επεκτάσεις όπως οι πτήσεις Google, τα ξενοδοχεία, οι χάρτες, το YouTube και η σειρά εφαρμογών Google Workspace, επιτρέποντας στους χρήστες να αλληλεπιδρούν με έγγραφα, να βρίσκουν δεδομένα σε πραγματικό χρόνο για πτήσεις και ξενοδοχεία και πολλά άλλα. Από την άλλη πλευρά, το GPT-4 διαθέτει ένα πολύ ευρύτερο φάσμα πρόσθετων και επεκτάσεων, πολλές από τις οποίες έχουν αναπτυχθεί από τρίτους. Ενώ ορισμένες από αυτές τις λειτουργίες ενσωματώνονται στο GPT-4 με ενημερώσεις, υπάρχουν πολλές επεκτάσεις τρίτων που μπορούν να βοηθήσουν στις αγορές, στους προηγμένους μαθηματικούς υπολογισμούς, στην ενσωμάτωση με χιλιάδες άλλες εφαρμογές και στην κράτηση τραπεζιών σε εστιατόρια. Υπάρχουν επίσης πρόσθετα που βοηθούν στη συγγραφή καλύτερων προτροπών.

Όσον αφορά την προσαρμογή, το GPT-4 πλεονεκτεί έναντι του Gemini. Σας επιτρέπει να δημιουργήσετε προσαρμοσμένες εκδόσεις του GPT-4 για να το εστιάσετε σε συγκεκριμένες εργασίες, αποφεύγοντας την ανάγκη επανάληψης των προτροπών κατά την επιστροφή στη συνομιλία αργότερα. Το Gemini σας επιτρέπει να ξεκινήσετε νέες συνομιλίες, αλλά δεν προσφέρει προς το παρόν επιλογές προσαρμογής.

Το GPT-4 μπορεί επίσης να δημιουργεί εικόνες εν κινήσει, ενώ το Gemini έχει σχεδιαστεί για να το κάνει αυτό, αλλά προς το παρόν δεν είναι ακόμη σε θέση να το κάνει. Το GPT-4 περιλαμβάνει το Dall-E 3, οπότε αν έχετε ήδη συνδρομή στο GPT-Plus, δεν χρειάζεται να πληρώσετε ξεχωριστή συνδρομή για τη δημιουργία εικόνων.

Σύγκριση των Gemini και GPT-4

Όταν η Google παρουσίασε το Gemini, τόνισε πώς το μοντέλο Pro μπορούσε να ξεπεράσει το GPT-4 σε διάφορα benchmarks και εφαρμογές τεχνητής νοημοσύνης, συμπεριλαμβανομένης της ικανότητας συλλογισμού. Ωστόσο, η δοκιμή αυτή στον πραγματικό κόσμο είναι πιο περίπλοκη, καθώς και οι δύο τεχνητές νοημοσύνες παρέχουν εντυπωσιακές απαντήσεις στις ίδιες ερωτήσεις, είτε πρόκειται για κείμενο, εικόνες, βίντεο ή κώδικα.

Προσωπικά, έχω διαπιστώσει ότι τόσο ο Gemini όσο και ο GPT-4 είναιχρήσιμοι για ερωτήσεις που σχετίζονται με τον προγραμματισμό παιχνιδιών και λειτουργούν καλά ως συνομιλητικά chatbots. Παρ’ όλα αυτά, το Gemini φαίνεται να έχει προγραμματιστεί να αποφεύγει συζητήσεις ή αλληλεπιδράσεις με εικόνες συγκεκριμένων ανθρώπων. Δεν μπόρεσε να αναγνωρίσει τα ρούχα μιας διασημότητας που του έδειξα και όταν τον ρώτησα για μένα, δεν μπόρεσε να μου πει πολλά. Ο GPT-4 δεν παρουσίασε τέτοιου είδους περιορισμούς.

Ο Δίδυμος προσφέρει τη δυνατότητα επαλήθευσης των παρεχόμενων πληροφοριών, ενώ ο GPT-4 επισυνάπτει συνδέσμους με πηγές για τους ισχυρισμούς που διατυπώνονται. Όπως έχουν τα πράγματα, το GPT-4 φαίνεται να πλεονεκτεί, καθώς είναι ένα πιο ολοκληρωμένο εργαλείο με ανώτερες δυνατότητες λόγω των προσαρμοσμένων plug-ins και των chatbots. Το Gemini φαίνεται εξίσου ικανό όσον αφορά τις βασικές δεξιότητες και ανταποκρίνεται γρήγορα, αλλά δεν διαθέτει ακόμη όλες τις λειτουργίες του GPT-4. Θα πρέπει να περιμένουμε τη διαθεσιμότητα του Gemini Ultra για να μπορέσουμε να κάνουμε περαιτέρω αξιολογήσεις σχετικά με την ενσωμάτωση της ΤΝ της Google.