Οι εικονικοί βοηθοί είχαν περισσότερο από μια δεκαετία για να γίνουν απαραίτητοι. Αλλά δυσκολεύτηκαν από τον αδέξιο σχεδιασμό και τους λανθασμένους υπολογισμούς, αφήνοντας χώρο στα chatbots να ανέβουν.
…
Μια βροχερή Τρίτη στο Σαν Φρανσίσκο, στελέχη της Apple ανέβηκαν στη σκηνή σε ένα κατάμεστο αμφιθέατρο για να αποκαλύψουν το iPhone πέμπτης γενιάς. Το τηλέφωνο, το οποίο έμοιαζε πανομοιότυπο με την προηγούμενη έκδοση, είχε ένα νέο χαρακτηριστικό για το οποίο το κοινό φώναζε σύντομα: η Siri, ένας εικονικός βοηθός.
Ο Scott Forstall, τότε επικεφαλής λογισμικού της Apple, πάτησε ένα κουμπί iPhone για να καλέσει τη Siri και της υπέβαλε ερωτήσεις. Μετά από αίτημά του, η Siri έλεγξε την ώρα στο Παρίσι («8:16 μ.μ.», απάντησε η Siri), όρισε τη λέξη «μίτωση» («Κυτταρική διαίρεση στην οποία ο πυρήνας διαιρείται σε πυρήνες που περιέχουν τον ίδιο αριθμό χρωμοσωμάτων», είπε). Και συγκέντρωσε μια λίστα με 14 ελληνικά εστιατόρια με υψηλή βαθμολογία, πέντε από αυτά στο Palo Alto της Καλιφόρνια.
«Είμαι στον τομέα της τεχνητής νοημοσύνης για μεγάλο χρονικό διάστημα και αυτό εξακολουθεί να με εκνευρίζει», είπε ο κ. Forstall.
Αυτό ήταν πριν από 12 χρόνια. Έκτοτε, οι άνθρωποι απέχουν πολύ από το να ενθουσιαστούν από τη Siri και τους ανταγωνιστικούς βοηθούς που τροφοδοτούνται από τεχνητή νοημοσύνη, όπως η Alexa της Amazon και το Google Assistant. Η τεχνολογία έχει παραμείνει σε μεγάλο βαθμό στάσιμη και οι βοηθοί που μιλάνε έχουν γίνει το αστείο, συμπεριλαμβανομένου ενός σκίτσου του 2018 «Saturday Night Live» με ένα έξυπνο ηχείο για ηλικιωμένους.
Ο κόσμος της τεχνολογίας αναβλύζει τώρα πάνω από ένα διαφορετικό είδος εικονικού βοηθού: τα chatbots. Αυτά τα ρομπότ με τεχνητή νοημοσύνη, όπως το ChatGPT και το νέο ChatGPT Plus από την εταιρεία OpenAI του Σαν Φρανσίσκο, μπορούν να αυτοσχεδιάσουν απαντήσεις σε ερωτήσεις που πληκτρολογούνται σε ένα πλαίσιο συνομιλίας με οξυδέρκεια. Οι άνθρωποι έχουν χρησιμοποιήσει το ChatGPT για να χειριστούν περίπλοκες εργασίες όπως λογισμικό κωδικοποίησης, σύνταξη επιχειρηματικών προτάσεων και συγγραφή μυθοπλασίας.
Και το ChatGPT, το οποίο χρησιμοποιεί την τεχνητή νοημοσύνη για να μαντέψει ποια λέξη ακολουθεί, βελτιώνεται γρήγορα. Πριν από λίγους μήνες, δεν μπορούσε να γράψει ένα σωστό χαϊκού. Τώρα μπορεί να το κάνει με όρεξη. Την Τρίτη, το OpenAI αποκάλυψε τη μηχανή AI επόμενης γενιάς, GPT-4 , η οποία τροφοδοτεί το ChatGPT.
Ο ενθουσιασμός γύρω από τα chatbots δείχνει πώς η Siri, η Alexa και άλλοι βοηθοί φωνής – που κάποτε προκαλούσαν παρόμοιο ενθουσιασμό – έχουν χάσει το προβάδισμά τους στον αγώνα της τεχνητής νοημοσύνης.
Την τελευταία δεκαετία, τα προϊόντα έπεσαν σε εμπόδια. Η Siri αντιμετώπισε τεχνολογικά εμπόδια, συμπεριλαμβανομένου του άβολου κώδικα που χρειάστηκαν εβδομάδες για να ενημερωθεί με βασικά χαρακτηριστικά, είπε ο John Burkey, πρώην μηχανικός της Apple που εργάστηκε στον βοηθό. Η Amazon και η Google υπολόγισαν εσφαλμένα τον τρόπο χρήσης των φωνητικών βοηθών, οδηγώντας τις να επενδύσουν σε τομείς με την τεχνολογία που σπάνια απέδιδε, δήλωσαν πρώην υπάλληλοι. Όταν αυτά τα πειράματα απέτυχαν, ο ενθουσιασμός για την τεχνολογία μειώθηκε στις εταιρείες, είπαν.
Οι βοηθοί φωνής είναι «χαζοί σαν βράχος», είπε ο Σάτια Ναντέλα, διευθύνων σύμβουλος της Microsoft, σε συνέντευξή του αυτό το μήνα στους Financial Times, δηλώνοντας ότι η νεότερη τεχνητή νοημοσύνη θα πρωτοστατήσει. Η Microsoft έχει συνεργαστεί στενά με το OpenAI, επενδύοντας 13 δισεκατομμύρια δολάρια στην εκκίνηση και ενσωματώνοντας την τεχνολογία της στη μηχανή αναζήτησης Bing, καθώς και σε άλλα προϊόντα.
Η Apple αρνήθηκε να σχολιάσει το Siri. Η Google δήλωσε ότι δεσμεύτηκε να παρέχει έναν εξαιρετικό εικονικό βοηθό για να βοηθά τους ανθρώπους στα τηλέφωνά τους και μέσα στα σπίτια και τα αυτοκίνητά τους. Η εταιρεία δοκιμάζει ξεχωριστά ένα chatbot που ονομάζεται Bard. Η Amazon είπε ότι είδε μια αύξηση 30 τοις εκατό στην αφοσίωση των πελατών παγκοσμίως με την Alexa τον περασμένο χρόνο και ότι ήταν αισιόδοξη για την αποστολή της να δημιουργήσει AI παγκόσμιας κλάσης
Οι βοηθοί και τα chatbot βασίζονται σε διαφορετικές εκδοχές της AI. Τα Chatbots τροφοδοτούνται από τα γνωστά μοντέλα μεγάλων γλωσσών, τα οποία είναι συστήματα εκπαιδευμένα να αναγνωρίζουν και να δημιουργούν κείμενο με βάση τεράστια σύνολα δεδομένων που έχουν αφαιρεθεί από τον ιστό. Στη συνέχεια μπορούν να προτείνουν λέξεις για να συμπληρώσουν μια πρόταση.
Αντίθετα, τα Siri, Alexa και Google Assistant είναι ουσιαστικά αυτά που είναι γνωστά ως συστήματα εντολών και ελέγχου. Αυτά μπορούν να κατανοήσουν μια πεπερασμένη λίστα ερωτήσεων και αιτημάτων όπως “Τι καιρό έχει στη Νέα Υόρκη;” ή “Ενεργοποιήστε τα φώτα της κρεβατοκάμαρας”. Εάν ένας χρήστης ζητήσει από τον εικονικό βοηθό να κάνει κάτι που δεν υπάρχει στον κώδικά του, το ρομπότ απλώς λέει ότι δεν μπορεί να βοηθήσει.
Η Siri είχε επίσης ένα δυσκίνητο σχέδιο που καθιστούσε χρονοβόρο την προσθήκη νέων χαρακτηριστικών, είπε ο κ. Burkey, στον οποίο δόθηκε η δουλειά να βελτιώσει τη Siri το 2014. Η βάση δεδομένων της Siri περιέχει μια τεράστια λίστα λέξεων, συμπεριλαμβανομένων των ονομάτων μουσικών καλλιτεχνών και τοποθεσιών όπως εστιατόρια, σε σχεδόν δύο δωδεκάδες γλώσσες.
Αυτό το έκανε «μια μεγάλη χιονόμπαλα», είπε. Αν κάποιος ήθελε να προσθέσει μια λέξη στη βάση δεδομένων του Siri, πρόσθεσε, «μπαίνει σε ένα μεγάλο σωρό».
Έτσι, οι φαινομενικά απλές ενημερώσεις, όπως η προσθήκη μερικών νέων φράσεων στο σύνολο δεδομένων, θα απαιτούσαν την ανοικοδόμηση ολόκληρης της βάσης δεδομένων, η οποία μπορεί να διαρκέσει έως και έξι εβδομάδες, είπε ο κ. Burkey. Η προσθήκη πιο περίπλοκων λειτουργιών όπως νέα εργαλεία αναζήτησης μπορεί να διαρκέσει σχεδόν ένα χρόνο. Αυτό σήμαινε ότι δεν υπήρχε δρόμος για τη Siri να γίνει δημιουργικός βοηθός όπως το ChatGPT, είπε.
Η Alexa και το Google Assistant βασίστηκαν σε τεχνολογία παρόμοια με αυτή του Siri, αλλά οι εταιρείες δυσκολεύτηκαν να δημιουργήσουν σημαντικά έσοδα με τους βοηθούς, είπαν πρώην διευθυντές της Amazon και της Google. (Αντίθετα, η Apple χρησιμοποίησε με επιτυχία τη Siri για να δελεάσει τους αγοραστές στα iPhone της.)
Αφού η Amazon κυκλοφόρησε το Echo, ένα έξυπνο ηχείο που τροφοδοτείται από την Alexa, το 2014, η εταιρεία ήλπιζε ότι το προϊόν θα τη βοηθούσε να αυξήσει τις πωλήσεις στο ηλεκτρονικό της κατάστημα επιτρέποντας στους καταναλωτές να μιλήσουν με την Alexa για να κάνουν παραγγελίες, δήλωσε ένας πρώην ηγέτης της Amazon που ασχολείται με την Alexa. Ωστόσο, ενώ οι άνθρωποι διασκέδαζαν παίζοντας με την ικανότητα της Alexa να απαντά σε προτροπές καιρού και να ρυθμίζει ξυπνητήρια, λίγοι ζήτησαν από την Alexa να παραγγείλει αντικείμενα, πρόσθεσε.
Η Amazon μπορεί να έχει υπερεπενδύσει στην κατασκευή νέων ειδών υλικού, όπως τα ξυπνητήρια και τα μικροκύματα που έχουν καταργηθεί τώρα που λειτουργούσαν με την Alexa, τα οποία πωλούνταν στο κόστος ή κάτω από το κόστος, είπε ο πρώην στέλεχος.
Η εταιρεία επένδυσε επίσης ανεπαρκώς στη δημιουργία ενός οικοσυστήματος για τους ανθρώπους να επεκτείνουν εύκολα τις ικανότητες της Alexa, με τον τρόπο που έκανε η Apple με το App Store της, το οποίο βοήθησε να κεντρίσει το ενδιαφέρον για το iPhone, είπε το άτομο. Ενώ η Amazon πρόσφερε ένα κατάστημα «δεξιοτήτων» για να κάνει την Alexa να ελέγχει αξεσουάρ τρίτων, όπως διακόπτες φώτων, ήταν δύσκολο για τους ανθρώπους να βρουν και να δημιουργήσουν δεξιότητες για τα ηχεία — σε αντίθεση με την εμπειρία λήψης εφαρμογών για κινητά από καταστήματα εφαρμογών χωρίς τριβές.
«Δεν είχαμε ποτέ αυτή τη στιγμή του App Store για τους βοηθούς», είπε η Carolina Milanesi, αναλύτρια τεχνολογίας καταναλωτών για την ερευνητική εταιρεία Creative Strategies που ήταν σύμβουλος της Amazon.
Στα τέλη του περασμένου έτους, το τμήμα της Amazon που εργάζεται για την Alexa ήταν ο κύριος στόχος των 18.000 απολύσεων της εταιρείας και πολλά κορυφαία στελέχη της Alexa αποχώρησαν από την εταιρεία.
Η Kinley Pearsall, εκπρόσωπος της Amazon, είπε ότι η Alexa ήταν κάτι πολύ περισσότερο από φωνητικός βοηθός και «είμαστε τόσο αισιόδοξοι για αυτήν την αποστολή όσο ποτέ».
Οι αστοχίες της Amazon με την Alexa μπορεί να παρέσυραν την Google, είπε ένας πρώην διευθυντής που εργαζόταν στο Google Assistant. Οι μηχανικοί της Google πέρασαν χρόνια πειραματιζόμενοι με τον βοηθό της για να μιμηθούν ό,τι μπορούσε να κάνει η Alexa, συμπεριλαμβανομένου του σχεδιασμού έξυπνων ηχείων και οθονών tablet με έλεγχο φωνής για τον έλεγχο οικιακών αξεσουάρ όπως θερμοστάτες και διακόπτες φώτων. Η εταιρεία αργότερα ενσωμάτωσε τις διαφημίσεις σε αυτά τα οικιακά προϊόντα, τα οποία δεν έγιναν σημαντική πηγή εσόδων.
Με την πάροδο του χρόνου, η Google συνειδητοποίησε ότι οι περισσότεροι άνθρωποι χρησιμοποιούσαν τον φωνητικό βοηθό μόνο για έναν περιορισμένο αριθμό απλών εργασιών, όπως η έναρξη χρονοδιακόπτη και η αναπαραγωγή μουσικής, είπε ο πρώην διευθυντής. Το 2020, όταν ο Prabhakar Raghavan, στέλεχος της Google, ανέλαβε το Google Assistant, η ομάδα του επικέντρωσε εκ νέου τον εικονικό σύντροφο ως λειτουργία μαρκίζας για smartphone Android.
Τον Ιανουάριο, όταν η μητρική εταιρεία της Google απέλυσε 12.000 υπαλλήλους , η ομάδα που εργαζόταν σε λειτουργικά συστήματα για οικιακές συσκευές έχασε το 16% των μηχανικών της.
Πολλές από τις μεγάλες εταιρείες τεχνολογίας αγωνίζονται τώρα για να βρουν απαντήσεις στο ChatGPT. Στα κεντρικά γραφεία της Apple τον περασμένο μήνα, η εταιρεία πραγματοποίησε την ετήσια σύνοδο κορυφής AI, μια εσωτερική εκδήλωση για τους υπαλλήλους να μάθουν για το μεγάλο γλωσσικό μοντέλο της και άλλα εργαλεία τεχνητής νοημοσύνης, είπαν δύο άτομα που ενημερώθηκαν για το πρόγραμμα. Πολλοί μηχανικοί, συμπεριλαμβανομένων των μελών της ομάδας Siri, δοκιμάζουν έννοιες που δημιουργούν γλώσσα κάθε εβδομάδα, είπαν οι άνθρωποι.
Την Τρίτη, η Google είπε επίσης ότι θα κυκλοφορήσει σύντομα εργαλεία τεχνητής νοημοσύνης που θα βοηθήσουν τις επιχειρήσεις, τις κυβερνήσεις και τους προγραμματιστές λογισμικού να δημιουργήσουν εφαρμογές με ενσωματωμένα chatbot και να ενσωματώσουν την υποκείμενη τεχνολογία στα συστήματά τους.
Στο μέλλον, οι τεχνολογίες των chatbots και των φωνητικών βοηθών θα συγκλίνουν, είπαν ειδικοί στην τεχνητή νοημοσύνη. Αυτό σημαίνει ότι οι άνθρωποι θα μπορούν να ελέγχουν τα chatbots με ομιλία και όσοι χρησιμοποιούν προϊόντα Apple, Amazon και Google θα μπορούν να ζητούν από τους εικονικούς βοηθούς να τους βοηθήσουν με τις δουλειές τους, όχι μόνο σε εργασίες όπως ο έλεγχος του καιρού.
«Αυτά τα προϊόντα δεν λειτούργησαν ποτέ στο παρελθόν, επειδή δεν είχαμε ποτέ δυνατότητες διαλόγου σε ανθρώπινο επίπεδο», δήλωσε ο Aravind Srinivas, ιδρυτής της Perplexity, μιας start-up τεχνητής νοημοσύνης που προσφέρει μια μηχανή αναζήτησης που υποστηρίζεται από chatbot. «Τώρα το κάνουμε».
*Φωτογραφία εξωφύλλου: Patrick Edell
Πηγή: nytimes