Οι εταιρείες ΑΙ ξέμειναν από πληροφορίες για εκπαίδευση – Στρέφονται σε συνθετικά δεδομένα

Ανακαλύψτε περισσότερα άρθρα στα αποτελέσματα αναζήτησης

Προσθήκη του VoiceNews στην Google

Αυτή την εβδομάδα στην Τεχνητή Νοημοσύνη, τα συνθετικά δεδομένα (πληροφορίες που παρήχθησαν από άλλα συστήματα τεχνητής νοημοσύνης) βρέθηκαν στο επίκεντρο, καθώς οι τεχνολογικοί γίγαντες βασίζονται όλο και περισσότερο σε αυτά για να ενισχύσουν τα μοντέλα Τεχνητής Νοημοσύνης τους. Τόσο η OpenAI όσο και η Meta προωθούν τα συνθετικά δεδομένα για την εκπαίδευση των συστημάτων επόμενης γενιάς τους, προσφέροντας πολλά υποσχόμενες αλλά επικίνδυνες εξελίξεις.

Το OpenAI παρουσίασε το Canvas, έναν χώρο εργασίας για το ChatGPT που τροφοδοτείται από ένα λεπτομερώς ρυθμισμένο μοντέλο GPT-4o, το οποίο εκπαιδεύτηκε χρησιμοποιώντας συνθετικά δεδομένα.

Η Meta χρησιμοποίησε συνθετικούς υπότιτλους για το εργαλείο Movie Gen, υπογραμμίζοντας την αυξανόμενη εξάρτησή της από την αυτοματοποίηση στη δημιουργία δεδομένων.

Τα συνθετικά δεδομένα προσφέρουν πλεονεκτήματα κόστους, αλλά ενέχουν κινδύνους όπως η «ψευδαισθήσεις» (δηλαδή το ΑΙ να επικαλείται πηγές και γεγονότα που δεν υπάρχουν) και η μεροληψία, απαιτώντας αυστηρό φιλτράρισμα για να αποφευχθεί η υποβάθμιση της ποιότητας του μοντέλου.

Καθώς τα δεδομένα του πραγματικού κόσμου γίνονται πιο ακριβά και πιο δύσκολο να βρεθούν, οι εταιρείες στρέφονται σε συνθετικά δεδομένα για να αναπτύξουν τα συστήματα τεχνητής νοημοσύνης τους. Ωστόσο, η άσκηση προσοχής και η διατήρηση υψηλών προτύπων δεδομένων θα είναι κρίσιμες για να διασφαλιστεί ότι τα μοντέλα AI θα παραμείνουν αξιόπιστα και καινοτόμα.

Πηγή The AI Journal