Παρασκευή 26 Απριλίου 2024
weather-icon 21o
Το πρόγραμμα που θέλει να καταλάβει όλες τις εικόνες του κόσμου

Το πρόγραμμα που θέλει να καταλάβει όλες τις εικόνες του κόσμου

Οι δημιουργοί του κάνουν λόγο για «το πρώτο πρόγραμμα υπολογιστή που μαθαίνει ό,τι υπάρχει να μάθει κανείς για οποιαδήποτε οπτική έννοια». Είναι το Levan, η οπτική εγκυκλοπαίδεια που μετατρέπει τις έννοιες σε εικόνες.

Οι δημιουργοί του κάνουν λόγο για «το πρώτο πρόγραμμα υπολογιστή που μαθαίνει ό,τι υπάρχει να μάθει κανείς για οποιαδήποτε οπτική έννοια». Είναι το Levan, η οπτική εγκυκλοπαίδεια που μετατρέπει τις έννοιες σε εικόνες.

Προϊόν συνεργασίας ανάμεσα στο Πανεπιστήμιο της Ουάσινγκτον και του Ινστιτούτου «Άλεν» για την Τεχνητή Νοημοσύνη, το Levan παίρνει το όνομα του από τη φράση «μαθαίνοντας τα πάντα για τα πάντα» («Learning Everything about Anything»).

Το πρόγραμμα σαρώνει το κείμενο εκατομμυρίων βιβλίων στο Google Books και αναζητά αναφορές για συγκεκριμένες έννοιες, όπως για παράδειγμα «άλογο». Στη συνέχεια, ένας αλγόριθμος αποκλείει τις λέξεις που δεν έχουν οπτικό νόημα. Στο παράδειγμα του αλόγου, ο αλγόριθμος κρατά φράσεις «το άλογο πηδά» ή «το άλογο τρώει» και αποκλείει μη οπτικές φράσεις όπως «το άλογό του» ή «το τελευταίο άλογο».

Όταν πια καταλήξει σε συγκεκριμένες φράσεις, το Levan προχωρά σε μια αναζήτηση εικόνων στον Παγκόσμιο Ιστό, αναζητώντας ομοιότητες ανάμεσα στις εικόνες των αποτελεσμάτων. Αυτό γίνεται μέσω αλγορίθμων αναγνώρισης αντικειμένων, οι οποίοι οποίοι αναλύουν τα εικονοστοιχεία των εικόνων και δεν περιορίζονται στις λέξεις της λεζάντας.

Μέχρι σήμερα το Levan έχει εντάξει στη βιβλιοθήκη του περίπου 175 έννοιες, από «παράθυρο» μέχρι «όμορφο» και «γυαλιστερό», τις οποίες μπορούν να ξεφυλλίσουν οι χρήστες στο δικτυακό τόπο του προγράμματος.

Η βάση δεδομένων του Levan, λένε οι δημιουργοί του, θα ήταν χρήσιμη τόσο για τους ερευνητές του κλάδου της μηχανικής όρασης όσο και για εκπαιδευτικούς σκοπούς.

«Οι σημαντικότερες πηγές πληροφοριών, όπως τα λεξικά και οι εγκυκλοπαίδειες, κινούνται προς την κατεύθυνσης της προβολής οπτικών πληροφοριών, οι οποίες είναι πιο εύκολο να γίνουν κατανοητές» σχολιάζει ο Σάντος Ντίβαλα, μέλος της ερευνητικής ομάδας.

»Συχνά όμως, έχουν περιορισμένο εύρος επειδή δημιουργούνται με το χέρι. Το νέο πρόγραμμα δεν χρειάζεται παρέμβαση και μπορεί επομένως να προσλαμβάνει τις οπτικές γνώσεις για οποιαδήποτε έννοια» επισημαίνει.

Το πρόγραμμα χρειάστηκε μόλις τέσσερις μήνες για να καλύψει 175 έννοιες με 13 εκατομμύρια εικόνες και 65.000 διαφορετικές φράσεις.

Για ορισμένες έννοιες χρειάζεται μέχρι 12 ώρες επεξεργασίας, οι επιδόσεις του όμως θα βελτιώνονταν αν έτρεχε σε ισχυρότερο υπολογιστή.

Η μελέτη για το Levan θα παρουσιαστεί στο ετήσιο συνέδριο Μηχανικής Όρασης και Αναγνώρισης Μοτίβων, το οποίο πραγματοποιείται τον Ιούνιο στο Κολούμπους του Οχάιο.

Newsroom ΑΛΤΕΡ ΕΓΚΟ

Sports in

Ολυμπιακός – Παναθηναϊκός: «Μάχη» τίτλου στο Ρέντη

Η γυναικεία ομάδα βόλεϊ του Ολυμπιακού θα υποδεχθεί το Σάββατο (27/4, 19:30) την αντίστοιχη του Παναθηναϊκού στον 5ο τελικό της Α1, που θα κρίνει τον φετινό τίτλο.

Ακολουθήστε το in.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

in.gr | Ταυτότητα

Διαχειριστής - Διευθυντής: Λευτέρης Θ. Χαραλαμπόπουλος

Διευθύντρια Σύνταξης: Αργυρώ Τσατσούλη

Ιδιοκτησία - Δικαιούχος domain name: ΑΛΤΕΡ ΕΓΚΟ ΜΜΕ Α.Ε.

Νόμιμος Εκπρόσωπος: Ιωάννης Βρέντζος

Έδρα - Γραφεία: Λεωφόρος Συγγρού αρ 340, Καλλιθέα, ΤΚ 17673

ΑΦΜ: 800745939, ΔΟΥ: ΦΑΕ ΠΕΙΡΑΙΑ

Ηλεκτρονική διεύθυνση Επικοινωνίας: in@alteregomedia.org, Τηλ. Επικοινωνίας: 2107547007

ΜΗΤ Αριθμός Πιστοποίησης Μ.Η.Τ.232442

Παρασκευή 26 Απριλίου 2024