Haris-m: Αλγόριθμος της Google μαντεύει πού τραβήχτηκε η φωτογραφία

Δευτέρα 29 Φεβρουαρίου 2016

Αλγόριθμος της Google μαντεύει πού τραβήχτηκε η φωτογραφία

Ωραία είναι αυτή η φωτογραφία, αλλά που στο καλό τραβήχτηκε; Σε αυτό το συχνό ερώτημα, ένας πειραματικός αλγόριθμος που...

ανέπτυξαν ερευνητές της Google ήδη τα καταφέρνει καλύτερα από τους ανθρώπους.

Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα σύστημα «βαθιάς μάθησης» (deep learning), το οποίο επιτρέπει τον γεωεντοπισμό της φωτογραφίας χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστοιχεία της.

Εκ πρώτης όψεως, φαντάζει δύσκολο έως αδύνατο να καταλάβει κανείς που τραβήχτηκε μια φωτογραφία χωρίς να έχει άλλες πληροφορίες πέρα από την ίδια την εικόνα. Οι άνθρωποι συχνά χρησιμοποιούν ενδείξεις, όπως ο καιρός, τα φυτά και διάφορα αντικείμενα που φαίνονται στη εικόνα.

Υπάρχουν εξάλλου και διαδικτυακοί τόποι, όπως το GeoGuessr και το View from your Window, όπου οι χρήστες μπορούν να δοκιμάσουν τις ικανότητές τους.

Η ομάδα της Google ακολούθησe μια τελείως διαφορετική μέθοδο. Σε πρώτη φάση, χώρισαν την υδρόγειο σε τετραγωνάκια, των οποίων το μέγεθος εξαρτάται από τον αριθμό των φωτογραφιών που λαμβάνονται εκεί και αναρτώνται στο Διαδίκτυο. Για παράδειγμα, το τετραγωνάκι της Νέας Υόρκης, όπου οι τουρίστες τραβούν χιλιάδες φωτογραφίες κάθε μέρα, είναι μεγαλύτερο από ό,τι το τετραγωνάκι μιας ερημικής έκτασης ίδιου εμβαδού.

Στη συνέχεια, οι ερευνητές τροφοδότησαν το σύστημα τους με εκατομμύρια αποθηκευμένες φωτογραφίες που συνοδεύονταν από πληροφορίες γεωεντοπισμού. Το λογισμικό, ένα «νευρωνικό δίκτυο» που μιμείται την αρχιτεκτονική του εγκεφάλου, δημιούργησε αντιστοιχίες ανάμεσα στα πίξελ των εικόνων και στα τα μέρη όπου τραβήχτηκαν οι φωτογραφίες.

Τελικά, η εφαρμογή δοκιμάσθηκε με 2,3 εκατομμύρια εικόνες από το Flickr, και κατάφερε να βρει σε ποια ήπειρο τραβήχτηκε κάθε φωτογραφία στο 48% των περιπτώσεων. Το ποσοστό πέφτει στο 28,4% όσον αφορά τη χώρα λήψης, στο 10,1% για την πόλη λήψης και στο 3,6% για τον συγκεκριμένο δρόμο της πόλης.

Τα ποσοστά αυτά μπορεί μην φαίνονται εντυπωσιακά, ξεπερνούν όμως κατά πολύ τις δυνατότητες των ανθρώπων -αυτό αποδείχθηκε όταν ο αλγόριθμος αναμετρήθηκε με δέκα εθελοντές.

Ο αλγόριθμος, λένε οι ερευνητές, θα μπορούσε να βελτιωθεί αποκτώντας την ικανότητα να αναγνωρίζει αντικείμενα και άλλες παραμέτρους όπως η αρχιτεκτονική των κτηρίων, η βλάστηση, οι πινακίδες κυκλοφορίας και το χρώμα δέρματος των εικονιζόμενων.

Η μελέτη είναι διαθέσιμη στην υπηρεσία προδημοσίευσης ArXiv.

Δεν υπάρχουν σχόλια :

Δημοσίευση σχολίου

Εγγραφή σε: Σχόλια ανάρτησης ( Atom )