極客號(hào)(Daydx.com)7月21日 消息:斯坦福大學(xué)的三位計(jì)算機(jī)科學(xué)家開發(fā)了一個(gè)深度學(xué)習(xí)模型,可以通過觀察谷歌街景圖像來確定大致的拍攝位置。這個(gè)模型在一個(gè)流行的地理猜測(cè)游戲 GeoGuessr 中表現(xiàn)出色,甚至超過了頂級(jí)玩家。盡管這個(gè)模型不能精確確定街景照片的位置,但它能夠可靠地確定國家,并在很大程度上猜測(cè)出離正確位置不超過15英里的范圍內(nèi)。
據(jù)說該軟件運(yùn)行良好,足以擊敗流行的在線位置猜測(cè)游戲 GeoGuessr 中的頂尖玩家,成為在全球約五千萬玩家中排名前百分之0.01的 AI 模型。這一成果顯示出圖像地理定位不僅僅是一門藝術(shù),更是一門科學(xué),并且具有重要的隱私影響。
研究人員認(rèn)為,這種技術(shù)不僅適用于街景圖像,還可以用于幾乎任何室外圖像。然而,室內(nèi)圖像仍然難以定位。研究人員表示,他們的模型之所以成功,主要是因?yàn)樗?OpenAI 的 CLIP 為基礎(chǔ)模型,而 CLIP 模型已經(jīng)訓(xùn)練過大量的圖像,具備了更好的細(xì)節(jié)處理能力。
此外,他們還設(shè)計(jì)了一種損失函數(shù)來改進(jìn)位置預(yù)測(cè)的準(zhǔn)確性??傊@個(gè)模型在地理定位方面取得了令人矚目的成果,對(duì)于地理猜測(cè)游戲和開源情報(bào)研究具有重要的應(yīng)用價(jià)值。