博客專欄

EEPW首頁 > 博客 > 穿顏色成對的襪子,追最新的?。哼@群coder正幫視障者移走身上的大山

穿顏色成對的襪子,追最新的?。哼@群coder正幫視障者移走身上的大山

發(fā)布人:機(jī)器之心 時(shí)間:2023-01-17 來源:工程師 發(fā)布文章

「視障是壓在身上的一座大山。你從小就是被否定的,你看不見就做不了這,做不了那,你自己也那么認(rèn)為。


在你的印象中,視障群體一般會(huì)從事哪些職業(yè)?如果被問到這個(gè)問題,大多數(shù)人想到的第一個(gè)答案可能都是推拿師、按摩師??峙拢瑳]有人會(huì)想到「化妝師」。 「盲人怎么還能化妝、拍抖音、回私信呢?是騙人的吧!」抖音視頻博主「盲人美妝師肖佳」經(jīng)常會(huì)受到這種質(zhì)疑。
和很多視障人士一樣,肖佳最初也從事過按摩工作,但這份工作并沒有束縛住她。北漂的經(jīng)歷讓她發(fā)現(xiàn)了自己人生的更多可能性并找到了興趣所在。6 年間,她教會(huì)了數(shù)千名視障女性化妝。 

圖片

肖佳的抖音視頻截圖

其實(shí)從肖佳的身上不難看到,隨著技術(shù)的進(jìn)步,視障群體的就業(yè)范圍早就不再局限于推拿、按摩等傳統(tǒng)行業(yè),越來越多的視障者渴望或正在從事和明眼人一樣的工作,比如有聲主播、云客服、數(shù)據(jù)標(biāo)注師等。只是,這一人群所占的比例還比較小。 這其中的原因是多重的,包括工作機(jī)會(huì)少、無障礙支持做得還不夠等等,這導(dǎo)致很多視障者在「邁出家門」這一步就被卡住了。 為了改變這一群體的境遇,社會(huì)各界正從各個(gè)方向發(fā)力,科技是其中一個(gè)比較有效的方向,包括近年來已經(jīng)在各行各業(yè)找到應(yīng)用場景的 AI 技術(shù)。
不過,對于技術(shù)人員來說,嘗試用 AI 幫助視障群體可能并不容易,因?yàn)檫@類項(xiàng)目的用戶調(diào)研更難開展,可借鑒的成熟模式也比較有限。就像字節(jié)跳動(dòng)的一位算法工程師所說,「我們隱約覺得視障群體會(huì)因?yàn)榭床灰姈|西而面臨很多困難,但是具體有什么困難我們也不知道」。
在 AI 技術(shù)圈,抱有相同疑惑的工程師不在少數(shù)。因此,從去年 8 月份開始,字節(jié)跳動(dòng)就組織了一場以「AI 助力視障群體」為主題的大賽,即「2022 技術(shù)公益創(chuàng)新杯大賽」,希望助力視障群體在生活和工作上更好地融入社會(huì)。
為了確保選手對視障人群有足夠的了解,同時(shí)確保他們的創(chuàng)意作品有足夠的迭代時(shí)間,大賽在比賽初期就引入了肖佳等受益人評(píng)委,而且用 5 個(gè)多月的時(shí)間組織了初賽、復(fù)賽、決賽三大環(huán)節(jié)。雙方在經(jīng)歷了多輪溝通、交流之后都對要解決的問題、可應(yīng)用的技術(shù)有了新的認(rèn)識(shí),也為廣大想要在這一領(lǐng)域有所貢獻(xiàn)的技術(shù)人員提供了一些參考。
關(guān)于視障需求的一些「誤解」
哪些是「真需求」?哪些是「偽需求」?
對于明眼人來說,生活中能夠感知到的無障礙設(shè)施其實(shí)并不多,盲道算是最為明顯的一個(gè)。很多人會(huì)吐槽盲道會(huì)導(dǎo)到樹上或溝里,用起來令人膽戰(zhàn)心驚。但受益人評(píng)委之一、北京一加一殘障公益集團(tuán)合伙人傅高山卻說,這些吐槽其實(shí)并沒有抓住重點(diǎn),視障者本身有辦法避開上述障礙。 比起吐槽中提到的問題,更加困擾傅高山的其實(shí)是一些開闊區(qū)域盲道的缺失,比如斑馬線。這些地方參照物少得可憐,視障者很容易走歪、進(jìn)錯(cuò)路,這恰恰是盲道應(yīng)該發(fā)揮作用的地方。 在比賽中,選手們也經(jīng)歷著類似的認(rèn)知沖擊。 想要做一款「助視輔具」幫助視障人群了解周邊環(huán)境的微光團(tuán)隊(duì)回憶說,他們起初設(shè)計(jì)的產(chǎn)品包含危險(xiǎn)物品的識(shí)別,比如提醒視障者前面有個(gè)坑,或周圍有刀具。但在進(jìn)行深入的用戶訪談后,他們放棄了這個(gè)功能。因?yàn)橐曊险呓柚ふ鹊裙ぞ咭材芴綔y到危險(xiǎn)物品。在熟悉的環(huán)境中,他們甚至能把周邊物體的位置背下來。 主打「對話式視覺助手」的靈瞳團(tuán)隊(duì)也遇到了需求理解不到位的問題。他們的產(chǎn)品邏輯是讓 AI 理解視障者拍的照片,以問答的方式告訴他們照片上的信息。在最初的版本中,他們設(shè)計(jì)了一個(gè)提醒視障者物品是否入鏡的功能,不過后來因?yàn)榻换テ饋聿粔蚝啙嵱职堰@個(gè)功能刪掉了。但傅高山告訴他們,這個(gè)功能對于視障用戶還是很重要的,所以他們最后又把這個(gè)功能撿了回來,并嘗試用更簡潔的交互邏輯來實(shí)現(xiàn)它。

圖片

靈瞳團(tuán)隊(duì)作品功能介紹

視障者=盲人? 很多人在聽到「視障者」這個(gè)詞的時(shí)候,都會(huì)簡單地將其等同于「盲人」,這無疑是一種誤解。 其實(shí),截至 2021 年,我國總共有 1750 萬視障群體,其中盲人有 875 萬,其余可以被歸為「低視力」等范疇。在傅高山身上,微光團(tuán)隊(duì)看到了這兩類群體的差異。傅高山本身屬于低視力,所以他希望助視輔具不僅告訴他某個(gè)餐館在屏幕的哪個(gè)方向,還要提供一個(gè)放大鏡功能,方便他貼到眼睛上看?!高@是之前沒有想到的需求,」微光的隊(duì)長坦言。 除了視力,視障群體對光的感知能力也是不同的。有光感的肖佳習(xí)慣于晚上開燈,因?yàn)槟欠N「亮亮的感覺」讓她覺得很舒服。但沒有光感的另一位視障用戶同樣習(xí)慣于晚上開 / 關(guān)燈,因?yàn)樗枰源藶樾盘?hào)告訴別人他是否在休息。不過,和肖佳不同,他還需要借助某種方法判斷燈是開著還是關(guān)著。在了解到這一需求后,微光團(tuán)隊(duì)把將亮度檢測功能加入了自己的作品。 這種光譜式的需求點(diǎn)挖掘讓受益人評(píng)委深感欣慰。傅高山評(píng)價(jià)說,「我們社會(huì)并不是所有人對殘障的認(rèn)知都達(dá)到了正確理解的程度。同學(xué)們的作品其實(shí)開了一個(gè)好頭,就是識(shí)別用戶。在這個(gè)用戶光譜里,還有很多處在漸變色的中間用戶,其實(shí)這部分用戶是最值得被挖掘出來的。
眼睛不好,補(bǔ)兩顆智能的就能解決問題?
在明確了視障群體的需求之后,選手們接下來面臨的問題就是怎么滿足這些需求,以什么產(chǎn)品形態(tài)來滿足。 普通技術(shù)人員最容易想到的品類可能就是智能眼鏡,因?yàn)檫@和人的眼睛在形態(tài)、功能上是最像的。這類眼鏡往往用攝像頭采集數(shù)據(jù),然后用耳機(jī)把 AI 處理后的結(jié)果播報(bào)給用戶。這些年,傅高山已經(jīng)見過不下五款智能眼鏡,設(shè)計(jì)者的想法基本都是「你眼睛不好,我就給你補(bǔ)兩顆智能的」。 起初,微光團(tuán)隊(duì)的助視輔具也有這種傾向,但傅高山的一番解釋讓他們明白了為什么這種形式行不通。 首先,從信息采集方式來看,人的頭部在行走過程中是不穩(wěn)定的。 其次,眼鏡 + 耳機(jī)的形式大量占用耳朵,而耳朵又是視障者接收周圍信息的重要感官。為了保持聽覺的靈敏,他們下雨天甚至都不怎么打傘。 最后,視障者其實(shí)希望在接受技術(shù)輔助時(shí)擁有自主權(quán)。他們不需要輔具時(shí)時(shí)刻刻工作,只想在需要的時(shí)候拿出來用一下。因此,他們希望這款輔具是方便摘取且按需播報(bào)的。 我們期望技術(shù)能解決的,就是遵循現(xiàn)有的方式,讓視障者的學(xué)習(xí)成本更低、便利性更高。如果想做一款設(shè)備來替代人的器官,目前來看,這種思路基本都不可行。」傅高山解釋說。 在聽取了傅高山的建議后,微光團(tuán)隊(duì)把助視輔具的形態(tài)改成了頸掛式,交互方式也演變成了用揚(yáng)聲器按需播報(bào)。這款設(shè)備可以滿足日常生活、出行的一些基本需求,比如物體、信息識(shí)別,建筑物內(nèi)導(dǎo)航等。此外,該設(shè)備還支持向附近在線的人發(fā)起求助。 

圖片

微光團(tuán)隊(duì)作品3D打印樣品
一份「超出期待」的答卷
 「您試用過選手的作品嗎,感覺怎么樣?」在被問及這個(gè)問題時(shí),傅高山的回答是:超出期待。 以靈瞳團(tuán)隊(duì)的「對話式視覺助手」為例,傅高山對它的期待原本是:能實(shí)現(xiàn)一個(gè)功能就很有價(jià)值了,結(jié)果靈瞳做出了很多個(gè)。通過對話式主動(dòng)智能,你既可以問視覺助手衣服的款式和價(jià)格、 襪子的顏色是否一致、薯片的口味和保質(zhì)期,也可以和它聊聊文章的配圖、電商主播的穿搭……

這種主動(dòng)式的對話方式有多方便呢?在一個(gè)視頻中,肖佳曾介紹過她如何獲取****品信息:先把說明書拍下來,然后找一個(gè) OCR 軟件進(jìn)行識(shí)別,最后再借助讀屏軟件把所有信息讀出來。這種信息獲取方式是非常低效的,因此聽語速飛快的倍速語音成為了每個(gè)視障者必備的技能。但在主動(dòng)式對話交互中,視障者不需要再忍受這種折磨,在接收技術(shù)輔助的時(shí)候擁有了更多自主權(quán)。

 這種超出期待的能力離不開多模態(tài)技術(shù)的支持。靈瞳團(tuán)隊(duì)介紹說,目前國際學(xué)術(shù)界很多人都在嘗試用 VQA(視覺問答)等多模態(tài)方法解決視障類問題,只是還沒有實(shí)現(xiàn)大規(guī)模工程落地。

圖片

vizwiz 公開的用于解決視障類問題的 VQA-Grounding 數(shù)據(jù)集。照片由視障者拍攝。
 同樣采用了多模態(tài)技術(shù)的還有聆影聽光團(tuán)隊(duì),他們的目標(biāo)是用 AI 實(shí)現(xiàn)視頻無對白片段的內(nèi)容理解,進(jìn)而為這些片段生成旁白,方便視障群體追劇、看電影、刷視頻。與傳統(tǒng)的人工方式相比,他們的方法會(huì)顯著降低無障礙視頻的制作成本和周期,滿足了視障者想和朋友溝通最新影視作品的愿望。

當(dāng)然,受到多模態(tài)技術(shù)發(fā)展水平和可用數(shù)據(jù)集等方面的限制,這些應(yīng)用的準(zhǔn)確率現(xiàn)在還達(dá)不到那么高,因此選手會(huì)擔(dān)心把這樣的產(chǎn)品拿給視障群體用是不負(fù)責(zé)任。但傅高山很喜歡這些作品,因?yàn)楦鶕?jù)他自己的體驗(yàn),視障者其實(shí)對這些 AI 技術(shù)是有一定的容錯(cuò)能力的,比如「你即使把 57 路公交車看成 51 路,我也能判斷車它是 57,因?yàn)槲抑肋@個(gè)站點(diǎn)沒有 51 路」。

 只要是在正確的路上,有就比沒有強(qiáng),」傅高山總結(jié)說。 從「面對面」到「肩并肩」,「改變」正在發(fā)生
視障是壓在身上的一座大山。你從小就是被否定的,你看不見就做不了這,做不了那,你自己也那么認(rèn)為。」肖佳這番話道出了很多人對于視障群體的刻板觀念,這也是很多視障問題遲遲難以解決的根源。
持有這種觀念的明眼人在幫助視障群體時(shí)往往會(huì)以一種「面對面」而非「肩并肩」的態(tài)度來看待事情?!副热缥覀兿胂笠粋€(gè)畫面,在飛機(jī)座艙里面,一個(gè)空乘背著一個(gè)肢體障礙者??赡軓耐饨绲慕嵌龋苋菀卓吹胶娇展咎峁┝藴嘏姆?wù)。但從障礙者的角度來看,他會(huì)想為什么飛機(jī)上沒有輪椅。作為被背著的那個(gè)人,他其實(shí)沒有那么舒服?!垢蹈呱浇忉屨f。
在傅高山看來,靈瞳、微光等團(tuán)隊(duì)的可貴之處在于,他們在幫助視障群體的過程中完成了從「面對面」到「肩并肩」的視角切換,真正做到了站在視障者的視角去解決問題。
這種讓視障者更加自主的解決問題的方式對于他們建立自信也非常重要。當(dāng)做很多小事的學(xué)習(xí)成本降下來之后,他們會(huì)更加愿意嘗試。就像肖佳所說,視障者學(xué)會(huì)了化妝就不會(huì)只想做按摩師,也會(huì)想嘗試主播等新興職業(yè)。

圖片


在經(jīng)歷了 5 個(gè)多月的賽程后,2022 技術(shù)公益創(chuàng)新杯終于在前段時(shí)間迎來了決賽。文中提到的幾個(gè)團(tuán)隊(duì)均在決賽中取得了優(yōu)異的成績。其中,靈瞳和聆影聽光團(tuán)隊(duì)獲得了大賽一等獎(jiǎng),靈瞳還和微光團(tuán)隊(duì)一起獲得了最受歡迎獎(jiǎng)。
雖然比賽已經(jīng)告一段落,但從更長的時(shí)間維度來看,它只是一個(gè)開始。目前,大賽的相關(guān)人員已經(jīng)開始著手后續(xù)的孵化工作,希望大賽中誕生的這些 idea 能夠讓更多的視障者過上更加體面的生活。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉