“未來(lái)城市”是面向下一個(gè)時(shí)代城市問(wèn)題,構(gòu)建在新理念、新技術(shù)之上的城市發(fā)展方案。
未來(lái)我國(guó)將組織開(kāi)展全國(guó)聲環(huán)境質(zhì)量監(jiān)測(cè),推進(jìn)監(jiān)測(cè)自動(dòng)化,統(tǒng)一發(fā)布全國(guó)聲環(huán)境質(zhì)量狀況信息。這說(shuō)明聲環(huán)境的分析和評(píng)估對(duì)未來(lái)城市人居環(huán)境十分重要。
來(lái)自哈爾濱工業(yè)大學(xué)的研究團(tuán)隊(duì)就將面部表情分析技術(shù)引入聲景研究,旨在通過(guò)構(gòu)建基于面部表情分析的聲景地圖,為未來(lái)城市聲環(huán)境評(píng)估與設(shè)計(jì)提供新的工具和方法。
未來(lái)城市與聲環(huán)境問(wèn)題
隨著城市化進(jìn)程不斷深入,未來(lái)城市的構(gòu)想日益成為城市規(guī)劃者與研究者的核心議題。未來(lái)城市不僅應(yīng)當(dāng)具備智能化、技術(shù)化、生態(tài)友好、韌性、低碳和宜居等特征,更應(yīng)在多個(gè)維度上全面提升居民的生活質(zhì)量。其中,聲環(huán)境作為城市物理環(huán)境的關(guān)鍵維度,直接影響居民的聽(tīng)覺(jué)感受與心理健康,其重要性不容忽視。然而,現(xiàn)有聲環(huán)境研究大多仍集中于聲壓級(jí)的降低,對(duì)聲音感知與主觀評(píng)價(jià)的探討尚顯不足,亟需從人本視角出發(fā)開(kāi)展更深入的探討。
構(gòu)建智能化聲景地圖
聲景(soundscape)作為某場(chǎng)景下個(gè)人或群體所感知、體驗(yàn)及(或)理解的聲環(huán)境,已成為解決城市聲環(huán)境問(wèn)題的熱點(diǎn)研究方向。如何建立有效的聲景評(píng)價(jià)模型,對(duì)提升未來(lái)城市人居聲環(huán)境具有重要的社會(huì)和應(yīng)用價(jià)值。
聲景地圖是一種直觀的聲景評(píng)價(jià)模型,其通過(guò)圖形化方式對(duì)聲景要素進(jìn)行描述、記錄與展示。在早期應(yīng)用中,它主要用于客觀聲學(xué)數(shù)據(jù)與主觀感知評(píng)價(jià)之間的對(duì)比分析。隨著研究的不斷深入,聲景地圖的功能也逐漸拓展,能夠反映諸如主觀響度、舒適度等心理聲學(xué)指標(biāo)在地理空間中的分布特征。近年來(lái),隨著智能化與大數(shù)據(jù)技術(shù)的引入,聲景地圖進(jìn)一步發(fā)展為一種高效的聲景預(yù)測(cè)與模擬工具,為城市聲環(huán)境的規(guī)劃與管理提供科學(xué)支持。
其中,面部表情識(shí)別作為利用計(jì)算機(jī)進(jìn)行面部圖像理解的智能化技術(shù),其優(yōu)勢(shì)在于可以客觀反映原本需要主觀收集的數(shù)據(jù),符合未來(lái)城市的智能化需求。但目前,其在聲環(huán)境感知方面應(yīng)用較少。
因此,本研究嘗試將面部表情識(shí)別技術(shù)引入聲景研究,通過(guò)構(gòu)建基于面部表情分析的聲景地圖,為未來(lái)城市聲環(huán)境評(píng)估與設(shè)計(jì)提供新的工具和方法。
基于面部表情的聲景地圖構(gòu)建
本研究選擇哈爾濱市兒童公園作為研究區(qū)域。該公園長(zhǎng)約1000米,寬約230米,總面積18公頃,屬于典型的城市公園。公園內(nèi)既有風(fēng)格別致的步行街,又有曲徑通幽的小路;既有熱鬧寬敞的活動(dòng)區(qū)域,又有自然安靜的休憩區(qū)域,形成豐富的空間體驗(yàn)(圖1)。
園內(nèi)不同空間中的聲源類(lèi)型豐富,吸引了眾多當(dāng)?shù)鼐用窈陀慰?,為聲景地圖中的聲源和行為分析提供了理想的研究場(chǎng)所。

首先,以數(shù)據(jù)庫(kù)建立、有效性驗(yàn)證、地圖編制與分析以及聲景地圖應(yīng)用四個(gè)流程進(jìn)行聲景地圖繪制。數(shù)據(jù)庫(kù)建立包括基礎(chǔ)數(shù)據(jù)庫(kù)(地理空間數(shù)據(jù))與核心數(shù)據(jù)庫(kù)(面部表情數(shù)據(jù))的構(gòu)建。地理空間數(shù)據(jù)為研究區(qū)域內(nèi)各種實(shí)體空間要素幾何邊界特征數(shù)據(jù)的集合,主要包括研究區(qū)域內(nèi)的建筑、道路、廣場(chǎng)、水體、綠化等信息。面部表情數(shù)據(jù)包含被試在聲源、時(shí)間與行為維度下的面部表情數(shù)據(jù)。
其中,面部表情的數(shù)據(jù)收集采用攝像機(jī)現(xiàn)場(chǎng)錄制的方式進(jìn)行。研究選取30名聽(tīng)力水平正常的哈爾濱工業(yè)大學(xué)在讀學(xué)生作為被試。每位被試均需要在每個(gè)區(qū)域根據(jù)時(shí)段和行為分別錄制視頻。根據(jù)時(shí)間差異,選擇06:00-07:00、11:00-12:00和19:00-20:00三個(gè)時(shí)間段,根據(jù)行為差異,選擇散步、健身與廣場(chǎng)舞三種行為進(jìn)行錄制。每段視頻錄制80秒(圖2)。

使用諾達(dá)思的面部表情分析系統(tǒng)(FaceReader)對(duì)視頻中的面部表情進(jìn)行分析。面部表情情感被分為七種基本情緒,即愉快、驚奇、懼怕、悲傷、憤怒、厭惡和中性,依據(jù)表情的占比可計(jì)算出被試的面部表情效價(jià),即反映其積極情緒或消極情緒的指標(biāo),其取值范圍為1-7。
每名被試完成面部表情錄制之后,立刻在調(diào)查地點(diǎn)通過(guò)問(wèn)卷調(diào)研的方式獲取聲景感知質(zhì)量(主觀響度、聲舒適度)和聲景維度(多變性、愉悅感、活力感與平靜感)等評(píng)價(jià)數(shù)據(jù),以分別驗(yàn)證不同維度下面部表情識(shí)別數(shù)據(jù)的有效性。
最后,將客觀聲景數(shù)據(jù)與地理空間數(shù)據(jù)在地理信息系統(tǒng)(GIS)中進(jìn)行圖形化處理,并從聲源、時(shí)間與行為維度對(duì)聲景地圖進(jìn)行維度劃分與動(dòng)態(tài)數(shù)據(jù)分析,并分別向政府、設(shè)計(jì)師、公眾展示輸出應(yīng)用。
聲景地圖的多維度與動(dòng)態(tài)性分析
(一)面部表情分析構(gòu)建聲景評(píng)價(jià)的有效性
研究發(fā)現(xiàn),面部表情效價(jià)與主觀響度呈負(fù)相關(guān),與聲舒適度呈正相關(guān);與聲景維度指標(biāo)中的多變性呈負(fù)相關(guān),與聲景維度中的其他指標(biāo)呈正相關(guān)。這些結(jié)果與以往聲感知調(diào)查中各變量的關(guān)系高度一致,說(shuō)明面部表情數(shù)據(jù)可以正確反映聲感知的正負(fù)性。
對(duì)于聲源維度而言,在以機(jī)械聲為主導(dǎo)的環(huán)境中,除主觀響度外,其余評(píng)價(jià)指標(biāo)均與面部表情效價(jià)顯著相關(guān)。其中,只有多變性與效價(jià)呈顯著負(fù)相關(guān),這說(shuō)明機(jī)械聲的多變性是降低感知情緒的重要因素。在自然聲為主導(dǎo)的環(huán)境中,面部表情效價(jià)與聲感知評(píng)價(jià)中的聲舒適度以及聲景維度中的愉悅感和活力感顯著相關(guān),表明自然聲對(duì)提升聲感知評(píng)價(jià)水平具有積極作用。
對(duì)于行為維度而言,除健身行為與多變性之間以及廣場(chǎng)舞行為與主觀響度之間不相關(guān)外,其余聲學(xué)行為下面部表情效價(jià)與主觀評(píng)價(jià)指標(biāo)均顯著相關(guān)。此外,與聲源維度相比,面部表情效價(jià)在行為維度能解釋的聲景指標(biāo)更多,說(shuō)明行為對(duì)聲感知的影響不容忽視。
對(duì)于時(shí)間維度而言,除下午時(shí)段與多變性和愉悅感、中午時(shí)段與平靜感不相關(guān)外,一天內(nèi)不同時(shí)間段面部表情效價(jià)與主觀評(píng)價(jià)指標(biāo)之間均顯著相關(guān)。這表明時(shí)間因素對(duì)聲感知的影響具有規(guī)律性,可以通過(guò)聲景地圖進(jìn)行捕捉和分析。
(二)聲景地圖的多維度分析
未來(lái)城市需要從多維度構(gòu)建聲景地圖,以便進(jìn)行聲環(huán)境數(shù)據(jù)的對(duì)比分析。以聲源、時(shí)間、行為等維度為例,聲景地圖在這些變量分析中發(fā)揮了重要作用(圖3)。

1. 聲源維度分析
當(dāng)人工聲分布在聲景地圖中的自然觀賞區(qū)、濱水步行區(qū)時(shí),效價(jià)水平較低;而在表演區(qū)和健身區(qū)時(shí),效價(jià)水平較高。這表明在不同區(qū)域人工聲有著相反的作用,在進(jìn)行公園設(shè)計(jì)時(shí),應(yīng)注意將公共活動(dòng)區(qū)與自然景觀區(qū)進(jìn)行有效分離。
機(jī)械聲對(duì)于公園整體的效價(jià)水平普遍會(huì)產(chǎn)生消極影響,但健身區(qū)和表演區(qū)的效價(jià)水平比濱水步行區(qū)及自然觀賞區(qū)高。這表明在進(jìn)行公園分區(qū)設(shè)計(jì)時(shí),可以將健身區(qū)和表演區(qū)設(shè)置在靠近交通干道的位置,以降低機(jī)械聲對(duì)其他敏感區(qū)域的影響。
自然聲對(duì)于公園整體的效價(jià)水平普遍產(chǎn)生積極影響,而在自然觀賞區(qū)、濱水步行區(qū)效價(jià)水平明顯優(yōu)于健身區(qū)和表演區(qū)。這表明在以機(jī)械聲為主導(dǎo)的空間中引入自然聲,并不能有效地提升聲感知評(píng)價(jià)水平。
因此,以聲源維度建立的聲景地圖能有效地分析基地中各區(qū)域的劃分對(duì)聲感知的影響,可以作為設(shè)計(jì)師進(jìn)行聲環(huán)境分析的工具。
2. 時(shí)間維度分析
上午健身區(qū)、表演區(qū)的效價(jià)處在全園中比較低的水平,這表明這些區(qū)域在上午時(shí)段比較容易讓游客產(chǎn)生負(fù)面情緒。通過(guò)聲景地圖,游客可以選擇在下午光顧這些區(qū)域以便獲得更好的聲感知體驗(yàn)效果。
在自然觀賞區(qū)及濱水步行區(qū)效價(jià)水平較高,這表明上午時(shí)段在濱水步行區(qū)、自然觀賞區(qū)的游客情緒表現(xiàn)積極,適合在這個(gè)時(shí)間段內(nèi)進(jìn)行活動(dòng)。中午的人流量最低,因此公園整體的積極情緒水平明顯要高于上午。除局部健身區(qū)和表演區(qū)外,其余地點(diǎn)效價(jià)水平均在4以上,呈現(xiàn)積極水平。
而在人流量較大的下午,全園整體效價(jià)水平是三個(gè)時(shí)間段中最低的。這表明可以通過(guò)控制人流量調(diào)節(jié)公園中的聲感知水平。因此,以時(shí)間維度建立的聲景地圖既能有效地為居民最佳出行時(shí)間和路線指導(dǎo)提供幫助,也可以為政府部門(mén)進(jìn)行人流量調(diào)控提供依據(jù)。
3. 行為維度分析
當(dāng)健身行為發(fā)生在濱水步行區(qū)時(shí),效價(jià)水平最低。這表明當(dāng)健身行為出現(xiàn)在上述區(qū)域時(shí),會(huì)明顯地降低游客的聲感受。當(dāng)散步行為發(fā)生在濱水步行區(qū)和自然觀賞區(qū)這些區(qū)域時(shí)效價(jià)水平最高,在健身區(qū)及表演區(qū)時(shí)效價(jià)水平較低。這表明這些區(qū)域的聲環(huán)境最適合散步行為。
廣場(chǎng)舞行為只有發(fā)生在表演區(qū)時(shí)會(huì)顯示出積極情緒,在其余區(qū)域均為消極,這是因?yàn)閺V場(chǎng)舞使聲環(huán)境的主觀響度及多變性加大,進(jìn)而產(chǎn)生負(fù)面情緒。因此,以行為維度建立的聲景地圖可以幫助公眾選擇進(jìn)行活動(dòng)的地點(diǎn)。
(三)聲景地圖的動(dòng)態(tài)性分析
傳統(tǒng)的聲景地圖僅能反映區(qū)域內(nèi)靜態(tài)化的聲感知數(shù)據(jù),不能滿(mǎn)足未來(lái)城市中對(duì)聲環(huán)境動(dòng)態(tài)性變化分析的需求。因此,本研究根據(jù)面部表情的實(shí)時(shí)變化,以80秒時(shí)長(zhǎng)為例,探討了聲景地圖的動(dòng)態(tài)性分析的可能性(圖4)。

在以人工聲為主導(dǎo)的空間中,面部表情效價(jià)在0-30秒內(nèi)隨著時(shí)長(zhǎng)的增加而下降,而在30-80秒內(nèi)隨著時(shí)長(zhǎng)的增加而上升;在以自然聲為主導(dǎo)的空間內(nèi),效價(jià)則會(huì)隨時(shí)長(zhǎng)的增加而一直上升;在以機(jī)械聲為主導(dǎo)的空間內(nèi),隨著時(shí)長(zhǎng)的增加,效價(jià)整體呈先下降后平穩(wěn)趨勢(shì)。這說(shuō)明不同聲源維度之間面部表情效價(jià)隨時(shí)長(zhǎng)變化的趨勢(shì)具有顯著差異。因此,可以利用其動(dòng)態(tài)性特征展示聲景地圖中各聲源感知時(shí)長(zhǎng)對(duì)聲景評(píng)價(jià)的影響。
隨著時(shí)長(zhǎng)的增加,上午與中午時(shí)間段內(nèi)被試的效價(jià)整體呈上升趨勢(shì)。下午時(shí)間段,在0-30秒內(nèi)效價(jià)隨著時(shí)長(zhǎng)的增加有所下降,這是因?yàn)樵摃r(shí)段內(nèi)場(chǎng)地人流量突然增大,從而引發(fā)了聲壓級(jí)增加。之后隨著時(shí)長(zhǎng)的增加,效價(jià)呈恢復(fù)性上升趨勢(shì)。這說(shuō)明本研究中建立的聲景地圖不僅能反映不同時(shí)間段內(nèi)聲景的動(dòng)態(tài)性變化趨勢(shì),還能及時(shí)捕捉和分析場(chǎng)地內(nèi)突發(fā)事件對(duì)聲景的影響。
在0-40秒內(nèi)參與散步行為的效價(jià)隨著時(shí)長(zhǎng)的增加呈現(xiàn)上升趨勢(shì),之后趨于穩(wěn)定。而參與健身和廣場(chǎng)舞行為的效價(jià)隨著時(shí)長(zhǎng)的增加波動(dòng)較大,在測(cè)量時(shí)長(zhǎng)內(nèi)未能出現(xiàn)相對(duì)穩(wěn)定的變化趨勢(shì)。這表明80秒時(shí)長(zhǎng)的測(cè)量數(shù)據(jù)并不足以分析出廣場(chǎng)舞、健身這類(lèi)動(dòng)態(tài)性較強(qiáng)行為的變化規(guī)律,但與傳統(tǒng)聲景地圖相比仍能動(dòng)態(tài)地展示參與不同行為被試的聲景主觀感知情況。在后續(xù)研究中可通過(guò)適當(dāng)增加測(cè)量時(shí)長(zhǎng)的方式來(lái)使聲景地圖適用于更多的行為類(lèi)型。
總體而言,隨著時(shí)長(zhǎng)的增加,不同聲源、時(shí)間與行為維度的面部表情效價(jià)均有明顯的波動(dòng),這說(shuō)明面部表情分析可適用于變化豐富的室外聲環(huán)境,在構(gòu)建未來(lái)城市動(dòng)態(tài)化聲景地圖方面可以發(fā)揮重要作用。
面部表情分析助力發(fā)展智能化聲景地圖
本研究以哈爾濱市兒童公園為例,通過(guò)面部表情分析建立了面向未來(lái)城市的智能化聲景地圖。
首先,結(jié)果表明,面部表情分析數(shù)據(jù)可以有效地代替問(wèn)卷調(diào)查結(jié)果,用于建立智能化聲景地圖。具體而言,面部表情分析技術(shù)在樣本量方面是問(wèn)卷調(diào)查用時(shí)的一半;在測(cè)量時(shí)間和分析時(shí)間上僅為問(wèn)卷調(diào)查和聲漫步的1/5-1/3;對(duì)聲景指標(biāo)解釋程度上則要明顯優(yōu)于問(wèn)卷調(diào)查和聲漫步。
其次,研究建立了基于面部表情分析的多維度聲景地圖。通過(guò)時(shí)間、行為與聲源變化下的聲景分析,可以滿(mǎn)足未來(lái)城市中政府、設(shè)計(jì)師及公眾等層面對(duì)于建立相關(guān)法規(guī)、調(diào)控人流量、多尺度聲景設(shè)計(jì)以及公眾參與的需求(圖5)。

此外,研究結(jié)果提供了發(fā)展動(dòng)態(tài)聲景地圖的可行性。研究發(fā)現(xiàn)面部表情效價(jià)可以反映聲環(huán)境感知隨測(cè)量時(shí)長(zhǎng)變化的動(dòng)態(tài)效果,并解釋了各類(lèi)聲源刺激而產(chǎn)生的波動(dòng)效應(yīng)?;诖耍梢詫?shí)現(xiàn)聲景地圖的動(dòng)態(tài)化分析。
綜上所述,與傳統(tǒng)的聲景研究模型相比,基于面部表情分析的智能化聲景地圖具有客觀、高效、公共、實(shí)時(shí)的優(yōu)勢(shì),可以成為未來(lái)城市聲環(huán)境評(píng)估與設(shè)計(jì)的重要工具。
參考文獻(xiàn)
-
姜琬時(shí), 孟琪, & 李朦朦. (2022). 基于面部表情分析的未來(lái)城市聲景地圖研究——以哈爾濱市兒童公園為例. 新建筑, (6).
歡迎關(guān)注諾達(dá)思官方公眾號(hào),了解更多精彩內(nèi)容!