關於人們感知與數字視音訊編碼的關係入門-視覺篇01.
眾所周知,視音訊的數字化是為惹方便人們更好地記錄視聽而被人們所折騰出來的一門技術。既然主要是為惹人們而服務的,在我們的探究過程中就水到渠成地首先偏向於貼合人們所設計惹。本文主要是從生理角度上淺談一下人們與數字視音訊編碼的關係w。針對人類視覺系統,我們可以從光學、色度學、視覺生理學、視覺心理學、解剖學、神經科學和認知科學等領域去多方位的研究它與數字視訊的關係。
視覺部分01-主要是簡單介紹,日後會展開補充!
後續文章將對各種視覺系統模型進行淺度分析、歸納一些常用的理論.公式與示意圖,並會結合數字影象處理那本書來進行更多淺度解析。
轉載時請註明最下面的出處資訊!
光:人眼可見電磁波譜(波粒二象性);
簡而言之,"光"其本質是一種處於特定頻段的光子流。通俗不嚴謹一點來講光子流可以認為成由光的粒子組成,光子中的電子以不同頻率的震動並以波的形式釋放能量,從而發出了光。光的速度是恆定的,所以頻率越高,波長就越短。可見光由波長380nm到750nm之間的光子組成,稱為可見光譜。震動的頻率越高,顏色相對應的位置就會越高。
可見光譜的一些顏色被稱為黑色體,理論上一種理想的黑色物體被加熱時它可以呈現出光譜的顏色,並隨著溫度的變化而變化。
你能看到的任何東西都是由可見光譜中的光子組成。
光的頻率可用波長進行度量(可見光的波長用單位納米表示)。我們所能看到的光一般都是會發光的東西或者是通過各種反射反射過來的光。
眼睛則是人類採集光的器官,它是人們感官中最重要的器官,普通人大腦中大約有百分之80的記憶都是通過眼睛獲得的。
眼睛在做些什麼;
光有跳躍的,也有不跳躍的。當有光線碰(或者說打)到人眼後面的視網膜的時候,眼睛就順利完成了它的"採集"任務。光線通過眼角膜與瞳孔進入眼睛,打到晶狀體後晶狀體再將光聚焦產生一個焦平面,打到視網膜上,它們會把這些光線轉化為神經脈衝傳給腦子。過於靠近或遠離焦平面會讓"採集"的光在腦內形成的"影象"變得模糊。視網膜可以比喻為感光膠片或相機中的CCD。
視網膜上有"視感"與"視錐"兩種用於感光的細胞。每一隻人眼大概有1.2億個感光細胞,而這1.2億有95%左右都是視感細胞,它們對弱光和快速運動敏感,不過這些細胞只能感知亮度,而卻不能感知色度。錐細胞對藍紅或綠這三種色度敏感,不過在弱光下卻通常不能很好的工作。杆細胞主要對藍色敏感。
不過視網膜上的感光細胞不止只有兩個。比如"光敏中樞細胞(PGC)“,它可以在較長的週期內對光的數量做出反應。不過對於PGC來說,它原則上y用於沒有足夠的光線使錐細胞工作的時候。
人眼一般可以非常好的感知出相對亮度而且可以對照明的大量變化做出快速地調整,具有亮度適應性。我們能看到最弱的光線和不傷眼的最亮光線的比值大概是一萬億比一。從明視覺狀態到暗視覺狀態(暗適應)必須經過10-35s才能看到周圍物體,而反之卻僅需3-6s,這稱為明適應。人眼對光的敏感程度與光的波長和光輻射功率有關。
人眼一般具有三種不同型別的錐細胞,每一種針對一種特定波長的光,對應著紅黃藍。它對綠色最為敏感,其次是紅色,最後是藍色。如果你的眼睛感知不到紅或綠色,很大一部分的原因就是因為缺少一種錐細胞所致。在明視覺(相對於夜間視覺)的情況下,由於人眼對不同波長可見光的感受性不同,因此能量相同的不同色光表現出不同的明亮程度,黃綠色看著最亮,光譜兩端的紅色和紫色則暗得多。
大多數我們所感知的細節來自於眼睛所能看到的範圍的一個極小的區域,這個區域位於視野的正中心,稱為視網膜中央凹,關鍵性的錐細胞主要位於此。它只覆蓋惹視網膜的百分之一,但大腦的視覺部分百分之五十的資訊其實都來源於此。其它部分主要由用於弱光和高速視覺的杆細胞組成。所以我們通常在看東西的時候總會是對著要注視東西的某個大點,而很難做到利用起餘光"全方位"的去看。
大腦接到眼睛的訊號又是如何處理的:
人類通常都有很複雜的視覺系統..複雜到大腦的約1/4都在為視覺系統而服務,複雜到目前積極研究惹視覺神經學幾十年的人們還沒有商討出一個接近描述人眼的特徵來描述它。理想情況下人類大概可以分辨出一百萬種顏色,CIE(國際照明委員會)在1931年決定整個可見光譜可以用紅綠藍的混合色表示,研究出了一個色彩空間圖,基本證實惹這一點。
我們如何感知亮度:
相比顏色人們的感知能力更多地轉向惹亮度。我們在亮度下分辨清晰的邊緣和微小的細節的能力比分辨顏色要好得多。我們在一定程度上也能分辨出和它們周圍物體不同的物體移動,這意味著我們察覺移動的東西比靜止的東西更好。
我們觀看方式中的多數在某種角度上本質上並不是真實的,視覺錯覺會利用大腦大腦處理資訊的特點進行加工。
我們如何感知色彩:
和亮度相比,我們的色彩感知既模糊又慢。從人的視覺系統看,色彩可用色調、飽和度和亮度來描述。
色調(HUE)表示顏色的類別。彩色物體的色調取決於物體在光照下所反射的光譜成分。亮度(Luminance)是指人眼對光的明亮程度的感覺。飽和度(Saturation)指彩色光所呈現彩色的深度或純潔程度。對於同一色調的彩色光,其飽和度越高,它的顏色就越純;而飽和度越小,顏色就越淺或純度越低。色度指色調和飽和度的合稱,既反映惹彩色光的顏色,也反映惹顏色的深淺程度。
大量實驗表明,人眼大約可分辨37萬種顏色,能分辨128種不同的色調,5-10種不同的飽和度,對亮度十分敏感。
我們如何感知白色:
沒有色光等同於一點光都沒有,而可見光譜中也沒有白色光子。白色其實是反射所有可見波長的表面的顏色,在人類視覺中人們也常常把它與亮度變化所混淆。所以在不同情況下,我們感知為白色的顏色有相當一些不一樣,這取決於它的周圍是什麼。
我們如何感知立體與空間:
越接近所看的物體,我們每隻眼睛看到的影像就越不一樣。我們能夠利用差異的程度來確定物體的距離。雖然我們用一隻眼睛也能很好判斷東西在哪。人的兩隻眼睛存在間距(平均值為6.5cm),這就是雙目視差。
有許多因素可以引發我們看東西時的空間感知。它們包括相對大小、重疊、透視、光線和陰影、遙遠物體的藍色陰影,以及你相對物體移動腦袋時看到的物體的不同角度。
運動視差是由觀察者和景物發生相對運動所產生的,這種運動使景物的尺寸和位置在視網膜的投射發生變化,從而產生深度感。與此同時眼睛的適應性調節(通過晶狀體和附屬肌肉)眼睛主動調焦的行為和視差圖象在大腦中的融合(輻輳.雙眼與被觀察物體三點)都可以讓我們感知到立體視覺。
我們如何感知運動:
我們的大腦中有相當數量的神經細胞在尋找我們周圍的不同方向的運動。它們確保我們能夠非常快速地察覺並回應。這些運動感測細胞特別適應於察覺在複雜背景前面沿一個方向運動的物體。我們能夠在許多其他的物體中跟蹤一個單獨的物體,這也稱之為對比效應。
用視覺暫留舉例來說,典型地通過回放影像實現運動的感受需要每秒變化16次(16f/s(幀)),低於這個速度的東西看上去就像幻燈片。運動越快,看上去也就越自然流暢惹。這也稱之為視覺惰性。
我們的視野:
所謂視野即頭部不動時眼球向正前方注視所能看到的空間範圍,也稱為周邊視力,指黃斑中心凹以外的視力。正常人眼的最大範圍約在左右35度和上下40度,最佳視野範圍約在左右15度和上下15度,最大固定視野約在左右90度上下70度,頭部活動時視野可擴充套件到左右95度和上下90度。視野還受背景色的影響,例如黑色背景下的彩色視野範圍小於白色背景下的的彩色視覺範圍。
我們如何感知閃爍與細節:
人眼受到週期性光脈衝照射時,若重複的頻率不是很高,則會產生忽暗忽明的閃爍感覺。若將重複的頻率提高到某一定值以上,人眼將感覺不到閃爍,形成均勻的非閃爍光源的感覺。不引起閃爍感覺的光脈衝最低的重複頻率,稱為臨界閃爍頻率。比如在CRT映象管顯示器中重新整理率就是這個道理。
解析度就是指人眼對所觀察的實物細節或影象細節的辨別能力,具體量化起來就是能分辨出平面上的兩個點的能力。眼睛分辨景色細節的能力有一個極限值,將這種分辨細節的能力稱為人眼的解析度或視覺銳度。眼睛對被觀察物體上相鄰兩點之間能分辨的最小距離所對應視角的倒數。
我們所看不到的一些東西:
視訊對於人眼來說也有掩蔽效應,可以分為空間域中.時間域中和彩色的掩蔽效應。
視覺的大小不僅與鄰近區域的平均亮度有關,還與鄰近區域的亮度在空間上的變化(不均勻性)有關。在影象序列中相鄰畫面的變化劇烈(例如場景切換)時,人眼的解析度會突然下降。在亮度變化劇烈的背景上,人眼對色彩變化的程度也會明顯地降低。
@本地磁碟姬
ohayou.aimo.moe
2018年08月22日