日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数字媒体概论——2D图像图形

發(fā)布時(shí)間:2023/12/20 编程问答 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数字媒体概论——2D图像图形 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一:色彩基礎(chǔ)

1.1:色彩認(rèn)知

色彩是能引起我們共同的審美愉悅的、最為敏感的形式要素。色彩是最有表現(xiàn)力的要素之一,因?yàn)樗男再|(zhì)直接影響人們的感情。

豐富多樣的顏色可以分成兩個(gè)大類:無彩色系和有彩色系。有彩色系的顏色具有三個(gè)基本特性:色調(diào)、純度(也稱彩度、飽和度)、亮度。在色彩學(xué)上也稱為色彩的三大要素或色彩的三屬性

  • 色調(diào)(Hue):人眼看多種波長的光時(shí)所產(chǎn)生的彩色的感覺。反應(yīng)了顏色的種類,是決定顏色的基本特性。
  • 飽和度(Saturation):指色彩的鮮艷程度,也稱作顏色的純度
  • 亮度(Luminance / Lightness / Grayscale Value):單位是堪德拉每平米(cd/m2)或稱nit。是從白色表面到黑色表面的感覺連續(xù)體。圖像亮度是指畫面的明亮程度,圖像作用于人眼所引起的明亮程度的感覺。它與被觀察物體的發(fā)光或反射光強(qiáng)度有關(guān)。

色調(diào)差異:

飽和度差異:

亮度差異:

1.2:色彩表示

HSV顏色空間(Hue-Saturation-Value):根據(jù)顏色的直觀特性由A. R. Smith在1978年創(chuàng)建的一種顏色空間,顏色參數(shù)為色調(diào)H,飽和度S,明度V

HSI顏色空間 (Hue Saturation Intensity/Lightness), HSL:符合人視覺直觀特性的一種顏色空間,用H、S、I三參數(shù)描述顏色特性,其中H色調(diào);S表示顏色的深淺程度,稱為飽和度;I表示強(qiáng)度或亮度。

CMYK 彩色空間:是彩色印刷和彩色打印行業(yè)所用的,利用色料的三原色混色原理,加上黑色油墨,共計(jì)四種顏色混合疊加,形成所謂“全彩印刷”。

  • 四種標(biāo)準(zhǔn)顏色是:Cyan 青色,Magenta 品紅色,Yellow 黃色;black黑色
  • 青、品紅、黃是印刷三原色,理論上可以混合出黑色,但是現(xiàn)實(shí)中由于生產(chǎn)技術(shù)的限制,油墨純度往往不盡人意。為了降低成本更直接的方式是直接使用最常用的黑色油墨

YUV/YIQ 彩色空間:YUV/YIQ/YCrCb是被電視系統(tǒng)、視頻產(chǎn)業(yè)所廣泛采用的顏色空間

  • 其中“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用于指定像素的顏色。
  • YUV色彩空間的重要性是它的亮度信號Y和色度信號U、V是分離的。如果只有Y信號分量而沒有U、V信號分量,那么這樣表示的圖像就是黑白灰度圖像。彩色電視采用YUV空間正是為了用亮度信號Y解決彩色電視機(jī)與黑白電視機(jī)的兼容問題,使黑白電視機(jī)也能接收彩色電視信號。
  • YUV與RGB可以相互換算

RGB 彩色空間:RGB顏色標(biāo)準(zhǔn)是工業(yè)界的一種顏色標(biāo)準(zhǔn),是通過對紅?、綠(G)、藍(lán)(B)三個(gè)顏色通道的變化以及它們相互之間的疊加來得到各式各樣的顏色的

  • 這個(gè)標(biāo)準(zhǔn)幾乎包括了人類視力所能感知的所有顏色,是運(yùn)用最廣的顏色系統(tǒng)之一。
  • 顯示器、電腦大都采用了RGB顏色標(biāo)準(zhǔn)。在電腦中,RGB的亮度用整數(shù)來表示(例如8bit圖像取值范圍0-255) 。8bit圖像的RGB色彩總共能組合出約1678萬種色彩,即256×256×256=16777216。通常也被簡稱為1600萬色或千萬色。也稱為24位色。

視頻中為什么需要這么多的顏色空間?

雖然顏色還是那個(gè)顏色,但是不同的顏色空間的適用范圍并不相同:

  • RGB:面向采集和顯示設(shè)備
  • YUV:面向存儲
  • HSL:面向人類視覺感知
  • XYZ:RGB之間的轉(zhuǎn)換橋梁

從視頻采集到視頻消費(fèi)的整個(gè)過程,涉及到不同的設(shè)備和標(biāo)準(zhǔn),而不同的設(shè)備和標(biāo)準(zhǔn)所支持的色域空間又不相同。正是通過不同的顏色模型轉(zhuǎn)換和不同的色域轉(zhuǎn)換,才得以在不同輸入、輸出、顯示設(shè)備上都呈現(xiàn)出最好的顏色,才得以讓我們實(shí)現(xiàn)以近似相同的觀看體驗(yàn)來消費(fèi)視頻。

色深度/位深度 Bit Depth:色彩的數(shù)字化就是使用數(shù)字來代表顏色,計(jì)算機(jī)使用二進(jìn)制bit位,如果用n bit表示彩色,則可以表示2的n次方種顏色(范圍在0~2的n次方-1之間)

灰度 Grayscale:灰度使用黑色調(diào)表示物體。 每個(gè)灰度對象都具有從 0%(白色)到灰度條100%(黑色)的亮度值。

  • 在設(shè)計(jì)領(lǐng)域 “灰”形容飽和度
  • 在研究領(lǐng)域 是亮度的一種計(jì)算
  • 灰度值范圍與位深度有關(guān)

ALPHA通道(α Channel / Alpha Channel )是指圖片的透明和半透明度通道

  • 每個(gè)像素16比特存儲的位圖,每5個(gè)比特分別表示紅綠藍(lán)色,最后一個(gè)比特是阿爾法(透明/不透明)
  • 使用32個(gè)比特存儲的位圖,每8個(gè)比特表示紅綠藍(lán),和8bit阿爾法通道。在這種情況下,阿爾法通道還可以表示256級的半透明度。
  • Alpha Channel 指定圖像的透明度,在圖像編輯中有很多用途,例如蒙版
  • 阿爾法通道圖像中像素點(diǎn)的像素值計(jì)算:

1.3:BMP圖像文件格式

BMP格式,又稱為Bitmap(位圖),是Windows操作系統(tǒng)中的標(biāo)準(zhǔn)圖像文件格式。這種格式的特點(diǎn)是包含的圖像信息較豐富,幾乎不進(jìn)行壓縮

位圖文件由4個(gè)部分組成:

  • 位圖文件頭(bitmap-file header)
  • 位圖信息頭(bitmap-information header)
  • 顏色表(color table)
  • 位圖數(shù)據(jù)(Data Bits 或Data Body)

  • 顏色表256x4=1024B
  • 位圖數(shù)據(jù)
    • 每個(gè)像素占一個(gè)字節(jié),取得這個(gè)字節(jié)后,以該字節(jié)為索引查詢相應(yīng)的顏色
    • 24位、32位位圖不需要調(diào)色板,位圖數(shù)據(jù)區(qū)就不是索引而是實(shí)際的像素值
    • 24位RGB按照BGR的順序來存儲每個(gè)像素的各顏色通道的值,32位數(shù)據(jù)按照BGRA的順序存儲。一個(gè)像素的所有顏色分量值都存完后才存下一個(gè)下一個(gè)像素,不進(jìn)行交織存儲

1.4:色彩屬性的應(yīng)用示例

白平衡:白平衡是描述顯示器中紅、綠、藍(lán)三基色混合生成后白色精確度的一項(xiàng)指標(biāo)。反應(yīng)了白色在不同色溫下所體現(xiàn)的視覺感受,人眼可以自動根據(jù)環(huán)境調(diào)節(jié)色溫,而相機(jī)在不同色溫下的圖像視覺感受差別很大。所以有時(shí)候?yàn)榱怂囆g(shù)效果,有時(shí)候?yàn)榱艘曨l鏡頭白平衡的一致性,需要對白平衡進(jìn)行調(diào)整/設(shè)定

高動態(tài)范圍:傳統(tǒng)記錄顏色亮度信息一般是8位(Low Dynamic Range LDR),造成在計(jì)算和結(jié)果表達(dá)中差異范圍較少,因此反應(yīng)不了人眼所能感應(yīng)的光強(qiáng)度范圍(14+)。高動態(tài)范圍High Dynamic Range HDR圖像使用10、12、16、32位等更多bit來表現(xiàn)某一點(diǎn)的光照強(qiáng)度,并且在計(jì)算中采用高精度浮點(diǎn)運(yùn)算減少誤差。單張LDR恢復(fù)HDR的操作稱為逆色調(diào)映射(Inverse Tone Mapping ITM)

照相機(jī)和攝像機(jī)采集光強(qiáng)的傳感器精度也是8位,因此無法同時(shí)兼顧畫面中最亮和最暗的區(qū)域

HDR拍攝采用多曝光融合,形成最后亮、暗處都很清晰的畫面。

二:圖像

2.1:位圖

位圖:靜止的圖像是一個(gè)矩陣,陣列中的各項(xiàng)數(shù)字用來描述構(gòu)成圖像的各個(gè)點(diǎn)(稱為像素點(diǎn)Pixel )的顏色信息。這種圖像稱為位圖( Bit-mapped Image )

用數(shù)碼相機(jī)拍攝的照片、掃描儀掃描的圖片以及計(jì)算機(jī)截屏圖等都屬于位圖。位圖的特點(diǎn)是可以表現(xiàn)色彩的變化和顏色的細(xì)微過渡,產(chǎn)生逼真的效果,缺點(diǎn)是在保存時(shí)需要記錄每一個(gè)像素的位置和顏色值,占用較大的存儲空間。常用的位圖處理軟件有Photoshop(同時(shí)也包含矢量功能)、Painter和Windows系統(tǒng)自帶的畫圖工具等,Adobe Illustrator則是矢量圖軟件。

2.2:分辨率

分辨率:圖像分辨率(Image Resolution): 圖像中像素個(gè)數(shù),通常用水平垂直兩方向上的像素個(gè)數(shù)來表示

  • 圖像可以看做矩陣,矩陣中每個(gè)元素對應(yīng)圖像中每個(gè)像素
  • 超分辨率(Super-Resolution): 圖像放大、上采樣(Upsampling)、上尺度(Upscaling)

分辨率變化產(chǎn)生的圖像失真:

2.3:插值

插值 Interpolation:圖像插值就是利用已知鄰近像素點(diǎn)的灰度值(或rgb圖像中的三色值)來產(chǎn)生未知像素點(diǎn)的灰度值,以便由原始圖像再生出具有更高分辨率的圖像。

插值是對原圖像的像素重新分布,從而來改變像素?cái)?shù)量的一種方法。在圖像放大過程中,像素也相應(yīng)地增加,增加的過程就是“插值”發(fā)生作用的過程,“插值”程序自動選擇信息較好的像素作為增加、彌補(bǔ)空白像素的空間,而并非只使用臨近的像素,所以在放大圖像時(shí),圖像看上去會比較平滑、干凈。不過需要說明的是插值并不能增加圖像信息,盡管圖像尺寸變大,但效果也相對要模糊些,過程可以理解為白酒摻水。

下圖從左至右:低分辨率圖像;最近鄰插值; 雙線性插值; 雙三次插值; 高分辨率圖像

2.4:圖像位深度

圖像位深度 Image Bit-Depth:是圖像中用來表示每一個(gè)像素的色彩所用到的二進(jìn)制位數(shù),與之前色彩的數(shù)字化表示是一致的,也常稱為色深度。

  • 真彩圖像(True Color) :真彩色是指圖像中的每個(gè)像素值都分成R、G、B三個(gè)基色分量,每個(gè)基色分量直接決定其基色的強(qiáng)度。
  • 偽彩圖像(Pseudo Color):像素的顏色不是由基色分量直接決定,而是把像素值當(dāng)作彩色查找表(Color Look-Up Table, CLUT)的表項(xiàng)入口地址,查找相應(yīng)的R,G,B強(qiáng)度值。也叫做索引圖像。
  • 灰度圖像:把白色與黑色之間按對數(shù)關(guān)系分為若干等級,稱為灰度。灰度目前最高分為256階——8位。用灰度表示的圖像稱作灰度圖。

圖像的數(shù)字化:一幅未經(jīng)壓縮的數(shù)字圖像的數(shù)據(jù)量大小計(jì)算如下:

圖像數(shù)據(jù)字節(jié)量大小 = 像素總數(shù)×圖像深度÷8 = 水平分辨率×垂直分辨率 ×圖像深度÷8一幅640×480的256色圖像為: 640×480×8/8 = 307200 bytes/1024=300KB

圖像的色彩屬性:

2.5:圖像的顯示輸出屬性

圖像的顯示輸出屬性:對于顯示器、投影機(jī)、電視機(jī)等以點(diǎn)陣為核心顯示方式的輸出設(shè)備,有與圖像分辨率與色彩深度相關(guān)聯(lián)的屬性。

  • 顯示分辨率:顯示設(shè)備當(dāng)前可以顯示的像素點(diǎn)總數(shù)。如高清分辨率可達(dá)到1920×1080。
  • 色彩深度:顯示設(shè)備當(dāng)前可以表示的顏色種類與數(shù)量。

2.6:圖像的打印輸出屬性

圖像的打印輸出屬性:對于打印機(jī)、大型彩噴、數(shù)碼沖印等圖像輸出到實(shí)物的輸出設(shè)備,也有著與圖像自身屬性類似的輸出屬性。

  • 打印分辨率:以DPI (Dot Per Inch)表示,表示打印精度,一英寸紙面上能夠容納多少墨點(diǎn)。比如100DPI就是一英寸中最多有100個(gè)點(diǎn)。在數(shù)碼沖印中,300DPI是可達(dá)到的最好分辨率,而120DPI則是底線。
  • 色彩數(shù)量:是指輸出設(shè)備可以表示的色彩種類。HP最新的9色噴墨打印機(jī)的色彩變化可達(dá)三億八千八百萬種。

打印照片的問題:如何知道一張圖像適合打印多大尺寸的照片?

  • DPI:打印精度衡量單位,指每英寸上能夠繪制的最大像素點(diǎn)數(shù)
  • 高質(zhì)量:5寸或7寸、低質(zhì)量:10寸;需要圖像裁剪

2.7:圖像的輸入屬性

圖像的輸入屬性:

  • 數(shù)碼相機(jī)、攝像機(jī)、掃描儀等圖像采集設(shè)備的光學(xué)器件CMOS(互補(bǔ)金屬氧化物半導(dǎo)體)或者CCD(電荷耦合器件陣列),很大程度決定了輸入圖像的品質(zhì)。
  • 光學(xué)分辨率:直接由傳感器轉(zhuǎn)換信號得到的像素值個(gè)數(shù)。照相機(jī)一半是用像素?cái)?shù)目表示,如500萬像素;而掃描儀是用dpi,如1200dpi。
  • 光學(xué)傳感器色彩位感知:由一個(gè)特制的棱鏡式分光鏡,將影像的成像紅綠藍(lán)成分射到三個(gè)不同的CCD平面,然后通過軟件的對準(zhǔn)處理,合成為一幅完整的全彩色畫面。相機(jī)軟件用來記錄紅、藍(lán)、綠色的位數(shù),體現(xiàn)了其色彩深度。

光場相機(jī) Light Field:

  • 光場技術(shù),在1996年由斯坦福的Marc Levoy等人提出,采集光場的手段主要有兩種,一種是通過微透鏡陣列,這樣不但能記錄光線的強(qiáng)度信息,還能記錄光線的角度信息,另外一種是通過相機(jī)陣列技術(shù)。前者已經(jīng)由RenNG成功商業(yè)化成Lytro光場相機(jī)
  • 多相機(jī)陣列(Camera Arrays)利用不同空間位置的多個(gè)相機(jī)來采集不同視角的照片。斯坦福大學(xué)的Bennett Wilburn等人用廉價(jià)的相機(jī)搭建一個(gè)高性能的相機(jī)陣列
  • 當(dāng)所有的子相機(jī)之間的距離比較小時(shí),也就是相機(jī)緊挨著放在一起,這時(shí)整個(gè)相機(jī)陣列可以看作一個(gè)單中心投影相機(jī)(Single-Center-of-Projection Camera)。這時(shí)整個(gè)相機(jī)陣列可以用來產(chǎn)生超分辨率、高信噪比、高動態(tài)范圍的照片。
  • 當(dāng)所有的子相機(jī)之間的距離都很大時(shí),這時(shí)整個(gè)相機(jī)陣列可以看成是一個(gè)多中心投影相機(jī)(Multiple-Center-of-Projection Camera),整個(gè)相機(jī)陣列所產(chǎn)生的數(shù)據(jù)就叫做光場,通過這些數(shù)據(jù),我們可以得到物體的多視角信息,為其3D重建提供重要信息。

2.8:深度圖 Depth Map/Image

深度圖像(Depth image)也被稱為距離影像(range image),是指將從圖像采集器到場景中各點(diǎn)的距離(深度)作為像素值的圖像,它直接反映了景物可見表面的幾何形狀。

手機(jī)圖像采集+深度采集:

  • ToF Time of flight:TOF是面光源投射,將紅外光均勻的投射在物體上,然后使用TOF相機(jī)捕捉紅外光反射的時(shí)間差,通過計(jì)算得出景深信息
  • LiDAR Light Detection and Ranging,激光探測和測距:蘋果iPhone12手機(jī)用上了LiDAR激光雷達(dá)后,可以實(shí)現(xiàn)更快的對焦速度和更加精準(zhǔn)的3D建模,但是這顆雷達(dá)的探測距離僅為5米,所以和工業(yè)用途的激光雷達(dá)存在很大的性能差距

三:二維圖形

位圖圖像表示的局限性:

3.1:圖元

  • 圖元指基本圖形元素,是最簡單的圖形,是一組描述點(diǎn)、線、面等幾何圖形的大小、形狀及其位置、維數(shù)的指令集合。在圖形文件中只記錄生成圖的算法和圖上的某些特征點(diǎn),因此也稱矢量圖。
  • 任何一個(gè)圖形表達(dá)都是由若干不同的點(diǎn)、線、面圖案或相同的圖案循環(huán)組合而成的,這些基本點(diǎn)線面圖案就是圖元。
  • 圖形(Graphic)一般指用計(jì)算機(jī)繪制的畫面,由一些圖元組成。

3.2:矢量字體

矢量字體(Vector font)中每一個(gè)字形是通過數(shù)學(xué)曲線來描述的,它包含了字形邊界上的關(guān)鍵點(diǎn),連線的導(dǎo)數(shù)信息等。字體的渲染引擎通過讀取這些數(shù)學(xué)矢量,然后進(jìn)行一定的數(shù)學(xué)運(yùn)算來進(jìn)行渲染。這類字體的優(yōu)點(diǎn)是字體實(shí)際尺寸可以任意縮放而不變形、變色。

主流的矢量字體格式有3種:Type1,TrueType和OpenType,這三種格式都是與平臺無關(guān)的。

  • Type1全稱PostScript Type1,是1985年由Adobe公司提出的一套矢量字體標(biāo)準(zhǔn),由于這個(gè)標(biāo)準(zhǔn)是基于PostScript Description Language(PDL),而PDL又是高端打印機(jī)首選的打印描述語言,所以Type1迅速流行起來。但是Type1是非開放字體,Adobe對使用Type1的公司征收高額的使用費(fèi)。
  • TrueType是1991年由Apple公司與Microsoft公司聯(lián)合提出另一套矢量字標(biāo)準(zhǔn)。由TrueType 字庫產(chǎn)生的字體,這里簡稱成TrueType 字體,也是Windows 常用的字體,它是一種基于輪廓技術(shù)的字體,字體信息是用直線段,二次貝塞爾曲線來描述的,這使得他們比其它矢量的字體更容易處理,保證了屏幕與打印輸出的一致性;同時(shí),可以隨意縮放、旋轉(zhuǎn)而不必?fù)?dān)心會出現(xiàn)鋸齒,這也是矢量字體相對于點(diǎn)陣字體無可比擬的優(yōu)越性。

Type1使用三次貝塞爾曲線來描述字形,TrueType則使用二次貝塞爾曲線來描述字形。所以Type1的字體比TrueType字體更加精確美觀。一個(gè)誤解是,Type1字體比TrueType字體占用空間多。這是因?yàn)橥瑯用枋鲆粋€(gè)圓形,二次貝塞爾曲線只需要8個(gè)關(guān)鍵點(diǎn)和7段二次曲線;而三次貝塞爾曲線則需要12個(gè)關(guān)鍵點(diǎn)和11段三次曲線。然而實(shí)際情況是一般來說 Type1比TrueType要小10%左右。這是因?yàn)閷τ谏晕?fù)雜的字形,為了保持平滑,TrueType必須使用更多的關(guān)鍵點(diǎn)。由于現(xiàn)代大部分打印機(jī)都是使用PDL作為打印描述語言,所以Type1字體打印的時(shí)候不會產(chǎn)生形變,速度快;而TrueType則需要翻譯成PDL,由于曲線方程的變化,還會產(chǎn)生一定的形變,不如Type1美觀。

這么說來,Type1應(yīng)該比TrueType更具有優(yōu)勢,為什么如今的計(jì)算機(jī)上TrueType反而比Type1使用更廣泛呢?

  • Type1由于字體方程的復(fù)雜,所以在屏幕上渲染的時(shí)候,花費(fèi)的時(shí)間多,解決方案是大部分Type1字體嵌入了點(diǎn)陣字體,這樣渲染快,但是邊緣不光滑,比較難看。很多ps文檔和ps轉(zhuǎn)換的pdf文檔都是這樣,在計(jì)算機(jī)上瀏覽的時(shí)候字體很難看,但是打印出來很美觀。TrueType則渲染比較快,可以平滑的顯示在屏幕上,看上去很美觀。
  • Type1有高額使用費(fèi),使得Type1沒有被所有的操作系統(tǒng)所支持。Windows家族只有OS/2和windows 2000及之后的版本從操作系統(tǒng)級別開始支持Type1。由于這個(gè)問題,Adobe只好在其所有的產(chǎn)品中嵌入Adobe Type Manager(ATM)作為渲染引擎。
  • OpenType則是Type1與TrueType之爭的最終產(chǎn)物。1995年,Adobe公司和Microsoft公司開始聯(lián)手開發(fā)一種兼容Type1和TrueType,并且真正支持Unicode的字體,后來在發(fā)布的時(shí)候,正式命名為OpenType。OpenType可以嵌入Type1和TrueType,這樣就兼有了二者的特點(diǎn),無論是在屏幕上察看還是打印,質(zhì)量都非常優(yōu)秀。可以說OpenType是一個(gè)三贏的結(jié)局,無論是Adobe、Microsoft還是最終用戶,都從OpenType中得到了好處。Windows家族從Windows 2000開始,正式支持OpenType。打開系統(tǒng)的字體目錄(一般是C:\Windows\Fonts\或C:\Winnt\Fonts),可以看到:一個(gè)紅色A的圖標(biāo)的是點(diǎn)陣字體,兩個(gè)重疊的T的圖標(biāo)是TrueType字體,一個(gè)O的圖標(biāo)就是OpenType字體。

    3.3:二維圖形的顯示輸出

    由于當(dāng)前的顯示輸出裝置全部都是點(diǎn)陣方式,因此參數(shù)化的圖元必須被表達(dá)為圖像,即逐點(diǎn)顏色表達(dá)才能投射到屏幕上。這個(gè)從圖元到點(diǎn)陣的過程被稱之為光柵化(Rasterization),光柵化其實(shí)是一種將圖形變?yōu)槎S圖像的過程。

    3.4:反走樣技術(shù) Anti-Alasing

    由于采樣不充分重建后造成的信息失真,就叫走樣;用于減少或消除這種效果的技術(shù),就稱為反走樣。

    • 基于超采樣的方法 Supersampling Anti-Aliasing
    • 幾何反走樣:基于形態(tài)學(xué)的方法

    3.5:圖像處理中的圖形化表達(dá)

    圖形不擅長表達(dá)高頻變化的自然紋理;適宜于進(jìn)行邊界表達(dá)

    邊緣檢測:

    語義分割:

    3.6:矢量化研究

    非自然圖像:

    自然圖像:

    3.7:二維圖形的輸入

    人機(jī)交互為主的參數(shù)化輸入:

    圖像矢量化(描邊):

    3.8:二維圖形的輸出

    直接輸出方式—繪圖儀:可將計(jì)算機(jī)的輸出信息以圖形的形式輸出。主要可繪制各種管理圖表和統(tǒng)計(jì)圖、大地測量圖、建筑設(shè)計(jì)圖、電路布線圖、各種機(jī)械圖與計(jì)算機(jī)輔助設(shè)計(jì)圖等。一般直接與CAD軟件連接。

    間接輸出方式—圖像輸出:

    3.9:2D動畫

    傳統(tǒng)2D動畫:

    • 逐幀動畫(傳統(tǒng)手繪)
    • 動畫制作流程:任務(wù)劃分->原畫->中間畫->上色->拍攝

    計(jì)算機(jī)技術(shù)輔助動畫:

    • 電腦輔助中間畫
    • 電腦輔助上色
    • 電腦輔助后期

    現(xiàn)代動畫制作流程:

    基于AI的2D動畫生成:

    3.10:圖像與圖形

    兩者本質(zhì)是數(shù)字化表達(dá)方式不同

    四:采集與生成

    4.1:攝影設(shè)備的發(fā)展


    4.2:2D圖像圖形軟件細(xì)分

    2D圖像圖形軟件工作分為:調(diào)色功能、像素處理、圖層對象、圖形繪制、排版布局

    4.3:常見2D格式

    • BMP:Windows中最常用的圖象格式,有壓縮和非壓縮兩種,存儲文件的容量較大,可表現(xiàn)單色到24位的色彩
    • DXF:AutoCAD中的圖形文件,以ASCII方式存儲圖形,表現(xiàn)圖形的尺寸大小非常準(zhǔn)確,是2D圖形的通用交換格式
    • WMF:微軟Windows圖元文件,文件短小,圖案造型化
    • GIF:各種平臺的各種圖形處理軟件上均可以使用的經(jīng)過壓縮的圖形格式。存儲的色彩數(shù)最高只能達(dá)到256種,色彩深度低。具有一定的動畫效果,所以多用在Web上
    • JPG:通過一種有損壓縮方案獲得的高壓縮率的圖像文件,色彩最高可以達(dá)到24位其“有損性”一般不易被人察覺,廣泛應(yīng)用于Web中,沒有alpha通道,壓縮率高。
    • PNG:一種采用無損壓縮算法的位圖格式。壓縮比高,生成文件容量小。有8位、24位、32位三種形式,其中8位PNG支持兩種不同的透明形式(索引透明和alpha透明),24位PNG不支持透明,32位PNG在24位基礎(chǔ)上增加了8位透明通道。常用于視頻序列圖存儲以及AI算法研究
    • TIF:文件體積龐大,但存儲的信息量也是巨大,細(xì)微層次的信息較多,支持的顏色數(shù)最高可以達(dá)到16M,廣泛應(yīng)用在輕印刷行業(yè)中。常用于紋理材質(zhì)貼圖、高質(zhì)量印刷圖像
    • PSD:Photoshop中的標(biāo)準(zhǔn)文件格式,專門為Photoshop而優(yōu)化
    • CRD:CorelDraw的文件格式
    • SWF:FLASH的發(fā)布格式,其實(shí)是一種多媒體文件的格式

    五:圖像壓縮

    5.1:圖像分塊

    圖像被分割成大小為8x8的小塊,這些小塊在整個(gè)壓縮過程中都是單獨(dú)被處理的,最后再同樣拼接成最終結(jié)果

    5.2:色彩空間變換

    • RGB三通道同等重要,YCbCr/YUV亮度與色度分離
    • 對于人眼來說,圖像中明暗的變化更容易被感知到。人眼有兩種感光細(xì)胞,能夠感知亮度變化的視桿細(xì)胞,以及能夠感知顏色的視錐細(xì)胞,由于視桿細(xì)胞在數(shù)量上遠(yuǎn)大于視錐細(xì)胞,所以更容易感知到明暗細(xì)節(jié)

    5.3:JPEG圖像格式

    JPEG(Joint Photographic Experts Group,聯(lián)合圖像專家小組):此團(tuán)隊(duì)創(chuàng)立于1986年,其于1992年發(fā)布的 JPEG 標(biāo)準(zhǔn)在1994年獲得了 ISO 10918-1 的認(rèn)定,成為了圖片壓縮標(biāo)準(zhǔn)。

    為什么要壓縮:圖像的數(shù)據(jù)量通常很大,所以就給圖像的存儲、處理和傳輸帶來了很大的問題。為了應(yīng)對這些問題,就需要對圖像進(jìn)行壓縮。

    為什么可以壓縮:數(shù)據(jù)中存在空間、視覺、編碼等冗余。

    PEG壓縮分四個(gè)步驟實(shí)現(xiàn):顏色模式轉(zhuǎn)換及采樣、DCT變換、量化、編碼

    1.顏色模式轉(zhuǎn)換及采樣:RGB色彩系統(tǒng)是我們最常用的表示顏色的方式。JPEG采用的是YCbCr色彩系統(tǒng)。想要用JPEG基本壓縮法處理全彩色圖像,得先把RGB顏色模式圖像數(shù)據(jù),轉(zhuǎn)換為YCbCr顏色模式的數(shù)據(jù)。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計(jì)算公式可完成數(shù)據(jù)轉(zhuǎn)換。 Y=0.2990R+0.5870G+0.1140B Cb=-0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813B+128 人類的眼晴對低頻的數(shù)據(jù)比對高頻的數(shù)據(jù)具有更高的敏感度,事實(shí)上,人類的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的數(shù)據(jù)是比較重要的。既然Cb成份和Cr成份的數(shù)據(jù)比較相對不重要,就可以只取部分?jǐn)?shù)據(jù)來處理。以增加壓縮的比例。JPEG通常有兩種采樣方式:YUV411和YUV422,它們所代表的意義是Y、Cb和Cr三個(gè)成份的數(shù)據(jù)取樣比例。

    2.DCT變換:DCT變換的全稱是離散余弦變換(Discrete Cosine Transform),是指將一組光強(qiáng)數(shù)據(jù)轉(zhuǎn)換成頻率數(shù)據(jù),以便得知強(qiáng)度變化的情形。若對高頻的數(shù)據(jù)做些修飾,再轉(zhuǎn)回原來形式的數(shù)據(jù)時(shí),顯然與原始數(shù)據(jù)有些差異,但是人類的眼睛卻是不容易辨認(rèn)出來。 壓縮時(shí),DCT使用64個(gè)基(Basis)表示任意 8x8 圖像塊。只要用系數(shù)(系數(shù)表示每個(gè)單獨(dú)的基對整體圖像所做的貢獻(xiàn))對這64個(gè)余弦波進(jìn)行加權(quán),就可以表示出任何的圖形。


    和FFT一樣,DCT也是將信號從時(shí)域到頻域的變換,不同的是DCT中變換結(jié)果沒有復(fù)數(shù),全是實(shí)數(shù)。每8x8個(gè)像素值都變成了另外8x8個(gè)權(quán)重/系數(shù)值(經(jīng)過取整,取值范圍 -1024~1023)。

    3、量化:圖像數(shù)據(jù)轉(zhuǎn)換為頻率系數(shù)后,還得接受一項(xiàng)量化程序,才能進(jìn)入編碼階段。DCT變換后,低頻部分集中在每個(gè)8x8塊的左上角,高頻部分在右下角。低頻部分比高頻部分要重要得多,移除很多高頻信息可能對于編碼信息只損失了很少信息。量化就是用使用量化矩陣與前面得到的DCT矩陣逐項(xiàng)相除并取整。由于量化表左上角的值較小,右下角的值較大,這樣就起到了保持低頻分量,抑制或丟掉高頻分量的目的


    對Y采用細(xì)量化,對UV采用粗量化,可進(jìn)一步提高壓縮比。所以上面所說的量化表通常有兩張,一張是針對亮度的;一張是針對色度的。

    量化表是控制 JPEG 壓縮比的關(guān)鍵,是根據(jù)人眼對不不同頻率的敏感程度的差別所積累下的經(jīng)驗(yàn)制定的,可以根據(jù)輸出圖片的質(zhì)量來調(diào)整量化表,表中數(shù)字越大則質(zhì)量越低,壓縮率越高。

    4、編碼:游程編碼(Run-length Encode, RLE)為了保證低頻分量先出現(xiàn),高頻分量后出現(xiàn),以增加行程中連續(xù)“0”的個(gè)數(shù),RLE采用了“之”字型(Zig-Zag)的排列方法。編碼采用EOB(End Of Block)字段,表示從字段開始后面全為0。然后再根據(jù)Huffman編碼再進(jìn)行壓縮,Huffman編碼無專利權(quán)問題,成為JPEG最常用的編碼方式

    變換、量化、編碼過程回顧:

    JPEG壓縮效果:

    如果有興趣了解更多相關(guān)內(nèi)容,歡迎來我的個(gè)人網(wǎng)站看看:瞳孔的個(gè)人空間

    總結(jié)

    以上是生活随笔為你收集整理的数字媒体概论——2D图像图形的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。