時間:2023-03-21 17:12:40
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇圖像處理技術論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

基于圖像采集卡的視頻圖像處理系統(tǒng)
計算機圖像處理系統(tǒng)從系統(tǒng)層次上可分為高、中、低檔三個層次,目前一般比較普及的是低檔次的系統(tǒng),該系統(tǒng)由CCD(攝像頭)、圖像采集卡、計算機三個部分組成,其結構簡單,應用方便,效果也比較不錯,得到的圖像較清晰。目前網(wǎng)上基于VC開發(fā)經(jīng)驗的文章不少,可是關于如何在VC開發(fā)平臺上使用圖像采集卡的文章確沒發(fā)現(xiàn),筆者針對在科研開發(fā)中積累的使用圖像采集卡經(jīng)驗,介紹如何自己是如何將采集卡集成到圖像開發(fā)系統(tǒng)中,希望能夠給目前正需要利用圖像采集卡開發(fā)自己的圖像處理系統(tǒng)的朋友有所幫助。
使用的攝像機采用臺灣BENTECHINDUSTRIAL有限公司生產(chǎn)的CV-155L黑白攝像機。該攝像機分辨率為752x582。圖象采集卡我們采用北京中科院科技嘉公司開發(fā)的基于PCI總線的CA-MPE1000黑白圖象采集卡。使用圖像采集卡分三步,首先安裝采集卡的驅動程序,并將虛擬驅動文件VxD.vxd拷貝到Windows的SYSTEM目錄下;這時候就可以進入開發(fā)狀態(tài)了,進入VC開發(fā)平臺,生成新的項目,由于生產(chǎn)廠家為圖像采集卡提供了以mpew32.dll、mpew32.lib命名的庫文件,庫中提供了初始硬件、采集圖像等函數(shù),為使用這些函數(shù),在新項目上連接該動態(tài)庫;最后一步就是采集圖像并顯示處理了,這一步要設置系統(tǒng)調(diào)色板,因為采集卡提供的是裸圖形式,既純圖像數(shù)據(jù),沒有圖像的規(guī)格和調(diào)色板信息,這些需要開發(fā)者自己規(guī)定實現(xiàn),下面是實現(xiàn)的部分代碼:
CTestView::CTestView()
{
W32_Init_MPE1000();//初始化采集卡
W32_Modify_Contrast(50);//下面的函數(shù)是為了對采集卡進行預設置
W32_Modify_Brightness(45);//設置亮度
W32_Set_HP_Value(945);//設置水平采集點數(shù)
wCurrent_Frame=1;//當前幀為1,獲取的圖像就是從這幀取得的
//設置采集信號源,僅對MPE1000有效
W32_Set_Input_Source(1);
W32_CACardParam(AD_SETHPFREQ,hpGrabFreq);
W32_Set_PAL_Range(1250,1024);//設置水平采集范圍
W32_Set_VGA_Mode(1);
wGrabWinX1=0;//采集窗口的左上角的坐標
wGrabWinY1=0;
firstTime=TRUE;
bGrabMode=FRAME;
bZipMode=ZIPPLE;
/
lpDib=NULL;//存放獲取的圖像數(shù)據(jù)
}
CTestView::~CTestView()
{
W32_Close_MPE1000();//關閉采集卡
}
////顯示采集的圖象,雙擊鼠標采集停止
voidCTestView::OnGraboneframe()
{
//TODO:Addyourcommandhandlercodehere
wCurrent_Frame=1;
//設置采集目標為內(nèi)存
W32_CACardParam(AD_SETGRABDEST,CA_GRABMEM);
//啟動采集
if(lpDib!=NULL)
{
GlobalUnlock(hglbDIB);
GlobalFree(hglbDIB);
}
//分配內(nèi)存
hglbDIB=GlobalAlloc(GHND,(DWORD)wImgWidth*(DWORD)wImgHeight);
lpDib=(BYTE*)GlobalLock(hglbDIB);
hdc=GetDC()->GetSafeHdc();
if(lpDib!=NULL)
{
cxDib=wImgWidth;
cyDib=wImgHeight;
SetLogicPal(hdc,cxDib,cyDib,8);
SetStretchBltMode(hdc,COLORONCOLOR);
bGrabMark=TRUE;
while(bGrabMark==TRUE)
{
if(msg.message==WM_LBUTTONDBLCLK)
bGrabMark=FALSE;
W32_ReadXMS2Buf(wCurrent_Frame,lpDib);
SetDIBitsToDevice(hdc,0,0,cxDib,cyDib,0,0,
0,cyDib,(LPSTR)lpDib,
bmi,
DIB_RGB_COLORS);
}
//停止采集
W32_CAStopCapture();
::ReleaseDC(GetSafeHwnd(),hdc);
return;
}
////將下面這個函數(shù)添加在視圖類的CTestView::OnSize()函數(shù)中,就可以對系統(tǒng)的調(diào)色板進行設置。
voidWINAPIInitLogicPal(HDChdc,shortwidth,shortheight,WORDbitCount)
{
intj,i;
shortcxDib,cyDib;
LOGPALETTE*pLogPal;
j=256
if((pLogPal=(LOGPALETTE*)malloc(sizeof(LOGPALETTE)+(j*sizeof(PALETTEENTRY))))==NULL)
return;
pLogPal->palVersion=0x300;
pLogPal->palNumEntries=j;
for(i=0;ipLogPal->palPalEntry[i].peRed=i;
pLogPal->palPalEntry[i].peGreen=i;
pLogPal->palPalEntry[i].peBlue=i;
pLogPal->palPalEntry[i].peFlags=0;
}
hPal=::CreatePalette(pLogPal);
deletepLogPal;
::SelectPalette(hdc,hPal,0);
::RealizePalette(hdc);
cxDib=width;cyDib=height;
if((bmi=(BITMAPINFO*)malloc(sizeof(BITMAPINFOHEADER)+j*sizeof(RGBQUAD)))==NULL)
return;
//bmi為全局變量,用于顯示圖像時用
bmi->bmiHeader.biSize=40;
bmi->bmiHeader.biWidth=cxDib;
bmi->bmiHeader.biHeight=cyDib;
bmi->bmiHeader.biPlanes=1;
bmi->bmiHeader.biBitCount=bitCount;
bmi->bmiHeader.biCompression=0;
bmi->bmiHeader.biSizeImage=0;
bmi->bmiHeader.biXPelsPerMeter=0;
bmi->bmiHeader.biYPelsPerMeter=0;
bmi->bmiHeader.biClrUsed=0;
bmi->bmiHeader.biClrImportant=0;
for(i=0;ibmi->bmiColors[i].rgbBlue=i;
bmi->bmiColors[i].rgbGreen=i;
bmi->bmiColors[i].rgbRed=i;
bmi->bmiColors[i].rgbReserved=0;
}
}
視頻"畫中畫"技術
"畫中畫"這個概念類似與彩色電視機"畫中畫",就是在一幅大的圖像內(nèi)顯示另外一幅內(nèi)容不同的小的圖像,小圖像的尺寸大小一般地說為大圖像尺寸的1/4或1/9,顯示位置在大圖像的右上角。這種技術不僅在電視技術中,在可視電話系統(tǒng)也可以發(fā)現(xiàn)這種技術的身影,它們都是依靠硬件來實現(xiàn)的,但是如何在VC開發(fā)平臺上用編程語言來將該功能添加到自己開發(fā)的視頻監(jiān)控軟件,為使用者提供更大的信息量呢?也許讀者最容易想到的是首先顯示大圖像,然后再在一個固定位置畫第二幅小圖像,這種技術技術如果對于靜止圖像當然沒有問題,但是對于視頻流,由于每一秒鐘需要畫25幀,即25幅圖像,這樣一來計算機需要不停的畫不停的擦除,會給用戶以閃爍的感覺,如何解決這個問題呢?有的參考書上將大小圖像分快顯示,這種方法要將待顯示的圖像數(shù)據(jù)與顯示位置的關系對應起來,容易出錯不說,而且麻煩,且速度慢,為此,我對該方法進行了改進,得到了滿意的效果。實現(xiàn)的代碼如下:
voidpictureinpicture()
{
………………………..
CBitmapbitmap,*oldmap;
pData1=(BYTE*)newchar[biWidth*biHeight*3];//biWidth和biHeight為視頻采集卡獲取//的圖像尺寸。
Read(pData1,bih.biWidth*bih.biHeight*3);//該函數(shù)從采集卡中獲取數(shù)據(jù)
CClientDCdc(this);
m_pBMI1=newBITMAPINFO;//自定義的BMP文件信息結構,用于后面的圖像顯示
m_pBMI1->bmiHeader.biBitCount=24;
m_pBMI1->bmiHeader.biClrImportant=0;
m_pBMI1->bmiHeader.biClrUsed=0;
m_pBMI1->bmiHeader.biCompression=0;
m_pBMI1->bmiHeader.biHeight=biHeight;
m_pBMI1->bmiHeader.biPlanes=1;
m_pBMI1->bmiHeader.biSize=40;
m_pBMI1->bmiHeader.biSizeImage=WIDTHBYTES(biWidth*8)*biHeight*3;
m_pBMI1->bmiHeader.biWidth=biWidth;
m_pBMI1->bmiHeader.biXPelsPerMeter=0;
m_pBMI1->bmiHeader.biYPelsPerMeter=0;
////////////////////////////////////////////////////////////////////////
pData2=(BYTE*)newchar[biWidth1*biHeight1*3];//申請存放小圖像的緩沖區(qū)
Read(pData2,biWidth1*biHeight1*3);////向該緩沖區(qū)讀數(shù)據(jù)
m_pBMI2=newBITMAPINFO;
m_pBMI2->bmiHeader.biBitCount=24;
m_pBMI2->bmiHeader.biClrImportant=0;
m_pBMI2->bmiHeader.biClrUsed=0;
m_pBMI2->bmiHeader.biCompression=0;
m_pBMI2->bmiHeader.biHeight=biHeight1;
m_pBMI2->bmiHeader.biPlanes=1;
m_pBMI2->bmiHeader.biSize=40;
m_pBMI2->bmiHeader.biSizeImage=WIDTHBYTES(biWidth1*8)*biHeight1*3;
m_pBMI2->bmiHeader.biWidth=biWidth1;
m_pBMI2->bmiHeader.biXPelsPerMeter=0;
m_pBMI2->bmiHeader.biYPelsPerMeter=0;
//下面實現(xiàn)畫中畫的顯示
CDCMemDc;
MemDc.CreateCompatibleDC(&dc);
bitmap.CreateCompatibleBitmap(&dc,biWidth,biHeight);
oldmap=MemDc.SelectObject(&bitmap);
::StretchDIBits(MemDc.m_hDC,0,0,biWidth,biHeight,0,0,—biWidth,biHeight,pData1,m_pBMI1,DIB_RGB_COLORS,SRCCOPY);//首先將大圖像畫在內(nèi)寸上下文中
::StretchDIBits(MemDc.m_hDC,20,20,biWidth1,biHeight1,_
0,0,biWidth1,biHeight1,pData2,m_pBMI2,DIB_RGB_COLORS,SRCCOPY);//再將小圖像畫在內(nèi)寸上下文中
::StretchBlt(dc.m_hDC,0,0,bih.biWidth,bih.biHeight,_
MemDc.m_hDC,0,0,bih.biWidth,bih.biHeight,SRCCOPY);//將結果顯示在屏幕上。
MemDc.SelectObject(oldmap);
deletepData1;
deletem_pBMI1;
關鍵詞:煙葉數(shù)字圖像;邊緣處理;形態(tài)學變換;特征抽取;智能識別
1引言
煙葉是煙草工業(yè)的基礎原料, 對煙草工業(yè)生產(chǎn)質(zhì)量和煙草行業(yè)經(jīng)營效益具有舉足輕重的作用。對煙葉生產(chǎn)過程的各個環(huán)節(jié)包括煙葉品質(zhì)的智能識別進行技術創(chuàng)新,提高品質(zhì)和效率,是一個前沿研究方向[1][5]。
當前這一方面的研究,主要集中在數(shù)字圖像處理方面,把煙葉品質(zhì)的數(shù)字圖像處理與神經(jīng)網(wǎng)絡技術相結合,實現(xiàn)煙葉品質(zhì)的智能識別,是一個極有價值的工作。以下在此方面作出一個系統(tǒng)的、較為完備的、易于實際操作的研究。
2主要技術手段
2.1 MAⅡAB圖像處理工具箱
在MATLAB平臺上,借助圖像處理工具箱,可以簡易明快地實現(xiàn)對煙葉數(shù)字圖像的圖像處理。在煙葉生產(chǎn)一線,用數(shù)碼照相機對各種煙葉樣本進行拍照,輸入計算機,用MAT_LAB將它轉換為各(.bmp;.jpeg;.gif;.png;.t 圖片以便進行圖像處理。成本低,精確度高,宜于普及推廣。獲取各種類型的煙葉數(shù)字圖像以后,經(jīng)閾值使用權圖像二值化,可以當即辨識出這一圖像是否具有何種類型的病蟲害或品質(zhì)異變。利用煙葉數(shù)字圖像的邊緣檢測、輪廓提取等分析命令,獲得待測煙葉的圖像參數(shù)和特征,再由神經(jīng)網(wǎng)絡技術,完成對煙葉品質(zhì)的智能識別。
2.2神經(jīng)網(wǎng)絡技術
神經(jīng)網(wǎng)絡是一個新的智能識別工具。畢業(yè)論文 經(jīng)過訓練的神經(jīng)網(wǎng)絡能夠存儲與過程有關的信息,能直接從歷史數(shù)據(jù)中學習,經(jīng)過用各種煙葉樣本訓練和學習的神經(jīng)網(wǎng)絡,能自動地識別出待測煙葉樣本的品質(zhì)類型。而且,神經(jīng)網(wǎng)絡具有濾除噪聲及在有噪聲情況下得出正確結論的能力。這一點對于煙葉生產(chǎn)實際中大量存在各種噪聲信息的情況而言,特別重要。它特別適合在線識別。
3應用MATLAB圖像處理工具箱和神經(jīng)網(wǎng)絡技術對煙葉品質(zhì)智能識別的操作過程
3.1煙葉圖片樣本庫的建立
用數(shù)碼相機或其它數(shù)字圖像采集工具,采集各種類型的煙葉的標準圖片,分類歸檔,借助MATLAB圖像變換功能,將各種類型的煙葉的標準圖片,轉換成各種圖片形式:.bmp;.jpeg;.sir;.png;.tif等,以便隨時調(diào)用。這些煙葉圖片,有不同品質(zhì)的樣本;還有各種病蟲害標本和變異標本。
3.2用直方圖均衡來實現(xiàn)圖像增強
當從生產(chǎn)一線采集的煙葉待測樣本的圖像對比度較低,碩士論文 即灰度直方圖分布區(qū)間較窄時,可用直方圖均衡實現(xiàn)灰度分布區(qū)間展寬而達到圖像增強的效果。
3.3煙葉圖像的邊緣檢測和特征提取
煙葉圖像的基本特征之一是圖像邊緣。圖像邊緣是圖像周圍像素灰度有階躍性變化或屋頂變化的像素的集合。煙葉的邊緣是由灰度的不連續(xù)性所致,因此考察圖像每個像素在某個鄰域內(nèi)灰度的變化,利用邊緣鄰近一階或二階方向導數(shù)變化規(guī)律可以檢測煙葉圖像邊緣。圖像特征反映煙葉的幾何結構,如面積、周長、分形分維數(shù)、孔洞數(shù)、歐拉數(shù)等等。圖像特征的選擇是圖像識別的重要環(huán)節(jié)。運用二叉分類法在找出判別特征后,對不同的圖像特征由分類閾值按二分的方法進行分類;運用相似距離分類方法把待判圖像與一個標準圖像相比,標準圖像用樣本圖像特征向量的均值來表示。通過計算待判圖像與標準圖像之問的在相空間中的距離來判別圖像和進行分類。這一過程還為用神經(jīng)網(wǎng)絡技術實現(xiàn)對煙葉品質(zhì)進行智能識別作出必要的準備。
3.4數(shù)字圖像矩陣數(shù)據(jù)的顯示及其傅立葉
變換這一變換的目的是為提取特征、進行神經(jīng)網(wǎng)絡模式識別等作出必要的準備。
轉貼于 3.5直方圖均勻化
這是使煙葉圖像性質(zhì)更為優(yōu)良而采取的一個技術操作,源代碼如下:
I=imread ("yangshuo.tif');imshow (I);
figure,imhist(I);
[J,T]=histeq (I,64);
%圖像灰度擴展到0-255,但是只有64個灰度級
figure,imshow (J);
figure,imhist(J);
figure,Dlot((0:255)/255,T);%轉移函數(shù)的變換曲線
J=histeq (I,32);
figure,imshow 0);
%圖像灰度擴展到0~255,但是只有32個灰度級
figure,imhist(J);
3.6采用二維中值濾波函數(shù)對受椒鹽噪聲干擾的圖像濾波
MATLA圖像處理工具箱具有強大的功能,能夠對噪聲干擾的煙葉圖片進行消噪處理,模擬源代碼如下:
I=imread ("eight.tif');
imshow (I);
J2=imnoise (I,"salt&pepper ,0.04);
%疊加密度為0.04 的椒鹽噪聲
figure,imshow 02);
I_Filterl=medfdt2 (J2,[3 ,3]);
%窗口大小為3x3
figure.imshow (I Fiher1);
I_Filter 2=medfdt2 (J2,[5, 5]);
%窗口大小為5x5
figure,imshow (I_Filter2);
I_Filter3=medf'dt2 (J2,[7, 7]);
%窗口大小為7x7
figure,imshow (I_Filter3);
3.7用神經(jīng)網(wǎng)絡技術對煙葉圖像進行智能識別
神經(jīng)網(wǎng)絡作為一種自適應的模式識別技術,并不需要預選給定有關模式的經(jīng)驗知識和判別函數(shù),它能通過自身的學習機制自動形成所要求的決策區(qū)域。網(wǎng)絡的我由其拓樸結構、神經(jīng)元特性、學習和訓練規(guī)則所決定,它可以充分利用狀態(tài)信息,對不同狀態(tài)一一進行訓練而獲得某種映射關系,并且,網(wǎng)絡可以連續(xù)學習,即使環(huán)境變異,這咱映射關系可以自適應調(diào)整。在上面各節(jié)獲取煙葉圖像特征基礎之上,可以用神經(jīng)網(wǎng)絡技術進行圖像模式識別。例如,基于概率神經(jīng)網(wǎng)絡PNN的煙葉品質(zhì)智能識別,它的主要優(yōu)點是:快速訓練,訓練時問僅略大于讀取數(shù)據(jù)時間;無論分類多么復雜,只要有足夠的訓練數(shù)據(jù)(而這是煙葉生產(chǎn)一線可以做到的),就可以保證獲得貝斯葉準則下的最優(yōu)解,允許增加或減少訓練數(shù)據(jù)而無需重新進行長時間訓練。這一神經(jīng)網(wǎng)絡對于煙葉品質(zhì)的圖像識別,具有重要意義。 4結論
基于計算機視覺和神經(jīng)網(wǎng)絡技術的煙葉品質(zhì)識別的數(shù)字圖像處理方法,醫(yī)學論文 是煙葉生產(chǎn)環(huán)節(jié)的一種技術創(chuàng)新,它可以在煙葉生產(chǎn)一線普及推廣,簡便易行,能夠較大地提高煙葉品質(zhì)檢測的效率和質(zhì)量,以及自動化程度和智能化水平。
參考文獻
[1]于潤偉.基于圖像處理的稻米堊白自動檢測研究[J].中國糧油學報,2007,1:122—124.
Abstract: In order to improve the accuracity of the recognition research of Asphalt-aggregate ratio for asphalt mixture ,the MATLAB digital image processing were used to study the asphalt-aggregate ratio for asphalt mixture AC-13C and the researches mainly include 3 respects: the mixing proportion design and the image collection of asphalt mixture, the research of digital image processing technology, the asphalt-aggregate ratio recognition of asphalt mixture. The results show that there is a good linear functional correlation between the real asphalt-aggregate ratios and the recognition asphalt-aggregate ratios. The linear fitting function was created as Pay = 1.6872Pax-5.4606, and the correlation coefficient R2 is 0.9617.
關鍵詞:數(shù)字圖像處理;瀝青混合料;油石比;識別
Key words: digital image processing;asphalt mixture;asphalt-aggregate ratio;recognition
中圖分類號:TU535 文獻標識碼:A文章編號:1006-4311(2010)13-0093-02
0引言
隨著交通運輸業(yè)的迅速發(fā)展,必須要提高瀝青混合料性能,開發(fā)新型瀝青路面結構材料。瀝青含量是瀝青混合料配合比設計和施工控制的重要指標,在很大程度上決定了瀝青路面的質(zhì)量品質(zhì),國內(nèi)外現(xiàn)行的瀝青混合料配合比檢測一般采用的是試驗方法,進行離心抽提或燃燒瀝青,檢測過程復雜,耗時長,不利于及時對路面狀況做出評價,指導生產(chǎn)。近年來,數(shù)字圖像處理技術被引入瀝青混合料研究領域,為有效解決傳統(tǒng)研究方法的缺陷提供了可能,國內(nèi)外也陸續(xù)進行了采用圖像處理技術對瀝青混合料內(nèi)部形態(tài)的研究,國內(nèi)外現(xiàn)階段進行的研究表明,數(shù)字圖像處理技術具有無破損、方便性、經(jīng)濟性,而且能快速全面反映形態(tài)特性以及空間分布的特點。為此,在本研究中,通過大量室內(nèi)對比試驗,主要研究不同油石比的瀝青混合料AC-13C的識別油石比,以建立識別油石比和實際油石比之間的線性關系,用于指導生產(chǎn)實踐。
1瀝青混合料配合比設計及圖像采集
本研究中采用的瀝青為埃索A級70號瀝青,選用瀝青路面的表面層AC-13C的級配,最終確定的瀝青混合料合成級配見表1。
在本研究中,瀝青混合料AC-13C分別采用五個不同油石比4.0%、4.5%、5.0%、5.5%和6.0%,用馬歇爾擊實儀成型馬歇爾試件,在成型后的試件中隨機抽取3個試件進行水平兩分法的切割,并采用數(shù)碼相機進行圖像的采集工作,在進行油石比的識別中為了計算簡便將圖像剪切為1400×1400像素。
2瀝青混合料數(shù)字圖像處理
由于照相機與目標間的相對運動、大氣擾動等原因使圖像質(zhì)量下降,造成了圖像退化的現(xiàn)象。所以在圖像處理之前要先進行圖像復原,在MATLAB圖像處理系統(tǒng)中,選擇Lucy-Richardson復原方法,通過處理減少了圖像中產(chǎn)生的噪聲,忽略了某些退化后壞了的像素。對復原后的RGB彩色圖像進行灰度變換,獲得瀝青混合料水平截面的灰度圖像。
3瀝青混合料油石比的識別
以油石比為5.5的瀝青混合料RGB圖像為例,對剪切后的圖像進行復原、轉換灰度圖像處理,處理后的灰度圖像的直方圖見圖1。
根據(jù)圖1可以看到,由于瀝青混合料圖像中存在集料和瀝青兩大類,在圖像上形成了兩個峰,這兩者都近似服從正態(tài)分布,最左邊的波峰代表瀝青的灰度分布,我們可以根據(jù)瀝青混合料圖像的直方圖,動態(tài)選取兩個波峰之間的谷底值,將最左邊的波峰單獨切取出來,見圖2。對這個波峰進行擬合,經(jīng)過多次嘗試,選擇采用兩個正態(tài)分布擬合這個波峰,相關系數(shù)達到0.998,其中一個正態(tài)分布峰頂對應的灰度值與單獨切取出來的波峰峰頂對應的灰度值非常接近,可以認為兩者的灰度值是相同的,另外一個正態(tài)分布是對前者的修正,擬合效果見圖2。
通過MATLAB編程計算可以得到,瀝青灰度分布波峰峰頂對應的灰度值為0.30,第一個小峰服從正態(tài)分布,參數(shù)為0.29997和0.047629,通過多次實驗在峰值灰度值左側設定2.5,右側設定的范圍內(nèi)為瀝青的灰度分布范圍,計算得到瀝青的灰度分布范圍為46.14至88.65,提取瀝青灰度范圍內(nèi)的像素點,圖像內(nèi)所有的像素點數(shù)目與瀝青的像素點數(shù)目之差為集料的像素點數(shù)目,得到油石比即瀝青像素點數(shù)目與集料像素點數(shù)目之比,計算得到這張實際油石比為5.5的圖像,識別油石比為6.43。同理,可以按照相同的方法求得其余瀝青混合料圖像的識別油石比,并計算均值,見表2,對得到的識別油石比用EXCEL進行線性擬合,見圖3。
從表2中可以看出,識別油石比的變異系數(shù)在0.18以下,通過線性相關性分析可得到識別油石比Pax與實際油石比Pay的線性關系為:Pay=1.6872Pax-5.4606,式中,Pax為識別油石比,%;Pay為實際油石比,%。兩者相關系數(shù)R2為0.9617,表明采用圖像處理技術對瀝青混合料進行油石比識別具有較高的識別精度,可以用于瀝青路面油石比的快速檢測。
4結論
通過選取表面層普通瀝青混合料AC-13C進行馬歇爾試驗,對試件進行水平截面圖像的分析,在瀝青混合料圖像灰度直方圖中,對瀝青分布波峰左側2.5倍σ和右側σ范圍內(nèi)提取瀝青像素數(shù)目,并計算集料像素數(shù)目和識別油石比,結果表明,動態(tài)的選取瀝青灰度范圍識別油石比的方法能夠較好地反映實際油石比,得到的識別油石比與實際油石比較為接近,得到的變異系數(shù)在0.18以下,證明識別油石比的離散程度較小,數(shù)據(jù)可靠。并且實際油石比Pay和識別油石比Pax存在線性關系,通過線性擬合后,建立函數(shù)Pay =1.6872 Pax 5.4606,計算得到相關系數(shù)R2為0.9617,具有良好的相關性。因此,建議采用此線性函數(shù)對識別得到的油石比進行修正。
參考文獻:
[1] 楊浩.瀝青混合料的數(shù)字圖像特征研究[D]:[碩士學位論文].哈爾濱:哈爾濱工業(yè)大學,2006.
[2] 肖彭.基于MATLAB7.0的瀝青混合料最佳油石比優(yōu)化設計[J].交通標準化,2005,17(11):73-75.
【關鍵詞】FPGA 圖像處理 實時高速 平滑算法
1 數(shù)字圖像處理及FPGA技術簡介
1.1 數(shù)字圖像處理原理簡介
圖像處理技術是本世紀信息科學方面成長最迅速的方向之一,數(shù)字圖像處理的技術具有實際的研究價值。數(shù)字圖像處理技術是指利用圖像信號轉化為數(shù)字信號并進行數(shù)字化處理這一手段把輸入圖像轉換成具有所希望特征的另一幅圖像的過程,通過轉化,使得圖像的信息數(shù)字化,可計算化,協(xié)調(diào)適應現(xiàn)在的各種數(shù)字化系統(tǒng)。近年來,隨著圖像傳感器趨于高集成度和低成本以及數(shù)字硬件的迅速發(fā)展,高質(zhì)量、高速度、高實時性的數(shù)字圖像處理技術越來越受到歡迎。專用集成電路ASIC和數(shù)字信號處理器DSP,在兩種方面突破研究,一是改變圖像處理算法,簡化算法提高處理速度;二是改變實現(xiàn)算法的手段。DSP處理速度較之前的數(shù)字芯片有了大幅改進,但其體系仍是串行指令系統(tǒng),其固定算法仍不能滿足眾多算法的需要。
1.2 現(xiàn)場可編程門陣列(FPGA)器件技術
現(xiàn)在較為流行的一種半定制的數(shù)字芯片是現(xiàn)場可編程門陣列(FPGA)器件,它是一種高密度可編程邏輯器件,由大量邏輯宏單元構成,通過各種程序參數(shù)的配置,能夠發(fā)揮這些邏輯單元的各自效果,組合出期望的整體效果和功能,這些配置數(shù)據(jù)存放在片內(nèi)的SRAM中或者是片外的EPROM或其他存儲體中,設計者可以現(xiàn)場修改器件的邏輯順序,而且靜態(tài)編程和動態(tài)系統(tǒng)重置功能也得到了充分的發(fā)揮也應用,基于組合邏輯下的功能讓硬件模塊可以像軟件代碼一樣方便修改調(diào)試。
2 基于FPGA的數(shù)字圖像處理算法研究
2.1 實時圖像處理算法
實時圖像處理系統(tǒng)和圖像處理的主要算法有4類:圖像數(shù)據(jù)的預處理,圖像智能識別,對象檢測和運動對象檢測。在實時圖像處理系統(tǒng)的后臺處理中,比分析環(huán)境簡單、靜態(tài)圖像難度要更具有復雜性,如在數(shù)字圖像信號的傳送過程,中間過程傳感器和傳輸信道的噪聲的頻繁產(chǎn)生,這讓暫未得到處理的原始圖像信號變的更為難以分析,而且本身存在一定程度的噪聲。一般圖像信號的銳化技術處理也將引入噪聲,有時會加強原始圖像的噪聲。因此,有必要在圖像分析處理以前以及過程中對圖像的噪聲進行濾除,并對圖像特征進行加強,消除噪聲和增強圖像這兩大關鍵步驟即為數(shù)字信號圖像的預處理過程。
2.2 圖像空域平滑算法
圖像平滑處理的的主要目的是為了降低噪音干擾,目前主流的兩種算法是的空間域平均算法以及中值濾波算法。對于含有噪聲的原始圖像的每個像素都采取了對應的鄰域,將計算出的平均值作為平均空間域中圖像像素值進行圖像處理。空間域平均算法對于高斯噪聲消噪效果較好,但處理脈沖噪聲降噪效果很差。中值濾波的實質(zhì)是一種非線性處理方法,主要的原理應用了順序統(tǒng)計思路,這種方法的原理是在第一步驟中賦予一個像素作為鄰域的中心,選擇方形鄰域后,第二步驟就是對范圍內(nèi)各像素灰度值進行排序處理,排序之后獲得數(shù)列的中間值,此中間修正值被記為中心像素的灰度值,在實際應用中個,中值濾波算法消除脈沖噪聲具有更好的效果。
2.3 圖像空域銳化算法
圖像銳化的主要目的是使原圖像輪廓模糊或者顯示邊緣不明顯的變得清晰,突出細節(jié)。進行銳化處理的前提基礎是:原始圖像必須具有有較高的信噪比,若沒有較高信噪比,經(jīng)過圖像銳化處理后,圖像信噪比會大大降低,這非常不利于圖像的清晰顯示處理。通常的做法是先去除或降低噪聲,使得圖像具有更高的信噪比后,再進行后期的銳化處理。
圖像銳化處理目前主流有兩種方法:高通濾波法和微分法。微分法屬于圖像空域銳化,目前常用的兩種方法是梯度銳化和拉普拉斯銳化。
2.3.1 梯度銳化
梯度銳化原則:圖像變化速度值小的對應于一個較小的梯度,整體會顯得比較暗。因此,梯度銳化的常規(guī)思路是利用門限方法來判定,從而進行梯度銳化優(yōu)化,也就是先賦予一個預定的閾值,如果該節(jié)點的梯度小于閾值時,原始灰度被保持恒定;若大于閾值時,在這一點上的灰度校正值可以用微分法處理得到。
2.3.2 拉普拉斯運算
拉普拉斯運算是偏導數(shù)運算的線性組合,拉普拉斯算子是一種各向同性的微分算子,其特性包括旋轉不變性。拉普拉斯運算完全可以轉換成模板運算,而且對圖像中的孤立點和短點反應較為敏感,比如在較暗的圖像中出現(xiàn)的個別亮點,這些亮點處灰度發(fā)生跳變,通過拉普拉斯運算將會使這些亮點亮度增強,這一效果常用于邊緣檢測。當然,拉普拉斯運算同梯度銳化一樣,在增強圖像的同時會增強噪聲,因此在銳化前可以先進行圖像平滑處理。
3 總結
本文以基于FPGA的高速圖像處理算法為研究主體,對圖像處理中技術的流水線實現(xiàn)、圖像空域平滑算法、圖像空域銳化算法進行對比分析。圖像平滑算法減少噪聲的效果要更加優(yōu)化,平滑算法的中值濾波算法在消除脈沖噪聲中效果更為突出。空間域平均算法主要對高斯噪聲的消噪效果較好,對脈沖噪聲消噪效果一般。圖像空域銳化算法可以是原本邊緣模糊的圖像清晰化,前提需要有較高信噪比,所以一般是先進行去除噪聲,提高信噪比之后進行銳化處理,銳化算法中的梯度銳化、拉普拉斯運算算法都在基于FPGA的數(shù)字圖像處理的系統(tǒng)算法中效果明顯。
參考文獻
[1]李冬.基于FPGA的數(shù)字圖像處理的研究[D].安徽理工大學碩士學位論文,2009.
[2]宇野麻由子.FPGA規(guī)模快速增大[J].電子設計應用,2008(10)
關鍵詞:多媒體課件;圖形;圖像;處理;加工
中圖分類號:TP75文獻標識碼:A文章編號:1009-3044(2009)35-10087-03
Multimedia Courseware Image Processing and Graphics Processing Technology
LIN Han
(Florida Vocational and Technical College, Sichuan Machinery and Electronic and Information Engineering, Dazhou 653000, China)
Abstract: In the multi-media courseware creation,preparation of multimedia material is a very important part.Multimedia material,including text,images,graphics,animation,sound,video and so on. In these types of material,the graphic image is a multi-media courseware application of the most basic,the most important and most of the material,its handling and processing are also the most complex,the following response to this problem were discussed.
Key words: CAI; graphics; image; treatment; processing
由于多媒體技術的不斷發(fā)展,對于多媒體課件的質(zhì)量要求是越來越高,多媒體輔助教學已經(jīng)廣泛應用,這是利用計算機技術和網(wǎng)絡技術來組織教學的一種新型教學手段,它帶來了課堂教學的新革命。
多媒體課件需具備以下特點: 1) 豐富的表現(xiàn)力;2) 良好的交互性;3) 極大的共享性。多媒體課件在教學中的使用,改善了教學媒體的表現(xiàn)力和交互性、促進了課堂教學內(nèi)容、教學方法、教學過程的全面優(yōu)化,提高了教學效果。一個好的多媒體課件需要多媒體素材來點綴
1 圖形圖像的概念
1)圖形圖像格式
圖形圖像格式主要有:BMP格式、GIF格式、JPEG格式、JPEG2000格式、TIFF格式、PSD格式、PNG格式、SWF格式、SVG格式等。其它非主流圖形圖像格式:PCX格式、DXF格式、WMF格式、EMF格式、LIC(FLI/FLC)格式、EPS格式、TGA格式等。比較常用的有BMP格式、JPEG格式、GIF格式等等,所以我們在進行圖形圖像處理以前,首先要對圖形圖像的格式要有清晰的認識,只有在此基礎上才可以進行進一步的開發(fā)處理。
2)圖形圖像素材的獲取
多媒體課件中的圖形圖像,按其用途分,一般有三種,一是背景圖,二是按鈕圖,三是與教學內(nèi)容相關圖。一般情況下,圖形圖像素材的獲取進入昵圖網(wǎng)可以找到很多行業(yè)的圖片,找到需要的圖片后保存圖片,若網(wǎng)頁設置為不能保存,可以用復制粘貼的方法保存圖片。對于一些素材原創(chuàng),可以在相應的圖形圖像處理軟件中進行創(chuàng)作。主要獲取方法:利用掃描儀、數(shù)碼相機從外部采集圖形圖像數(shù)據(jù);經(jīng)過Photoshop等圖象處理軟件處理、利用抓圖工具來抓取屏幕上顯示的圖像等這些都是最常用的;還可以通過從網(wǎng)上下載、從電視節(jié)目中錄制、從課件中截取、從資源光盤或資源庫中獲取、從VCD片中獲取等幾種方法。
圖形素材也可以自己進行繪制,課件工具中都有相應的繪制工具,可直接用繪圖工具進行繪制。
2 圖形圖像區(qū)別
1)存儲方式的區(qū)別:圖形存儲的是畫圖的函數(shù);圖像存儲的則是像素的位置信息和顏色信息以及灰度信息。
2)縮放的區(qū)別:圖形在進行縮放時不會失真,可以適應不同的分辨率;圖像放大時會失真,可以看到整個圖像是由很多像素組合而成的。
3)處理方式的區(qū)別:對圖形,可以旋轉、扭曲、拉伸等等;而對圖像,可以進行對比度增強、邊緣檢測等等。
4)算法的區(qū)別:對圖形,我們可以用幾何算法來處理;對圖像,可以用濾波、統(tǒng)計的算法。
5)其他:圖形不是主觀存在的,是根據(jù)客觀事物而主觀形成的;圖像則是對客觀事物的真實描述。
3 圖像的處理
自從20世紀60年代出現(xiàn)了計算機圖像處理技術,為圖像處理提供了一種精確、靈活、通用的工具,從而極大拓展了圖像處理的應用領域。
1)圖像處理的發(fā)展
雖然圖像處理起源比圖形學早30多年,但是它的應用卻比圖形學足足晚了10多年,原因就是數(shù)字圖像比圖形所含的信息量大很多,只有當計算機發(fā)展到一定水平才能進入大規(guī)模的實用階段。
1921年,第一個數(shù)字圖像傳輸系統(tǒng)――巴特蘭電纜圖片傳輸系統(tǒng)橫跨大西洋傳輸圖像成功;1929年,第一次實現(xiàn)15級灰度的圖像編碼并引進了一套用編碼穿孔紙袋來調(diào)制光束進而使底片感光的圖像輸出設備;1952年,哈夫曼發(fā)表關于最小冗余度編碼的論文《構造最小冗余度編碼的一種方法》;1964年,在阿波羅載人登月計劃中首次采用計算機對月球圖片進行處理;1980年代中期,開始對圖像處理進行大規(guī)模應用研究;自從數(shù)字圖像處理這門學科誕生以來,圖像處理作為一門基礎學科,得到重大的發(fā)展。
2)圖像處理的概述
圖像處理一般指數(shù)字圖像處理,用計算機對圖像進行分析,以達到所需結果的技術。常見的處理有圖像數(shù)字化、圖像編碼、圖像增強、圖像復原、圖像分割和圖像分析等。
①圖像數(shù)字化
通過取樣和量化過程將一個以自然形式存在的圖像變換為適合計算機處理的數(shù)字形式。圖像在計算機內(nèi)部被表示為一個數(shù)字矩陣,矩陣中每一元素稱為像素。圖像數(shù)字化需要專門的設備,常見的有各種電子的和光學的掃描設備,還有機電掃描設備和手工操作的數(shù)字化儀。
②圖像編碼
對圖像信息編碼,以滿足傳輸和存儲的要求,編碼能壓縮圖像的信息量,但圖像質(zhì)量幾乎不變。編碼方法有對圖像逐點進行加工的方法,也有對圖像施加某種變換或基于區(qū)域、特征進行編碼的方法。
③圖像壓縮
由數(shù)字化得到的一幅圖像的數(shù)據(jù)量十分巨大,圖像壓縮對于圖像的存儲和傳輸都十分必要。有兩類壓縮算法,即不失真的方法和近似的方法。前者用于靜態(tài)圖像,后者用于動態(tài)圖像。
④圖像增強和復原
圖像增強的目標是改進圖片的質(zhì)量,使圖像清晰或將其轉換為更適合人或機器分析的形式,所用方法可分成頻率域法和空間域法,它們可用于去除或減弱噪聲。圖像復原常用二種方法,一是建立退化源的數(shù)學模型;二是建立原始圖像的模型。
關鍵詞:棒材 計數(shù) 圖像
棒材自動計數(shù)分隔一直是未能徹底解決的問題,目前我國棒材生產(chǎn)企業(yè)普遍采用人工計數(shù)方法。該方法勞動強度大,工作效率低,系統(tǒng)生產(chǎn)能力有限,而且準確性難以保證。針對這種情況,我們想通過采用現(xiàn)代化手段和技術創(chuàng)新,能否開發(fā)出適合我國鋼鐵企業(yè)的棒材自動計數(shù)系統(tǒng),以有效提高勞動生產(chǎn)率,把工人從繁重的體力勞動和惡劣環(huán)境中解放出來,力求為企業(yè)提供高科技設備,現(xiàn)從以下方面論證自動計數(shù)系統(tǒng)可行性。
針對軋鋼廠棒材生產(chǎn)工藝現(xiàn)狀,為了實現(xiàn)標準化打捆包裝要求,我們希望利用綜合圖像識別、機械系統(tǒng)、光電檢測和控制技術,實現(xiàn)棒材生產(chǎn)線計數(shù)定支環(huán)節(jié)機械化和自動化操作。
軋鋼廠中,生產(chǎn)線上的棒材在進行打捆包裝之前需要計數(shù),每種規(guī)格的每捆數(shù)量是不同的,計數(shù)必須按不同規(guī)格的棒材要求在線完成。當棒材從傳輸輥道上移送到計數(shù)鏈條臺架上時,有重疊和交叉現(xiàn)象,尤其是對φ6mm~φ14mm小規(guī)模棒材更是如此,這就使棒材的分離工作難度增加,也給計數(shù)工作帶來了一定的誤差。所以需要特定的執(zhí)行機構對棒材進行處理。下面淺談一下棒材自動計數(shù)系統(tǒng)的思路和原理。
棒材在線自動計數(shù)分隔系統(tǒng)可由振動裝置、阻擋振動平鋪振動裝置、光電計數(shù)、分離裝置、圖像處理和控制系統(tǒng)幾部分組成,如圖1所示。
圖像處理系統(tǒng)包括軟件和硬件部分,通過對棒材分散程度進行辨別確定是否符合平鋪前要求。振動裝置用來振動直徑較小的多層棒材的情況。棒材阻擋振動平鋪裝置是一個齒臂結構,其上有主齒臂和副齒臂,可以調(diào)整齒形的大小。光電計數(shù)利用光纖傳感器檢測棒材通過,可編程控制器進行計數(shù)累加。控制系統(tǒng)以目前在工業(yè)現(xiàn)場應用。
圖1 棒材在線自動計數(shù)分隔系統(tǒng)的組成
阻擋振動平鋪裝置是本系統(tǒng)的一個最重要的組件,安裝在二段傳送鏈之間的軋道上。該裝置為一個齒臂機構放在一個振動平臺上,上有主齒臂和副齒臂,可以調(diào)節(jié)齒的大小,該裝置結構簡單,并且具有振動功能,能夠適應現(xiàn)場復雜狀況,不會出現(xiàn)堵死現(xiàn)象。此機構在擋住棒材的同時,又進行圖像處理的計數(shù)。當計數(shù)值超過設定值時,齒臂機構升起,對棒材進行平鋪處理,只有實現(xiàn)了平鋪,后面的光電計數(shù)裝置才有意義。其結構簡圖如圖2所示。
設計齒臂時,應考慮以下因素:
(1)齒臂的數(shù)量不宜過多或過少。齒臂安置過多,會使整個系統(tǒng)龐大、笨重,并且增加制造成本造成浪費。(2)將齒臂安裝在棒線材平鋪于傳送鏈條上時撓度最大的位置(即兩鏈條的中間處),以減少棒材可能出現(xiàn)交叉情況的點,同時,也便于安裝。(3)齒形設計。齒的深度應保證棒線材落如齒槽后,高點與齒的上表面在同一水平面上,以減小下滑棒材與齒臂間的摩擦系數(shù),便于棒材滑落。齒槽間距過窄可能導致計數(shù)分離環(huán)節(jié)的分離手無法準確開要分離的棒材,因此,最小齒間距應足夠寬。(4)為了滿足不同直徑棒材批量生產(chǎn)的需要將齒槽寬設計成可調(diào)整,可以有效降低系統(tǒng)的生產(chǎn)、安裝成本,并避免由于拆換齒臂造成的生產(chǎn)效率降低。
分離裝置是系統(tǒng)重要的執(zhí)行機構,是實現(xiàn)棒材自動分離的關鍵設備,也是機械系統(tǒng)設計的另一個重點和難點。
分離系統(tǒng)可以采用汽缸裝置組成。當計數(shù)值達到定支數(shù)時,可編程控制器發(fā)出信號,鏈條停止運動,分離系汽缸升起,以擋住后面的棒材,鏈條運動,把棒材自動分離開來,而前面的棒材由傳送鏈輸送到收集槽中,進行捆扎打包。
圖像采集區(qū):齒臂正上方即為圖像采集區(qū)。當傳送鏈將棒材運送致齒臂上方時,齒臂前端的擋板將阻礙棒線材繼續(xù)向前運動,從而使棒材處于圖像采集區(qū),便于攝像頭準確采集棒線材端面圖像。
振動平鋪:當圖像處理計數(shù)裝置記錄的棒材數(shù)目超過設定值時,齒臂將緩慢傾斜至臨界角度,使齒臂上棒材分為兩部分。一部分將落入臂齒;另一部分將沿傾斜的臂齒滑下。
本論文在分析現(xiàn)有棒材計數(shù)方法的基礎上,對比國內(nèi)外目前同類棒材自動計數(shù)方法,提出了一種利用圖像處理和識別技術實現(xiàn)工業(yè)生產(chǎn)線上棒材自動計數(shù)的新方法,對于小直徑棒材,圖像處理方法顯示出其優(yōu)越性;提出了一種棒材在線自動計數(shù)分隔方法,包括機械系統(tǒng)、圖像處理、光電檢測以及控制系統(tǒng),為棒材計數(shù)開辟了一條新途徑;結合工業(yè)現(xiàn)場環(huán)境,設計了一套機械系統(tǒng)包括振動裝置、阻擋振動平鋪裝置、分離裝置,能夠實現(xiàn)棒材的平鋪和分離,并分析了振動模型的運動仿真,為棒材在線自動計數(shù)分隔系統(tǒng)的實現(xiàn)奠定了基礎;通信的可靠實現(xiàn)是系統(tǒng)運行的關鍵。本論文中,從軟、硬件兩方面給出了PLC與變頻器通信設計方案和具體實現(xiàn)。該種通信設計經(jīng)濟實用,實現(xiàn)方便。
棒材在線計數(shù)分隔是一個非常復雜的系統(tǒng),本文的計數(shù)方案是基于現(xiàn)有的圖像處理技術,充分考慮了現(xiàn)場因素對系統(tǒng)的影響,具有很強的實用價值。
參考文獻
[1]章家?guī)r.棒材自動計數(shù)系統(tǒng)的設計與應用[J].全國第二屆特種電源與元器件學術年會論文集,2002.
[2]王培珍.圖像邊緣檢測融合方案初探[J].安徽工業(yè)大學學報,2001.
關鍵詞:數(shù)字圖像 圖像處理 數(shù)字技術 應用
一、數(shù)字圖像處理綜述
數(shù)字圖像處理(Digital Image Processing)又稱為計算機圖像處理,它是指將圖像信號轉換成數(shù)字信號并利用計算機對其進行處理的過程。
數(shù)字圖像處理最早出現(xiàn)于20世紀50年代,當時的電子計算機已經(jīng)發(fā)展到一定水平,人們開始利用計算機來處理圖形和圖像信息,數(shù)字圖像處理作為一門學科大約形成于20世紀60年代初期,早期的圖像處理的目的是改善圖像的質(zhì)量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像,常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。
首次獲得實際成功應用的是美國噴氣推進實驗室(JPL),他們對航天探測器徘徊者7號在1964年發(fā)回的幾千張月球照片使用了圖像處理技術,如幾何校正、灰度變換、去除噪聲等方法進行處理,并考慮了太陽位置和月球環(huán)境的影響,由計算機成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對探測飛船發(fā)回的近十萬張照片進行更為復雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅實的基礎,也推動了數(shù)字圖像處理這門學科的誕生。在以后的宇航空間技術,醫(yī)學技術中數(shù)字圖像處理技術都發(fā)揮了巨大的作用。
從70年代中期開始,隨著計算機技術和人工智能、思維科學研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展,人們已開始研究如何用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計算機視覺。很多國家,特別是發(fā)達國家投入更多的人力、物力到這項研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的視覺計算理論,這個理論成為計算機視覺領域其后十多年的主導思想。圖像理解雖然在理論方法研究上已取得不小的進展,但它本身是一個比較難的研究領域,存在不少困難,因人類本身對自己的視覺過程還了解甚少,因此計算機視覺是一個有待人們進一步探索的新領域。
二、國內(nèi)外研究現(xiàn)狀
目前,國內(nèi)圖像識別的算法研究多是關于數(shù)字、文字、人臉、以及醫(yī)用病理方面的較多,對產(chǎn)品內(nèi)表圖像進行分析識別、分類的還很少。國內(nèi)已研制出了具有先進水平的高精度內(nèi)表檢測系統(tǒng)和裝置,如何對產(chǎn)品零部件的外形,尺寸進行較高精度測量的激光在線檢測系統(tǒng)等,但迄今為止,尚無能對生產(chǎn)出的產(chǎn)品內(nèi)表面進行自動檢測和識別的系統(tǒng)。應用CCD、電子、計算機技術檢測內(nèi)表面的實時自動檢測技術在國內(nèi)正處于剛剛起步的階段,對內(nèi)表面圖像進行分析識別、分類的軟件系統(tǒng)還沒有十分完善,現(xiàn)在的識別算法對圖像中的疵病部分定位不是很準確,對疵病的范圍、大小、方位不能做定量分析,只能作定性分析,精度低,采用的傳統(tǒng)的最小距離等分類器在圖像復雜且類別多時,很難表示和提取特征,進行圖像識別十分困難。
國外關于圖像識別中的圖像分割,特征信號提取,邊緣檢測,紋理識別等的算法已經(jīng)取得了一定的成果,提出了一些新方法,如利用直線分割來識別三維人臉,通過子圖匹配法在相鄰區(qū)域間識別不同目標,用雙值微波仿射不變函數(shù)識別二維形形狀等等,近年來,國外基于圖像識別與分類技術的圖像檢索,人臉識別,字體識別發(fā)展十分迅速。
在國外,為提高自動目標識別能力而開發(fā)的算法現(xiàn)在正被引入許多偵測和成像系統(tǒng)之中,圖像分割、特征信號探測和析取、靜止目標的模式識別等方面已取得了很大進步,這一自動目標識別能力大大減輕了操作人員的工作負擔。如美國正在加緊自動檢測能力與自動目標識別的研究工作,并在硬件能力的基礎上開發(fā)多種用于信號圖像處理的算法和開展各種算法軟件的研制,包括相關法(匹配濾波器技術)、自適應多維處理法、基于模型的方法等。
三、數(shù)字圖像處理的應用
圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應用領域必然涉及到人類生活和工作的方方面面,隨著人類活動范圍的不斷擴大,圖像處理的應用領域也將隨之不斷擴大。
1、航天和航空技術方面的應用
數(shù)字圖像處理技術在航天和航空技術方面的應用,除了JPL對月球、火星照片的處理之外,另一方面的應用是在飛機遙感和衛(wèi)星遙感技術中。現(xiàn)在世界各國都在利用陸地衛(wèi)星所獲取的圖像進行資源調(diào)查,災害檢測,資源勘察,農(nóng)業(yè)規(guī)劃,城市規(guī)劃,我國也陸續(xù)開展了以上諸方面的一些實際應用,并獲得了良好的效果。在氣象預報和對太空其它星球研究方面,數(shù)字圖像處理技術也發(fā)揮了相當大的作用。
2、生物醫(yī)學工程方面的應用
數(shù)字圖像處理在生物醫(yī)學工程方面的應用十分廣泛,而且很有成效。除了一般的CT技術之外,還有一類是對醫(yī)用顯微圖像的處理分析,如紅細胞、白細胞分類,染色體分析,癌細胞識別等,此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學診斷方面都廣泛地應用圖像處理技術。
3、通信工程方面的應用
當前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結合的多媒體通信。具體地講是將電話、電視和計算機以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號的速率達100Mbit/s以上,要將這樣高速率的數(shù)據(jù)實時傳送出去,必須采用編碼技術來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術成敗的關鍵。除了已應用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內(nèi)外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應網(wǎng)絡編碼、小波變換圖像壓縮編碼等。
4、工業(yè)和工程方面的應用
在工業(yè)和工程領域中圖像處理技術有著廣泛的應用,如自動裝配線中檢測零件的質(zhì)量、并對零件進行分類,印刷電路板疵病檢查,彈性力學照片的應力分析,流體力學圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環(huán)境內(nèi)識別工件及物體的形狀和排列狀態(tài),先進的設計和制造技術中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機器人,將會給工農(nóng)業(yè)生產(chǎn)帶來新的激勵,目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。
5、軍事公安方面的應用
在軍事方面圖像處理和識別主要用于導彈的精確末制導,各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統(tǒng),飛機、坦克和軍艦模擬訓練系統(tǒng)等;公安業(yè)務圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復原,以及交通監(jiān)控、事故分析等。目前已投入運行的高速公路不停車自動收費系統(tǒng)中的車輛和車牌的自動識別都是圖像處理技術成功應用的例子。
6、文化藝術方面的應用
目前這類應用有電視畫面的數(shù)字編輯,動畫的制作,電子圖像游戲,紡織工藝品設計,服裝設計與制作,發(fā)型設計,文物資料照片的復制和修復,運動員動作分析和評分等等,現(xiàn)在已逐漸形成一門新的藝術——計算機美術。
參考文獻:
[1]孫即祥 圖像壓縮與投影重建 北京:科學出版社;2005.7:第一章:1~2,63~64.
[2]韓金姝.基于分形的植物形態(tài)模擬與圖像壓縮技術研究:[碩士論文]. 青島:中國海洋大學信號與信息處理專業(yè),2005.