七月 19, 2007

[教學]您知道OFFICE 2003有內建文字辨識功能嗎?

微軟在Microsoft Office 2003中的工具元件中有一個「Microsoft Office Document Imaging」的元件包,它可以直接執行光學字串識別(OCR),下面筆者就為大家介紹利用Office 2003新增的OCR功能從圖片中提取文字的方法。   

第二步 開啟帶有文字的圖片或電子書籍等,找到你希望提取的頁面,按下鍵碟上的列印螢幕鍵(PrintScreen)進行螢幕取圖。   

第三步 開啟Microsoft Office Word 2003 ( 或者 PhotoImpact ),將剛才的螢幕截圖貼上進去;點擊「文件」表單中的「列印」,在安裝Microsoft Office Document Imaging元件後,系統會自動安裝一個名為「Microsoft Office Document Imaging Writer」的列印機。 如所顯示,在「列印機」下拉列表框中選項「Microsoft Office Document Imaging Writer」列印機,其他選項無須額外設定,點擊「確定」按鈕後,設定好文件輸出的路徑及檔案名(預設使用源檔案名),然後很快就可以自動產生一個MDI格式的文件了。 開啟剛才儲存的MDI類型文件,根據你的需要用滑鼠選項文字內容(被選的內容在紅色的框內) , 再按一下「文字辨識」,然後按下滑鼠右鍵 (可以複製貼到記事本也可以),在彈出的快捷表單中選項「將文本傳送到Word」,即可將圖片內容自動轉換為一個新的Word文件,然後你就可以在Word文 檔中隨心所欲地進行編輯了。


阿杰老師說 :

還有一個簡單的方式就是將要辦視的內容掃描後存成 tif 格式圖檔。

記得文字絕對不能歪斜!可以到影像處理軟體中先轉正,並且裁去文字以外的部份。

接著就可以直接由 [開始 > Microsoft Office > Microsoft Office 工具 >Microsoft Office Document Imaging ] 開啟 tif 檔進行辦視。



引用URL

http://blog2.cyhs.tp.edu.tw/teacher/trackback.php?id=1086
回應文章