最近更新於 2025-12-16
如何執行PDF OCR文字辨識
光學字元辨識(OCR)允許您從影像或掃描的PDF文檔中提取可編輯的文本。使用 Tenorshare PDNob,您可以輕鬆地對 PDF 文檔執行 OCR,使其可搜索和可編輯。本指南提供了一個簡單明了的分步教程,教您如何安裝 OCR 功能並在 PDF 上使用它。
影片指南:如何對 PDF 檔案執行 OCR 文字辨識
1. 什麼是 OCR
OCR(光學字元辨識)是一項技術,可以將掃描的影像或基於影像的 PDF 文檔轉換為可編輯和可搜索的文本。這在處理掃描文檔或數字形式的印刷材料時特別有用。
2. 下載並安裝 OCR
- 在您的計算機上啟動 Tenorshare PDNob 軟體,在主界面上,點擊 「OCR PDF」 按鈕。
- 從您的計算機中選擇所需文檔,然後點擊 「開啟」 將其加載到 PDNob。
- PDNob 會自動偵測檔案是否屬於掃描的 PDF 檔案,並提示 「下載」 按鈕下載 OCR 功能。
3. 如何對 PDF 檔案執行 OCR 文字辨識
- 安裝 OCR 功能後,點擊頂部工具欄上的 「OCR」 按鈕以啟動文字辨識過程。
- 將出現一個設定窗口。根據需要檢查設定,然後點擊 「執行 OCR」 按鈕開始識別過程。
- 文字辨識完成後,您將能夠從 PDF 中 復制並使用 提取的文本。
4. OCR 高級設定 (在 PDNob 2.0 中支援)
PDNob 2.0 全新加入 OCR 進階設定,讓使用者可依實際需求微調文字辨識流程,進一步優化辨識品質。啟用部分進階功能後,文字辨識準確率有機會提升,但相對也可能增加 OCR 處理時間,建議依檔案品質與使用情境進行調整。
請開啟 OCR 設定面板,點選「進階設定」,即可看到各項影像處理與文字檢測選項。相關功能位置請參考下方畫面示意。
了解各項設定的詳細說明如下:
- 自動裁切頁面 – 系統會自動偵測影像中實際包含內容的區域,移除多餘邊緣空白,使頁面更緊湊,有助於提升 OCR 文字辨識的準確度。
- 自動校正頁面傾斜 – 根據頁面中文字的排列方向,自動校正傾斜的掃描頁面,將文字調整為水平狀態,提升整體辨識精度。
- 強化局部對比 – 提升影像局部區域的對比度與清晰度,特別適合處理模糊或對比不足的文字內容,可提高 OCR 辨識成功率。啟用後可能會對原始色彩呈現造成些微影響。
- 移除黑色噪點 – 自動偵測並去除掃描影像中的小型黑色噪點,使頁面畫面更乾淨,提升文字辨識結果的整潔度。
- 移除噪點 – 過濾影像中的白色斑點與其他背景噪點,減少干擾,讓文字邊緣更清晰,有助於提升 OCR 辨識品質。
- 偵測圖片中的文字 – 啟用後,OCR 將同時辨識圖片區域中的文字內容,可擷取嵌入於圖片、截圖或掃描影像中的文字資訊。