最後更新於 2026-04-02

如何執行PDF OCR文字辨識

光學字元辨識(OCR)可讓您從圖片或掃描的 PDF 文件中擷取可編輯文字。透過 Tenorshare PDNob,您可以輕鬆執行 OCR,讓 PDF 變得可搜尋且可編輯。本指南將提供清晰的逐步教學,說明如何安裝 OCR 功能並應用於您的 PDF 檔案。

1. 什麼是 OCR

OCR(光學字元辨識)是一種可將掃描影像或影像型 PDF 轉換為可編輯與可搜尋文字的技術。這對於處理掃描文件或已數位化的紙本資料特別實用。

2. 下載並安裝 OCR

  • 在電腦上啟動 Tenorshare PDNob 軟體。
  • 在主介面中,點擊 「OCR PDF」 按鈕。
    OCR PDF
  • 從電腦中選擇所需檔案,然後點擊 「開啟」 將其載入至 PDNob。
  • 若系統提示,點擊 「下載」 按鈕以安裝 OCR 功能。

3. 如何對 PDF 檔案執行 OCR 文字辨識

  • 安裝完成後,點擊上方工具列中的 「OCR」 按鈕以開始 OCR 流程。
  • 將會顯示設定視窗,請依需求選擇 OCR 模式:
    • 轉換為可編輯文本
      將掃描文字轉換為完全可編輯內容。OCR 完成後,您可像一般文件一樣編輯、移動、複製或刪除 PDF 中的文字。
    • 轉換為可搜尋文本
      保留原始掃描影像,同時讓文字可搜尋與可選取。適合用於查找或索引內容,而不影響版面配置。
  • 選擇適合的選項後,點擊 「執行 OCR」 開始文字辨識。
    OCR PDF 視窗
  • OCR 完成後,辨識出的文字將可搜尋與複製。若選擇「轉換為可編輯文本」,還可直接在 PDF 中編輯文字。

4. OCR 進階設定(支援於 PDNob 2.0)

PDNob 2.0 新增 OCR 進階設定,讓使用者可最佳化辨識效果。啟用這些選項可提升準確度,但可能稍微降低處理速度。

若要使用這些功能,請開啟 OCR 設定面板並點擊 「進階設定」。您可以啟用或停用各項影像處理與文字偵測功能。請參考下方畫面了解入口位置。

OCR 進階設定

以下為各項設定說明:

  • 自動裁切頁面 – 自動偵測內容區域並裁切多餘邊緣,使頁面更精簡並提升 OCR 準確度。
  • 自動校正頁面傾斜 – 校正傾斜頁面,使文字水平對齊,提升辨識精準度。
    自動校正傾斜頁面
  • 增強局部對比度 – 提升局部影像對比,使模糊文字更清晰,可能略微改變原始顏色。
    提升局部對比
  • 去除黑點 – 去除小型黑點雜訊,讓頁面更乾淨並提升 OCR 效果。
    移除黑點雜訊
  • 去除雜點 – 過濾白色雜點與干擾,使文字邊緣更清晰,提升辨識效果。
    移除雜訊
  • 偵測圖片中的文字 – 辨識並擷取圖片區域中的文字,達成更完整的 OCR 結果。
    偵測圖片中的文字