最後更新於 2026-04-02
如何執行PDF OCR文字辨識
光學字元辨識(OCR)可讓您從圖片或掃描的 PDF 文件中擷取可編輯文字。透過 Tenorshare PDNob,您可以輕鬆執行 OCR,讓 PDF 變得可搜尋且可編輯。本指南將提供清晰的逐步教學,說明如何安裝 OCR 功能並應用於您的 PDF 檔案。
1. 什麼是 OCR
OCR(光學字元辨識)是一種可將掃描影像或影像型 PDF 轉換為可編輯與可搜尋文字的技術。這對於處理掃描文件或已數位化的紙本資料特別實用。
2. 下載並安裝 OCR
- 在電腦上啟動 Tenorshare PDNob 軟體。
- 在主介面中,點擊 「OCR PDF」 按鈕。
- 從電腦中選擇所需檔案,然後點擊 「開啟」 將其載入至 PDNob。
- 若系統提示,點擊 「下載」 按鈕以安裝 OCR 功能。
3. 如何對 PDF 檔案執行 OCR 文字辨識
- 安裝完成後,點擊上方工具列中的 「OCR」 按鈕以開始 OCR 流程。
- 將會顯示設定視窗,請依需求選擇 OCR 模式:
-
轉換為可編輯文本
將掃描文字轉換為完全可編輯內容。OCR 完成後,您可像一般文件一樣編輯、移動、複製或刪除 PDF 中的文字。 -
轉換為可搜尋文本
保留原始掃描影像,同時讓文字可搜尋與可選取。適合用於查找或索引內容,而不影響版面配置。 - 選擇適合的選項後,點擊 「執行 OCR」 開始文字辨識。
- OCR 完成後,辨識出的文字將可搜尋與複製。若選擇「轉換為可編輯文本」,還可直接在 PDF 中編輯文字。
4. OCR 進階設定(支援於 PDNob 2.0)
PDNob 2.0 新增 OCR 進階設定,讓使用者可最佳化辨識效果。啟用這些選項可提升準確度,但可能稍微降低處理速度。
若要使用這些功能,請開啟 OCR 設定面板並點擊 「進階設定」。您可以啟用或停用各項影像處理與文字偵測功能。請參考下方畫面了解入口位置。
以下為各項設定說明:
- 自動裁切頁面 – 自動偵測內容區域並裁切多餘邊緣,使頁面更精簡並提升 OCR 準確度。
- 自動校正頁面傾斜 – 校正傾斜頁面,使文字水平對齊,提升辨識精準度。
- 增強局部對比度 – 提升局部影像對比,使模糊文字更清晰,可能略微改變原始顏色。
- 去除黑點 – 去除小型黑點雜訊,讓頁面更乾淨並提升 OCR 效果。
- 去除雜點 – 過濾白色雜點與干擾,使文字邊緣更清晰,提升辨識效果。
- 偵測圖片中的文字 – 辨識並擷取圖片區域中的文字,達成更完整的 OCR 結果。