非常省事,幾秒鐘就搞定了

forcode:經常閱讀英文研究報告的話,應該有很強的pdf翻譯需求,但是chrome擴充套件程式“沉浸式翻譯”的pdf翻譯,體驗並不那麼好,比如字型不夠大,排版擁擠,有時候文字會堆疊,影響閱讀體驗。
因為每天閱讀量過大,眼睛不舒服,腰肌勞損,頸椎也不好,所以我經常站著離螢幕兩三米遠閱讀,有時候用投影機將電腦投影到天花板躺著閱讀,所以足夠大的字型對於閱讀體驗非常重要。
以前我在瀏覽器開啟pdf後,都是直接ctrl+A全選pdf文字,手動複製pdf文字內容,然後貼上儲存到一個txt檔案中。
但是,由於pdf排版格式,複製後的文字存在很多多餘的換行符,將一個完整句子截斷為多個段落,沉浸式翻譯有時候會錯誤分段,翻譯錯誤。
所以,我會在notepad++裡透過四個步驟,手工處理去掉pdf排版導致的不正確換行符:
加工步驟:
1. 用 === 替換句點後面的換行符
2. 用空格替換所有其他換行符
3. 將兩個空格替換為單個空格
4. 將 === 替換為兩個換行符
這樣操作是為了提高翻譯的準確率,手動新增2個換行符,是為了讓沉浸式翻譯按段落讀取內容和進行翻譯,也為了保證閱讀體驗。
處理完之後,儲存為txt檔案,再用chrome瀏覽器開啟,就可以用沉浸式翻譯線上翻譯閱讀了,字型可以隨意放大,並且放大後自動換行,閱讀體驗比沉浸式翻譯好得多。
以前全部手工處理,一篇pdf文件大概需要兩三分鐘,熟練之後其實還好,不算太麻煩,但我把這個技巧教給虎妞時,太覺得太麻煩了。
昨天我在deepseek的輔助下,用html+javascript+css,寫了一個網頁小工具,花了個把小時修改除錯,可以自動化這個過程:從pdf中或其他途徑全選複製文字內容後,貼上到這個網頁的文字框裡,然後點選處理,就會自動執行我預設的四個步驟,將處理好的文字呈現在網頁下方,然後點選沉浸式翻譯,就可以線上翻譯處理好的內容為中文,非常省事,幾秒鐘就搞定了,而且處理後字型足夠大、背景色護眼,閱讀體驗遠超沉浸式翻譯的pdf翻譯。
對於超過10頁的pdf,內容很長,直接線上翻譯可能等待時間過長,我讓deepseek幫我修改程式碼,添加了將處理後文本另存為txt的功能,點選下載txt檔案後,再用chrome開啟,線上翻譯和閱讀體驗會更好……
複製下面的程式碼,然後在一個文字編輯軟體(推薦notepad++)中新建一個html檔案,粘貼後儲存,然後在chrome瀏覽器中開啟該html檔案,就可以使用這個小工具了。


相關文章