資料來源 百度 http://zhidao.baidu.com/question/60786165.html

經觀察正常的文本每行一般不會以英文字母和符號結束,所以你只要把所有行尾的英文字母和符號刪除,絕大多數情況都沒問題。

具體辦法推薦用Replace Pioneer,極簡單,步驟如下:
1. 把文本拷貝並存成txt文件
2. 打開Replace Pioneer,按ctrl-o打開這個txt文件
3. 按ctrl-h打開Replace對話框
* 在search for pattern下輸入:
[\x01-\xff]+\n(註:表示英文字母和符號後跟一個回車符)
* 在replace with pattern下輸入\n表示回車
4. 點擊Replace,完成!自己存盤即可。


處理結果示例:(最後一行如果沒有回車,可能刪不掉,手工刪除即可)
=====================
所以就關掉電視也想躺下來睡一 會。
就這樣上來了。
=========================
Replace Pioneer下載:http://www.mind-pioneer.com 方法二 巧除網頁中文字浮水印的兩種方法 參考 睡不著http://big5.cast.org.cn/gate/big5/expl.cpst.net.cn/eoffic/2007_12/196663657.html 網上文字複製粘貼後,發現粘貼的文字除了網頁正文之外,段落語句中還摻雜著很多字符干擾碼。這個是網站給自己文章加的“文字浮水印”。那我們要怎麼保存網頁文字,使其還原為乾淨的文本呢?   去除文字浮水印的方法比較多,我們這裡說說通用的兩種方法:手動在Word裏簡易清除和利用瀏覽器插件來清除。   1.顏色替換巧除“干擾碼”   在選中網頁中的一段預複製內容(含有文字浮水印)後會發現在每行的前、後端都插入有數字和字母構成的“干擾碼”。將它們“Ctrl+V” 粘貼在Word中,但由於不少網頁默認“干擾碼”字符為白色,所以無法看到這些干擾碼。   我們可以將Word更改為“藍底白字”的顯示模式清晰地看到無效字符了,再利用其字體顏色的差異著手一次性清除“干擾碼”。點擊“編輯→替換”,在“搜尋內容”欄下點擊“高級”,在界面最下端的“格式”中選擇“字體”,在“所有字體→字體顏色”下拉列表中選擇白色,確認後退回上一界面,而“替換為”欄無需任何設置,留空即可。點擊“全部替換”按鈕後,就將全部刪除那些“干擾碼”。干擾碼為其他顏色的也可以用類似的方法清除。   2.使用瀏覽器插件遮罩網頁“干擾碼”   使用Maxthon瀏覽器的用戶可以安裝了“清除煩惱”這個插件(可從Maxthon網站下載)直接遮罩網頁上的“文字浮水印”。啟用該插件後,點擊工具欄上的“清除煩惱”向下箭頭按鈕,在彈出功能表中選擇“清除隱藏文字”,而後再按常規方法執行複製粘貼操作即可。   而使用Firefox瀏覽器的用戶也可使用CleanHide遮罩文字浮水印。它的最新版本為CleanHide 1.0.3,適用於Firefox: 1.5~2.0.0.*版本。安裝完畢後,重啟Firefox。而後點擊程式功能表欄“查看→工具欄→定制”,在彈出窗口的列表中將“清除隱藏文字”按鈕拖曳到工具欄上。此後,當遇到含有“文字浮水印”的頁面時點擊該按鈕即可將其清除。
arrow
arrow
    全站熱搜

    凜凜 發表在 痞客邦 留言(0) 人氣()