PDF複製亂碼 -- 原因及解決方案
最近有朋友說PDF中的內容複製到Word中就是中文亂碼,讓我幫忙解決一下。
原PDF內容:
複製貼上到Word之後;
以前經常貼上,還沒遇到過這樣的情況,所以就去查了一下。過程中嘗試了很多方式,終於找到了一直能夠解決的,艱辛的過程就不再贅述耽誤大家的時間了,直接簡單粗暴上分析一下原因,咱們就上解決方案;
原因:
使用任何一款PDF應用程式,選單欄,檔案--------屬性--------字型項。我們可以看到檔案內嵌了很多字型。
WORD檔案直接讀取作業系統中的字型的,如果你PDF檔案中內嵌的某個或者某些字型在你的作業系統中沒有,那麼轉換出來的word檔案一般都會出現亂碼。
解決方案:
用ABBYY finereader 軟體對PDF進行OCR識別處理。直接下載軟體,網上很多。安裝,轉Word就可以了,步驟簡單,這裡也不再贅述。最後來個效果圖展示!
總結:
程式設計師是萬能的!
相關推薦
PDF複製亂碼 -- 原因及解決方案
最近有朋友說PDF中的內容複製到Word中就是中文亂碼,讓我幫忙解決一下。 原PDF內容: 複製貼上到Word之後; 以前經常貼上,還沒遇
hive表數據導出到csv亂碼原因及解決方案
exce 默認 concat_ws 分隔符 語句 解決方案 打開 clas 連接 轉載自http://blog.csdn.net/lgdlxc/article/details/42126225 Hive表中的數據使用hive - e"select * from table"
淺談亂碼原因及解決方案
前言 其實作為程式猿來講,中國的程式猿遇到的問題可能會比國外的程式猿遇到的問題多很多。 一個原因是因為各種標準的制定、各種IDE的編寫,都是由老外來完成的,制定出來的東西可能和中國人的習慣不太一樣;還有一個原因就是因為國際編碼的問題,通常,外國人寫的東西無需
內存溢出原因及解決方案
使用 -xmx 遞歸調用 其它 地址 str 啟動 遞歸 對象 參考地址:http://baike.baidu.com/view/79183.htm 內存溢出是指應用系統中存在無法回收的內存或使用的內存過多,最終使得程序運行要用到的內存大於虛擬機能提供的最大內存
codeblocks中文亂碼原因及解決辦法
文字 win 編輯器 odin bsp block set lang -c 原因:(本地化做得不夠好)默認情況下codeblocks編輯器保存源文件是保存為windows本地編碼,就是WINDOWS-936字符集,即GBK;但CB的編輯器在默認編輯的時候是按照UTF-8來解
CentOS7下Tomcat啟動慢的原因及解決方案
按鍵 source 命令 mon 進程 tomcat apps 守護進程 中斷 現象 在一次CentOS 7系統中安裝Tomcat,啟動過程很慢,需要幾分鐘,經過查看日誌,發現耗時在這裏:是session引起的隨機數問題導致的。Tocmat的Session ID是通過S
U-Mail郵件系統詳解郵件收發延遲原因及解決方案
郵件系統 郵件是現代社會辦公最常見、最頻繁的通聯工具,但使用郵件系統時,用戶普遍最關心兩個安全,一個是安全性,郵件會不會被竊密?自己的郵箱賬號會不會被盜取被攻占呢?保存的數據會不會丟失呢?關於這個問題,國內知名通聯解決方案提供商U-Mail資深專家馬工已反復闡述過很多次。 另一個問題是關於郵件傳輸的,郵
sql異常 獲取數據失敗的原因及解決方案
報錯 解決方案 utils har .com SQ 技術 提示 png 使用dbutils工具類時 不能使用char作為sql的字段類型 報錯提示不能轉換 所以替換成別的(一般是String)即可 sql異常 獲取數據失敗的原因及解決方案
RHEL7下Tomcat啟動慢的原因及解決方案
tomcat分析結果 主要原因是生成隨機數的時候卡住了,導致tomcat啟動不了。是否有足夠的熵來用於產生隨機數,可以通過如下命令來查看[root@tomcat tools]# cat /proc/sys/kernel/random/entropy_avail7為了加速/dev/random提供隨機數的速度,
no session 問題出現的原因及解決方案
lte base 請求 屬性 TP IE session關閉 範圍 關聯對象 session是hibernate框架與數據庫交互的對象,與HttpSession是完全不同的東西。session通常與線程綁定,使用完之後就會關閉。 no session問題的出現與延遲加載有關
啟動Hadoop時候datanode沒有啟動的原因及解決方案
data 重要 http tar img 保存 src com sta 有時候我們start-dfs.sh啟動了hadoop但是發現datanode進程不存在 一、原因 當我們使用hadoop namenode -format格式化namenode時,會在namenod
Redis線上間歇性查詢慢原因及解決方案
場景:隨著線上redis所儲存的key值原來越多,偶爾會遇到某個查詢耗時很長的問題,剛開始並沒有重視,隨著業務量的增加和某些人對redis操作不規範,導致線上查詢慢的發生概率越來越高,所以領導就找我和運維的人一起查詢此類問題和解決辦法,也順便記錄一下排查過程。 &nbs
Could not obtain transaction-synchronized Session for current thread原因及解決方案
在開發中,碰到到了Could not obtain transaction-synchronized Session for current thread異常,因此特意記錄下。 一、問題的產生  
java.util.NoSuchElementException錯誤原因及解決方案
1.原因:沒有控制語句導致的迭代器的越界,使得map中的資料無法傳入reduce,從而無法把結果傳入目標檔案中。 在進行Mapreduce例項——WordCount實驗時遇到的錯誤,開始以為是lib包匯入和讀取原始檔格式的問題,後來無論怎麼修改都會報這個錯誤,報錯如下: java.lang.Excepti
kafka資料丟包原因及解決方案
資料丟失是一件非常嚴重的事情事,針對資料丟失的問題我們需要有明確的思路來確定問題所在,針對這段時間的總結,我個人面對kafka 資料丟失問題的解決思路如下: 是否真正的存在資料丟失問題,比如有很多時候可能是其他同事操作了測試環境,所以首先確保資料沒有第三方干擾。 理清你的業務流程,資
java編碼,解碼。亂碼原因及解決辦法
轉換流的編碼,常見的出現亂碼組合 package com.qianfeng.test; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import
win10下用vritualbox下安裝redhat黑屏原因及解決方案
背景,想裝個虛擬機器。 當前環境,win10,聯想小新。 其他版本資訊: vritualbox 5.2.22 映象 rhel-server-7.0-x86_64-dvd.iso 利用vritualbox安裝虛擬機器的過程不贅述,在新建後,選擇iso,然
Python常見warning或error原因及解決方案
一般講warning是不會影響取值的,可忽略,全忽略如下: import warnings warnings.simplefilter('ignore') #warnings.filterwarnings(action='ignore',category=Use
在SSH框架中,多個持久層物件相互引用,從而引發分頁查詢中,查詢所得的持久化物件轉換為JSON字串報錯的原因及解決方案
引言: 使用EasyUI框架的小夥伴們都知道,在使用datagrid(資料表格)時,會傳入如一個URL,用於請求資料表格中的所顯示的資料: <!--建立一個空表格--> <table id="mytable"></table>
java:集合框架(併發修改異常產生的原因及解決方案)
A:案例演示 * 需求:我有一個集合,請問,我想判斷裡面有沒有"world"這個元素,如果有,我就新增一個"javaee"元素,請寫程式碼實現。 public class Demo3_List