[原創][分享][下載] 關於電子書,來造福大家了...

瀏覽: 2173
回覆: 2
共1頁
發文數:4
發表時間:2003-04-12 11:43:00
這篇文章不是要寄電子書給大家,而是提供一個方便大家製作電子書的工具.
相信用過okwap電子書製作程式的各位都知道,電子書製作程式有個麻煩的地方
就是每一個小區段內的字元數不能超2048個字元,因此在製作時剪剪貼貼的動作變的
十分煩人.
小弟最近學了sed & awk ,趁著還熟悉時現學現賣,
寫了幾個 html 與 text 檔案的切割程式,能一口氣將一個目錄下的純文字檔切割成
每個檔案字元數均小於2048個字元的小檔案,在製作電子書時只要將切割完的小檔
案中的所有文字貼到電子書製作程式中的小區段中即可,省去調整字數的麻煩動作.
並使用電腦的自動化能力,在幾分鐘內處理幾百個檔案
希望對大家有所幫助...^^

下載地點: http://home.pchome.com.tw/school/fantasy_yang/i66-tools.tar.gz
本程式的執行環境為 FreeBSD, 其它 unix-like 的環境應該也能夠執行
使用Windows 系統的網友可以下載 Cygwin/XFree86
下載地為: http://sources.redhat.com/cygwin/xfree/
請確定執行的環境中安裝了下列程式:
sh, rm, mkdir, test, sed, awk, tar, gzip, gunzip
一般來說,大部分已經安裝好的系統都會包括上述程式

本工具程式為命令列工具,不過很容易使用,不會太複雜 ^^
大部分的工具只要輸入:
===========================================
./桯式名稱 輸入目錄 輸出目錄
===========================================
即可,下面說明各程式用途:
translate.sh : 將輸入目錄中的純文字檔或html檔轉成分割程式可以處理的純文字檔
ex: ./translate.sh input_directory output_directory
split.sh : 將輸入目錄中的純文字檔切割成多個小於2048字元的小檔案
ex: ./translate.sh input_directory output_directory
rm_empty_lines.sh : 將輸入目錄中檔案的空列移除
ex: ./rm_empty_lines.sh input_directory
all_task.sh : 一次處理上述三個動作
ex: ./all_task.sh input_directory output_directory
process_all.sh : 與all_task.sh 做的事相同,但是使用不同方式處理(建議使用all_task.sh )
ex: ./process_all.sh input_directory output_directory
check.sh : 檢查輸入目錄中是否有檔案的字元數超過2048個字元,
沒問題的log檔為 tmp.ok.input_dir
檔案過大記錄在 tmp.log.input_dir 中
ex: ./chech.sh input_directory
tar_dir.sh : 壓縮目錄成為一個壓縮檔案
ex: ./tar_dir.sh input_directory output_file_name
輸出檔案的檔名將變成 output_file_name.tar.gz
===============================================================
ps.由於每一種檔案的結構不同,因此不保證能夠完美的處理所有檔案
可以修改 novels.sed, html.sed, text.sed 等檔案內的樣式比對規則,
來符合每個人的需求(參考歐萊禮出的 sed & awk 一書)
ps2.此組工具程式是小弟第一次發表出來的程式,尚有很多不完美的地方,
請大家多多包涵. 原本還想更進一步寫出直接將純文字檔轉成 *.kbk格式,
但還有一個必須克服的難題,就是必須先找到將檔案轉成unicode的工具程式.
不過除了unicode 轉換的問題外,關於 *.kbk 的檔案格式大致上都弄清楚了,
程式的基本處理也寫好了,有時間再把相關文件及程式放上來,造福
i66 的同好們 *^_^*

陌生的訪客 於 2015-05-25 07:54:03 修改文章內容


商業贊助
發文數:1
發表時間:2025-08-15 10:01:49
發文數:4
發表時間:2003-04-12 21:20:00

陌生的訪客 於 2003-04-12 21:20:00 修改文章內容


共1頁