 
- UID
- 3
- 帖子
- 2654
- 積分
- 5592
- 威望
- 5592
- 金錢
- 10453
- 閱讀權限
- 90
- 在線時間
- 289 小時
- 註冊時間
- 2007-9-16
- 最後登錄
- 2015-2-25
|
4#
發表於 2009-6-16 20:11
| 只看該作者
原帖由 唐卫 於 2009-6-16 00:21 發表 
飽蠹閣好怀念这个词呀!!!钱锺书!!!不过我对电子书却有几个困惑,一:不能够直接选取里面的文字是烦!!!用ocr往往要整页扫,好慢!!!二:唯独要用Adobe Acrobat 8 Professional之类软件的ocr,才可以段落上直接选取,但是Adobe Acrobat 8 Profes ... 其實這些電子書都是從網上收集的,也不是我製作的。所以很多技術細節我並不清楚。
現在網上的電子書一般分掃描版和文本版。掃描版實際上是圖片,DJVU就是一種圖片檔;文本版的書則可以被很方便選取、複製、引用,文件也要比同一本書的掃描版小很多,是我們收集電子書時的首選。不過除非是出版社自己發佈的電子書,大部分文本版的電子書是經私人掃描、OCR、校正後在網上發佈的。掃描、OCR都是純體力活,並不很難;校正纔是真正費腦費神的。沒有經過校正的文本書其實還不如掃描版的。
錢老的學術著作《談藝錄》我有所謂“文本精校版”的,底本分別是1993年中華書局和2001年三聯書店《錢鍾書集》,看唐弟要哪個版本,到時候再放上來;《管錐編》見過一些文本版,但大多數沒經過校正,甚至被轉化成簡體版,所以我手上也只是掃描的三聯版。 |
|